지방이의 Data Science Lab

[R] character로 이루어진 두 컬럼 병합시키기 본문

Python Selenium/Web Crawling

[R] character로 이루어진 두 컬럼 병합시키기

[지현] 2019. 3. 15. 23:55

주소, 세부주소 붙여쓰는 방법

 

보여지는 컬럼과 잘린 컬럼을 합쳐서 종합적으로 한 컬럼으로 만들때 사용할 수 있는 코드가 있다. 

보여지는건 깔끔한 것만 가져왔지만, NA가 포함될 경우 쉬운 코드로 짜면 

 

이렇게 가져와 진다. 

 

 

따라서,

1
2
3
4
AGNCINFO$address = sapply(1:nrow(AGNCINFO),function(i) paste(if(is.na(unlist(AGNCINFO$AGNC_ADDR[i]))){""}else{AGNCINFO$AGNC_ADDR[i]}, if(is.na(unlist(AGNCINFO$AGNC_DTLADDR[i]))){""}else{AGNCINFO$AGNC_DTLADDR[i]}, sep = " "))
AGNCINFO$address=gsub(pattern = '"', replacement = ' ', AGNCINFO$address)
AGNCINFO$address=gsub(pattern = "'", replacement = " ", AGNCINFO$address)
AGNCINFO$address =trimws(AGNCINFO$address,"both")
 
 
 
NA값 안뜨도록 글을 가져오는 코드를 생성하고, 붙였을때, "가 포함되어있는 경우, gsub을 이용해서 대체 해주고, 
trimws를 사용해서 앞뒤 whitespace가 있으면 제거해주었다. 
 
 
결과값은 아래처럼 생겼다. 

 

 


 

Comments