Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- #위도#경도#비정형데이터#크롤링
- #K-means #Clustering
- 웹매크로 #세잔느
- 파이썬 셀레니움
- 코딩
- 파이썬
- 구글 지오코드
- #비정형 데이터 #네이버 #지도 #크롤링
- #크롤링 #웹문서
- 셀레니움
- #비정형#카카오api#api#크롤링
- 웹크롤링
- 카카오APi
- 위도경도
- 숫자빼고 중복되는 코드동작법
Archives
- Today
- Total
지방이의 Data Science Lab
[R] character로 이루어진 두 컬럼 병합시키기 본문
주소, 세부주소 붙여쓰는 방법
보여지는 컬럼과 잘린 컬럼을 합쳐서 종합적으로 한 컬럼으로 만들때 사용할 수 있는 코드가 있다.
보여지는건 깔끔한 것만 가져왔지만, NA가 포함될 경우 쉬운 코드로 짜면
이렇게 가져와 진다.
따라서,
1
2
3
4
|
AGNCINFO$address = sapply(1:nrow(AGNCINFO),function(i) paste(if(is.na(unlist(AGNCINFO$AGNC_ADDR[i]))){""}else{AGNCINFO$AGNC_ADDR[i]}, if(is.na(unlist(AGNCINFO$AGNC_DTLADDR[i]))){""}else{AGNCINFO$AGNC_DTLADDR[i]}, sep = " "))
AGNCINFO$address=gsub(pattern = '"', replacement = ' ', AGNCINFO$address)
AGNCINFO$address=gsub(pattern = "'", replacement = " ", AGNCINFO$address)
AGNCINFO$address =trimws(AGNCINFO$address,"both")
|
NA값 안뜨도록 글을 가져오는 코드를 생성하고, 붙였을때, "가 포함되어있는 경우, gsub을 이용해서 대체 해주고,
trimws를 사용해서 앞뒤 whitespace가 있으면 제거해주었다.
결과값은 아래처럼 생겼다.
'Python Selenium > Web Crawling' 카테고리의 다른 글
[Python] 주어진 주소를 카카오 API로 위도, 경도를 가져오는 방법 (0) | 2019.03.16 |
---|---|
[R] 영어와 한글이 섞인 컬럼에서 한글인 행만 추출하는 방법 (0) | 2019.03.16 |
[Python] 네이버맵: json을 이용한 매장정보 크롤링 (8) | 2019.03.07 |
[Python] 카카오 api를 이용한 크롤링(5): 카카오맵 주소 가져오기 코드 (0) | 2019.03.07 |
Python: 셀레니움으로 카카오맵 크롤링하기 (2) not clickable 문제 해결법 (0) | 2019.03.06 |
Comments