Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- #비정형#카카오api#api#크롤링
- 파이썬 셀레니움
- 셀레니움
- 웹크롤링
- 파이썬
- 숫자빼고 중복되는 코드동작법
- 웹매크로 #세잔느
- #K-means #Clustering
- 코딩
- #크롤링 #웹문서
- 위도경도
- #위도#경도#비정형데이터#크롤링
- 카카오APi
- 구글 지오코드
- #비정형 데이터 #네이버 #지도 #크롤링
Archives
- Today
- Total
목록Data Analysis/Data Preprocessing (3)
지방이의 Data Science Lab
[R] 데이터 시각화를 위한 데이터 전처리
시작 예를 들어, manufacturer에 보이는 저 audi. audi의 displ (engine displacement in liters)값을 몽땅 합쳐서 보고 싶다! 라고 판단 되면 아래 코드처럼 쓸 수 있습니다. 1 2 library(car);data = mpg aggregate(displ~manufacturer,data,sum) 다시말해, data에서 manufactuerer별로 총 displ합이 어떻게 돼? 하고 명령하는 것입니다. 아~ aggregate은 데이터를 가공할 수 있는 것이며, aggregate(y~x, data, function) 형태로 되어 있고, x별로 y값을 sum, mean, 등등 을 해달라고 부탁 할 수 있구나..! 라고 느끼실 것입니다. 아주 좋은 기능입니다. 여기서 ..
Data Analysis/Data Preprocessing
2020. 6. 29. 21:09
[R] 이상치 or NA 처리
["NA" to NA] 1 data = mutate_all(data, funs(replace(., .=='NA', NA))) [Mean Imputation] 1 data$AGE[data$USERID=="홍길동"] = mean(mean(data$AGE[!is.na(data$AGE)])) [이상치] #1. 0보다 작을 수 없는 경우인데 0보다 작게 나온 데이터 이상치 삭제 1 2 idx = which(S_table$Sales.M.2015
Data Analysis/Data Preprocessing
2019. 12. 28. 17:19