Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
Tags
- 셀레니움
- 파이썬
- 숫자빼고 중복되는 코드동작법
- 코딩
- 웹크롤링
- #위도#경도#비정형데이터#크롤링
- #크롤링 #웹문서
- 웹매크로 #세잔느
- 구글 지오코드
- #K-means #Clustering
- #비정형 데이터 #네이버 #지도 #크롤링
- 파이썬 셀레니움
- 위도경도
- #비정형#카카오api#api#크롤링
- 카카오APi
Archives
- Today
- Total
지방이의 Data Science Lab
[R] 특정 고객 데이터 추출 본문
[특정 고객 추출]
# 2개- 11개만 산 고객들만 보고 싶을때
tab=table(data$COMCSNO)
tab=sort(tab,decreasing=T)
condition=tab[tab>2&tab<11]
condition=data%>%filter(COMCSNO %in% names(condition))
[너무 큰 데이터일 경우 샘플링해서 사이즈를 줄이고 특징잡을때]
#2개-11개만 꺼냈는데도 데이터가 너무 클 경우, 고객으로 유니크걸고 한번 더 샘플링
subject_ids = unique(condition$COMCSNO)
# Sample from the subject ids
sample_subject_ids = sample(subject_ids, round(length(subject_ids)/100,0)) #현재고객 533
# Get the rows for the sampled subjects
aa=as.data.table(aa)
sample_df = subset(condition, COMCSNO %in% sample_subject_ids) %>% as.data.table
'Data Analysis > 깨R지식' 카테고리의 다른 글
[R] 계절컬럼 파생변수 추가 (0) | 2019.12.27 |
---|---|
[R] 평균값으로 imputation하는 방법 (0) | 2019.07.25 |
R: package 직접 설치 (0) | 2019.05.02 |
[R] 빅데이터 dcast 램문제를 해결할 수 있는 코딩 (0) | 2019.04.07 |
[R] 범주형 숫자형 대용량 데이터 처리 방법 (0) | 2019.04.04 |
Comments