Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- #K-means #Clustering
- 코딩
- 파이썬 셀레니움
- 구글 지오코드
- 웹크롤링
- 숫자빼고 중복되는 코드동작법
- 파이썬
- 카카오APi
- #위도#경도#비정형데이터#크롤링
- #크롤링 #웹문서
- #비정형#카카오api#api#크롤링
- 위도경도
- #비정형 데이터 #네이버 #지도 #크롤링
- 셀레니움
- 웹매크로 #세잔느
Archives
- Today
- Total
지방이의 Data Science Lab
[python] imputation 본문
1
2
3
4
5
6
7
8
9
10
11
|
#1. 0으로 잘못 표기되어 나왔을 경우 mean값으로 대체
pledge = pd.read_csv('train_pledge.csv', engine='python')
non_combat = np.array(pledge['non_combat_play_time'])
non_combat_mean = non_combat[np.nonzero(non_combat)].mean()
pledge['non_combat_play_time'] = np.where(pledge['combat_play_time']>0, pledge['non_combat_play_time'] + non_combat_mean, pledge['non_combat_play_time'])
#2. na라는 모든 값을 -1로 대체
for x in data.columns.values:
data[x]=data[x].fillna(value = -1)
|
'Data Analysis > Python' 카테고리의 다른 글
[python] string 을 list로 변환 (0) | 2020.02.13 |
---|---|
[python] x, y 쪼개기, train, test 쪼개기 (1) | 2020.02.09 |
[python] file 속 데이터들을 전부 가져오는 방법 glob.glob (0) | 2020.02.08 |
[python] one row to multiple rows (0) | 2020.02.07 |
[python] 원하는 string포함한 pd.dataframe 필터링 (0) | 2020.02.05 |
Comments