Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- 웹매크로 #세잔느
- 웹크롤링
- #크롤링 #웹문서
- 구글 지오코드
- #위도#경도#비정형데이터#크롤링
- 코딩
- 숫자빼고 중복되는 코드동작법
- 파이썬 셀레니움
- 셀레니움
- #비정형#카카오api#api#크롤링
- #비정형 데이터 #네이버 #지도 #크롤링
- 파이썬
- 위도경도
- 카카오APi
- #K-means #Clustering
Archives
- Today
- Total
지방이의 Data Science Lab
[Python] 세상 편한 필터링 .query 본문
기본형태:
df.query('컬럼명 > 1')
|
.query는 내게 세상 편하다.
이게 조금더 머리에 잘 박히는 것 같다.
다만 알아야하는 부분이 몇가지 존재한다.
(1) 컬럼명에 스페이스 바가 있는 경우: ` ` 사용
1
|
no_genres_list = genres.query('`(no genres listed)` == 1').index
|
(2) dtypes에 숫자/string 확인하고 맞춰야 함: string인 경우 " " 사용
1
|
yr1993_list = movies.query('year == "1993"').index
|
(3)리스트로 가지고 있는 경우: @ 사용
1
2
3
4
5
6
7
8
|
ratings.query('movieId in @yr1993_list')['rating'].mean()
output = []
for year in movies.year.unique():
yr_list = movies.query('year == @year').index
avg_ratings = round(ratings.query('movieId in @yr_list')['rating'].mean(), 2)
output.append((year, avg_ratings))
|
'Data Analysis > Python' 카테고리의 다른 글
[Python] 날짜 데이터 파생변수 (0) | 2021.02.24 |
---|---|
[Python] 지수표기 숫자로 변환하는 법 (3.0e-05 -> 0.00003) (0) | 2021.02.18 |
[Python] 엑셀에서처럼 표 내 바꾸기 기능 (0) | 2021.02.09 |
[Python] 한 셀에 들어있는 여러 값을 flatten시키는 법 (get_dummies) (0) | 2021.02.09 |
[Python] 컬럼명 하나만 위치를 재배치하고 싶은 경우 (0) | 2021.02.09 |
Comments