일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- #크롤링 #웹문서
- 코딩
- 파이썬 셀레니움
- 파이썬
- 구글 지오코드
- #K-means #Clustering
- 위도경도
- 웹매크로 #세잔느
- #비정형 데이터 #네이버 #지도 #크롤링
- #위도#경도#비정형데이터#크롤링
- 카카오APi
- 숫자빼고 중복되는 코드동작법
- #비정형#카카오api#api#크롤링
- 웹크롤링
- 셀레니움
- Today
- Total
지방이의 Data Science Lab
index가 같은 이름이라면 df가 달라도 join 가능하다. 1 2 본데이터 = 본데이터.assign(새로운컬럼명 = lambda x: 가져오고싶은df['가져올df내 컬럼명'].loc[x.index]) genres = genres.assign(title = lambda x: movies['title'].loc[x.index])
1 2 3 movies = pd.read_csv('data/movies.csv', encoding='utf-8') genres = [x.split('|') for x in movies['genres'].values] genres = list(set(sum(genres, [])))
옵션 추가기능으로 개발 도구 탭을 생성한 후, Excel 추가 기능을 누른다. 분석도구 부분을 체크 표시해준다. 이게 통계 분석 하는 법이다. 그러면 데이터 탭에 맨 우측에 데이터 분석이라는 메뉴가 생긴다.
이게 진짜 엑셀 내부에서 데이터 전처리를 하는 법 배우는 이유라고 생각한다. 간편하다. 시각적으로 보여주자면 좋은 이유는 다음과 같다. [Excel] 데이터 전처리: 데이터 조인(1)에서 공부한 대로 따라하면 아래 왼쪽 사진처럼 나오게 된다. [Excel] 데이터 전처리: 데이터 조인(2)에서 오른쪽 사진처럼 나오게 하는 방법을 알아보고자 한다. 왼쪽 위 사진처럼 조인하는 세부 방법은 아래 사이트에서 확인할 수 있다. jlim0316.tistory.com/280?category=963501 위사이트에서 병합하는 법까지 따라해서 병합을 완료하고 확인하기까지 누르면 아래사진처럼 뜬다. 그럼 이제 한 행에 unique한 element를 전부 넣는 방법을 사용해서 응용해보고자 한다. jlim0316.tistor..
데이터 조인은 여러 방법이 있다. sql에서 혹은 python이나 r에서 데이터 조인 그리고 지금처럼 엑셀에서 조인이 있다. 엑셀에서 조인하면 장점은 제품을 여러번 산 경우 혹은 어딘가 방문한 경우이다. 예를 들어 내가 화장품을 열개를 살 수 있는데 열개를 산 기록을 모두 가져오고 싶은경우 조인할 때 distinct가 다르다고 에러나는 경우가 많은데, 엑셀은 똑똑하게 가져온다. 1. 일단 연결하기로 데이터를 만들어줘야한다. 아래 사진처럼 연결전용입니다. 라는 말이 나오게까지 일단 만들어야 한다. 이렇게 만드는 방법은 jlim0316.tistory.com/280 [Excel] 데이터 전처리: 데이터 조인 연결하기로 데이터를 만들어줘야한다. 1. 표로 생성하기 파워쿼리를 사용하기 위해 두개의 테이블 모두 C..