| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | ||||||
| 2 | 3 | 4 | 5 | 6 | 7 | 8 |
| 9 | 10 | 11 | 12 | 13 | 14 | 15 |
| 16 | 17 | 18 | 19 | 20 | 21 | 22 |
| 23 | 24 | 25 | 26 | 27 | 28 | 29 |
| 30 |
- 위도경도
- #위도#경도#비정형데이터#크롤링
- 코딩
- 웹매크로 #세잔느
- #크롤링 #웹문서
- 구글 지오코드
- 파이썬 셀레니움
- #비정형 데이터 #네이버 #지도 #크롤링
- 셀레니움
- 숫자빼고 중복되는 코드동작법
- 카카오APi
- 파이썬
- 웹크롤링
- #K-means #Clustering
- #비정형#카카오api#api#크롤링
- Today
- Total
지방이의 Data Science Lab
표 범위 전체 선택해주고 ctrl+t 로 파워쿼리에서 쓸 수 있는 형태로 변환해준 후 데이터 탭 혹은 파워쿼리 탭에서 표에서를 클릭한다. 그리고 열추가> 인덱스 열 > 0부터 클릭한다 인덱스 열을 추가한 후, 열추가 탭> 표준> 모듈로 를 클릭한다. 반복되는 행의 갯수를 세어주면 된다. 예시에서는 4행이 반복되고 있으니 모듈로에 4를 적어준다. 다음은 변환 탭> 피벗 열을 클릭한다. 피벗 열에서 하고 싶은 걸 대략적인 사진으로 보여주자면 아래와 같다. 열1의 값들을 값열로 가져올 것이다. 그런데 이때 집계안함으로 가져와야 값을 변환없이 가져올 수 있다. 저 화살표로 시뮬레이션 하며 보여준 값은 아래 사진과 같은 거다. 0,1,2,3,이라는 열이름으로 놓고 값열을 열1의 내용을 집어 넣어준 것이다. 이제 ..
두 열의 중복된 행/중복되지 않은 행을 보고 싶다라면 ctrl을 눌러서 보고싶은 열 전체 선택해준다. 그 후 그룹화라는 버튼 눌러주고 변경할 것 없이 확인 버튼을 누르면 아래사진처럼 뜬다. 필터걸고 하고싶은대로 하고 닫기 및 로드를 누르면 된다. 중복된 열 중복되지 않은 열로 가져오는 것보다 갯수 그대로 가져온다음에 밖에서 필터링 하는 것도 괜찮다고 생각한다. 아래는 정보전달일 뿐 그닥 중요하지 않다. 따로따로 테이블을 불러오면 중복된 열을 추출하고 싶을 때 필터링으로 가져오면 파워쿼리의 장점인 자동화가 안된다. 따라서 중복된 열 추출은 열추가 탭> 조건 열 에서 아래처럼 설정해주면 된다. 이후 필터에서 True선택하고 사용자지정 열은 제거해준다.
내 엑셀엔 파워쿼리가 없는데? 라면 간단하게도 그냥 설치하면 된다. 파일 탭> 계정 탭> 제품정보 확인하면 자신의 제품 구독 정보를 확인할 수 있다. 회사 컴퓨터인 경우 대부분 Microsoft Office 365 ProPlus여서 여타의 설정없이 따라할 수 있을 것이다. 2016 버전 이후부터는 엑셀에 이미 포함이된 게 디폴트로 나왔고, 2010과 2013버전을 쓰는 사람은 따로 추가기능을 설치해야 사용할 수 있다. 대부분 가지고 있는 엑셀이 Microsoft Office Standard 2013정도일 것이다. 이미 추가기능으로 내장되어 있지만 이걸 모르고 아, 내 엑셀로는 따라할 수 없나보다라고 생각하지 말고 설정을 변경해보자. 설정을 변경하기 전 데이터 탭으로 가보면 아래 사진 처럼 생겼다. 1. ..
아래와 같이 지저분하게 되어있는 데이터를 정형화시켜야 분석을 시작할 수 있다. 특히나 공공데이터가 이런 식으로 가공되어 나오는 경우가 많은데 분석하고자 할때 이런 걸 잘 정형화 시키는게 중요하다. 이렇게 열병합까지 되어 있는 경우엔 행/열 변환을 요긴하게 사용해서 형식을 변환시켜야 한다. 아래 설명을 따라하면 다음과 같은 형식으로 변경할 수 있다. 시작하기 앞서 행/열 변환을 한번 해주고자 한다. 값을 채워주고 싶기 때문이다. 이제 필요없는 열1, 열2 이부분을 날리고 오른쪽 열처럼 변경하는 방법을 알아보자. 이제 열 아래부분은 같은 이름으로 채워주는 방법을 알아보자. 우클릭 하고 채우기 누른후에 아래로를 클릭한다. 열 병합을 해주고자 한다. 열을 이동시키려면 커서로 잡아서 끌어도 되고 우클릭해서 이동 ..
아래 사진처럼 반정형화되어 있는 데이터를 정형화시켜보자. 이거도 감동이다. 코드를 찾아서 하거나 노거나 하거나 둘 중 하나였지만 이제는 다른 방법을 알았다. 엑셀 파워쿼리를 쓰는게 조금 더 직관적이고 간단한 방법이라 생각한다. 특히나 파워쿼리로 가지고 있으면 아래 행을 추가만 해주어도 알아서 그 형식 그대로 변형을 해준다. 테이블 선택하고 ctrl+t로 표상태 만들어 준 뒤 데이터 탭에서 테이블에서를 클릭한다. 그 후 안바꿔도 되는 첫 열을 선택한 후 우클릭해서 다른 열 피벗 해제를 누른다. 이후 두번째 열을 나눠주고자 한다. 우클릭 후 열분할> 구분 기호 기준을 누른다. 이후 약간의 조정이 필요해보이는데 이는 피벗으로 다시 만들어주면 된다. 변환 탭으로 가서 피벗 열을 클릭한다. 특성.2 열에서 물고 ..