일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 카카오APi
- 구글 지오코드
- 위도경도
- 파이썬 셀레니움
- 코딩
- #비정형#카카오api#api#크롤링
- #위도#경도#비정형데이터#크롤링
- #비정형 데이터 #네이버 #지도 #크롤링
- 숫자빼고 중복되는 코드동작법
- 웹크롤링
- 셀레니움
- 파이썬
- #크롤링 #웹문서
- #K-means #Clustering
- 웹매크로 #세잔느
- Today
- Total
목록All (143)
지방이의 Data Science Lab

유니크 값을 한 셀에 ,(컴마)를 이용해서 표현하는 방법은 뭐가 있을까? (이거 코드로 쓸 줄 몰라서 고생했었는데 엑셀에선 되게 간단하다.) 이 페이지를 따라해서 만들고 싶은 열은 아래와 같다. 피벗 테이블은 유니크한 요소들을 한 셀에 넣지 못한다는 단점이 있다. 피벗 테이블의 단점을 보완한게 바로 이 글이다. 피벗 테이블은 아래 사진처럼밖에 표현할 수 없다. 파워쿼리를 이용하면 이 점을 해결할 수 있다. 성별, 발신지_구, 발신지_동, 사고 발생 건수 열을 선택한 후 홈 탭> 열추가 클릭 후 아래처럼 써준다. 특히나 집계추가해서 All 모든행을 꼭 써줘야 한다. All이라는 열을 추가해 주었는데 그 열을 선택한 후 열추가> 사용자 지정 열을 클릭한다. 그후 아래와 같이 코드를 입력해준다. 1 Text...

예전엔 엑셀 내에서 파일을 통합하는 법을 모르다보니 간단한건 귀찮아서 노가다로 붙일 때도 있었다. 그래도 이런 과정이 있었기에 다양한 방법을 고민하는 시간이었다고 생각하려고 한다. 엑셀의 데이터 탭을 1) 잘 사용하면 간단하게 파일을 통합할 수 있고 2) 모르면 노다가 혹은 코드로 타이핑하고 있을 것이다. jlim0316.tistory.com/18 [R] 1/1~12/31까지 존재하는 파일들을 한번에 불러와서 합치기 지방이의 데이터 사이언스 [R] 1/1~12/31까지 존재하는 파일들을 한번에 불러와서 합치기 본문 Data Analysis/깨R지식 [R] 1/1~12/31까지 존재하는 파일들을 한번에 불러와서 합치기 jlim [지현] 2019. 3. 18. 00: jlim0316.tistory.com j..

결과물부터 보여주자면 아래와 같다. 1. 공공포털 로그인 및 활용 신청 www.data.go.kr/data/15004449/openapi.do 공공데이터 포털 국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Datase www.data.go.kr 공공데이터를 사용하려면 로그인한 후 포털에서 활용신청을 클릭한다. 활용신청이 완료되고 신청 승인을 위해 1-2시간 기다리라고 하는 경우가 있다. 이후 승인이 됐는지 확인하고 싶은 경우엔 웹 페이지 내 인증키를 넣고 미리보기를 클릭해서 열리면 승인이 된거다. 신청 후 마이페이지에 보면 신청완료된게 보이고 이후 필요한건 두가지다. 1..

웹데이터 가져오는 기본 방법은 아래와 같다. jlim0316.tistory.com/259 1. 네이버 국내증시 기관순매수 웹데이터 가져오기 네이버에서 "국내증시"를 검색하고 아래 사이트에서 기관 순매수 데이터를 엑셀에 담아보고자 한다. 이때, 내가 새로고침을 굳이 하지 않더라도 일정 간격을 가지고 알아서 자동 업데이트 되도록 만들고자 한다. 사이트 긁어서 엑셀 내 데이터> 데이터가져오기> 기타원본에서> 웹> 사이트 입력> 로드 2. 모듈 삽입 데이터를 로드해주고 나서 vba프로젝트에 모듈을 만들어준다. 비주얼 베이직 에디터를 열기 위해선 1) 파일>옵션>리본 사용자지정> 개발도구 체크 혹은 2) Alt + F11 을 눌러준다. 3. 코드 삽입 1 2 3 4 5 6 7 8 9 10 11 12 13 Publ..

아래 사이트처럼 표를 엑셀에 긁어오고 싶을 때 쓸 수 있는 방법이다. (드래그해서 컨트롤c/v말고) 긁어서 가져오는 방법 말고 웹데이터를 가져오는 다른 방법을 알아보고자 한다. 웹이랑 연결되기 때문에 이 방식대로 웹데이터로 가져온다면 표가 유연하게 변경이 된다는 특징을 갖는다. 1. 데이터 탭> 데이터 가져오기> 웹 사이트 주소 입력 2. 데이터 변환 클릭 (아무것도 테이블에서 바꿀게 업다면 그대로 로드 눌러도 좋다.) 3. 한 행에 두값이 들어있고 이를 옆에 열을 추가해줘서 밀어넣기 해보는 방법을 소개하고자 한다. 홈> 열분할> 특수문자 삽입에 있는 줄바꿈으로 선택 (이렇게 줄바꿈을 기준으로 데이터가 담긴 경우) 4. 첫 행을 머리글로 사용 첫행을 머리글로 설정해서 날릴 수도 있다. 5. 데이터 구조 ..
1 2 3 4 5 6 7 8 9 def add(a, b): return a + b print(add(1, 2)) # 3 #------------------------- add_val = lambda a,b : a+b print(add_val(1,2)) # 3 간단한 걸 수행할 수록 람다가 사용자 정의함수인 def보다 수월하다. def에서는 return이 있으면 프린트를 찍어야했는데 이 방법과 같다. 리스트 내에서 def는 사용 불가하지만 lambda의 경우 가능하다. 그렇구나 예전엔 그냥 그런가보다 하고 갖다 응용해서 썼는데.. 또한, 람다를 이용해 함수 두개를 리스트에 담는 것도 가능하다. 1 2 3 4 5 6 myList = [lambda a, b: a + b, lambda a, b: a * b] p..
* kwargs(key words arguments): 딕셔너리형태로 여러개의 값이 들어오는 것을 처리할 수 있는 매개변수 1 2 3 4 5 6 7 def your_name(**kwargs): for k in kwargs.keys(): if k == 'name': # print("당신의 이름은" + kwargs[k]) print(f"당신의 이름은 {kwargs[k]}.") your_name(name= "지방이") # 당신의 이름은 지방이.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 def sum(a, b): print(f"{a}와 {b}의 합은 {a+b}입니다.") sum(1, 3) print(sum(1,3)) # None def sum(a, b): print(f"{a}와 {b}의 합은 {a+b}입니다.") return a+b sum(1, 3) # 1와 3의 합은 4입니다. print(sum(1,3)) # 4 함수를 만들면서 주의해야 할 사항은 내가 만든 함수에 return을 적지 않을 시 print를 하면 None이라 뜬다는 것. 1 2 3 4 5 6 7 a = [1, 2, 3] a.append(4) print(a) # [1, 2, 3, 4] print(a.append(4)) # None .append라는 매소드도 ..