일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 웹크롤링
- #K-means #Clustering
- 파이썬
- #비정형 데이터 #네이버 #지도 #크롤링
- 웹매크로 #세잔느
- 코딩
- 파이썬 셀레니움
- 셀레니움
- 숫자빼고 중복되는 코드동작법
- #위도#경도#비정형데이터#크롤링
- 구글 지오코드
- #크롤링 #웹문서
- #비정형#카카오api#api#크롤링
- 위도경도
- 카카오APi
- Today
- Total
목록Data Analysis (116)
지방이의 Data Science Lab
https://jlim0316.tistory.com/97 smishing인 vocab에서 value값을 순서대로 나열해보자.
데이터는 이런식으로 생겼다. 이제, text컬럼의 자연어를 전처리해보자. 만들어진 아웃풋은 다음과 같다.
완전 기초분석으로 R을 처음 접하는 사람이 배우기에 좋다.
from sklearn.cluster import AgglomerativeClustering %time cluster = AgglomerativeClustering(n_clusters=7, affinity='euclidean', linkage='average') cluster.fit_predict(temp_data) pd.value_counts(pd.Series(cluster.labels_)) 불러오는 중입니다... from sklearn.cluster import KMeans km = KMeans(n_clusters=7) x_names = [x for x in total_activity.columns if x not in ['acc_id']] km.fit(total_activity[x_names]) p..
1 2 3 4 5 def change_day(day_list): change = np.where(day_list == 28, 1, day_list+1) return change
from sklearn.preprocessing import MinMaxScaler scaler = MinMaxScaler(copy=True, feature_range=(0, 1)) temp = label.iloc[:, 1:] scaler.fit_transform(temp.values)from sklearn.preprocessing import MinMaxScaler scaler = MinMaxScaler(copy=True, feature_range=(0, 1)) temp = label.iloc[:, 1:] temp = pd.DataFrame(scaler.fit_transform(temp.values)) temp.columns = label.iloc[:,1:].columns temp=pd.concat([..
test2_act['week'] = np.floor((test2_act['day'] -1)/ 7 +1 ) temp['dayofweek'] = temp['day'] % 7 + 1
def resumetable(df): print(f"Dataset Shape: {df.shape}") summary = pd.DataFrame(df.dtypes,columns=['dtypes']) summary = summary.reset_index() summary['Name'] = summary['index'] summary = summary[['Name','dtypes']] summary['Min'] = df.min().values summary['Max'] = df.max().values summary['Missing'] = df.isnull().sum().values summary['Uniques'] = df.nunique().values return summary train_label = pd..