'Data Analysis' 카테고리의 글 목록 (12 Page)

Notice

Recent Posts

Recent Comments

Link

« 2025/02 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

Tags more

Archives

Today

Total

관리 메뉴

목록Data Analysis (116)

지방이의 Data Science Lab

[python] nlp 자연어 처리2 (dictionary.values값을 순서대로 정렬하는 방법)

https://jlim0316.tistory.com/97 smishing인 vocab에서 value값을 순서대로 나열해보자.

Data Analysis/Natural language processing 2019. 12. 6. 17:17

[python] nlp 자연어 처리1 (자연어 기본 전처리)

데이터는 이런식으로 생겼다. 이제, text컬럼의 자연어를 전처리해보자. 만들어진 아웃풋은 다음과 같다.

Data Analysis/Natural language processing 2019. 12. 6. 17:10

R: Preprocessing

완전 기초분석으로 R을 처음 접하는 사람이 배우기에 좋다.

Data Analysis/Data Preprocessing 2019. 11. 4. 18:13

[python] kmeans, agglomerative clustering

from sklearn.cluster import AgglomerativeClustering %time cluster = AgglomerativeClustering(n_clusters=7, affinity='euclidean', linkage='average') cluster.fit_predict(temp_data) pd.value_counts(pd.Series(cluster.labels_)) 불러오는 중입니다... from sklearn.cluster import KMeans km = KMeans(n_clusters=7) x_names = [x for x in total_activity.columns if x not in ['acc_id']] km.fit(total_activity[x_names]) p..

Data Analysis/Python 2019. 9. 3. 01:46

[python] 데이하루씩 미루기

1 2 3 4 5 def change_day(day_list): change = np.where(day_list == 28, 1, day_list+1) return change

Data Analysis/Python 2019. 8. 30. 15:46

[python] minmaxscaler

from sklearn.preprocessing import MinMaxScaler scaler = MinMaxScaler(copy=True, feature_range=(0, 1)) temp = label.iloc[:, 1:] scaler.fit_transform(temp.values)from sklearn.preprocessing import MinMaxScaler scaler = MinMaxScaler(copy=True, feature_range=(0, 1)) temp = label.iloc[:, 1:] temp = pd.DataFrame(scaler.fit_transform(temp.values)) temp.columns = label.iloc[:,1:].columns temp=pd.concat([..

Data Analysis/Python 2019. 8. 28. 20:04

[python] 주별, 요일별로 변경

test2_act['week'] = np.floor((test2_act['day'] -1)/ 7 +1 ) temp['dayofweek'] = temp['day'] % 7 + 1

Data Analysis/Python 2019. 8. 28. 14:47

[python] eda

def resumetable(df): print(f"Dataset Shape: {df.shape}") summary = pd.DataFrame(df.dtypes,columns=['dtypes']) summary = summary.reset_index() summary['Name'] = summary['index'] summary = summary[['Name','dtypes']] summary['Min'] = df.min().values summary['Max'] = df.max().values summary['Missing'] = df.isnull().sum().values summary['Uniques'] = df.nunique().values return summary train_label = pd..

Data Analysis/Python 2019. 8. 27. 17:02

Prev 1 ··· 9 10 11 12 13 14 15 Next

목록Data Analysis (116)

지방이의 Data Science Lab

티스토리툴바