'Data Analysis/Python' 카테고리의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2026/03 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록Data Analysis/Python (38)

지방이의 Data Science Lab

[python] np.array를 pd로 다시 맵핑하기

1 2 3 4 5 6 7 8 9 10 my_2darray = np.array([[1, 2], [3,4], [5, 6]]) my_2darray my_dict = {"a": ['1', '2', '3'], "b": ['4', '5', '6']} df_temp = pd.DataFrame(my_dict, index = pd.date_range('2019-10-14', periods=3)) df_temp print(df_temp.shape) pd.DataFrame(my_2darray.reshape(df_temp.shape), columns=df_temp.columns, index=df_temp.index)

Data Analysis/Python 2021. 7. 28. 18:24

[python] map함수

1 2 3 4 5 6 7 my_dict = {"a": ['갑', '을'], "b": ['1', '2'], "c": ['2', '4']} df_temp = pd.DataFrame(my_dict) pd.DataFrame(my_dict) temp = {'갑': 'Master1', '을': 'Master2'} df_temp['a1'] = df_temp['a'].map(temp) df_temp

Data Analysis/Python 2021. 7. 28. 18:04

[python] agg 함수

1 2 3 4 5 6 my_dict = {"a": ['갑', '을', '을', '갑'], "b": ['1', '2', '2', '4']} df_temp = pd.DataFrame(my_dict) pd.DataFrame(my_dict) df_temp= df_temp.groupby(['a']).agg(sum_val = ('b',np.sum)).reset_index() df_temp

Data Analysis/Python 2021. 7. 28. 18:03

[Python] 날짜 데이터 파생변수

1 2 3 4 5 import pandas as pd data = pd.read_csv('temp.csv', parse_dates=['log_time'], infer_datetime_format = True) data['year'], data['month'], data['quarter'] = \ (data['log_time'].dt.year, data['log_time'].dt.month, data['log_time'].dt.quarter)

Data Analysis/Python 2021. 2. 24. 23:20

[Python] 지수표기 숫자로 변환하는 법 (3.0e-05 -> 0.00003)

1 2 3 4 t = 3.000e-05 t = '{:.9f}'.format(t) print(t) # 0.000030000 t = float(t)는 안되는 이유: 이미 3.000e-05가 float이기 때문이다. np나 pd에서 지수표기를 숫자로 지정하는 방법은 아래를 사용하면 된다. 1 2 3 4 5 np.set_printoptions(precision=6, suppress=True) pd.options.display.float_format = '{:.5f}'.format pd.reset_option('display.float_format') Colored by Color Scripter

Data Analysis/Python 2021. 2. 18. 18:38

[Python] 세상 편한 필터링 .query

기본형태: df.query('컬럼명 > 1') .query는 내게 세상 편하다. 이게 조금더 머리에 잘 박히는 것 같다. 다만 알아야하는 부분이 몇가지 존재한다. (1) 컬럼명에 스페이스 바가 있는 경우: ` ` 사용 1 no_genres_list = genres.query('`(no genres listed)` == 1').index (2) dtypes에 숫자/string 확인하고 맞춰야 함: string인 경우 " " 사용 1 yr1993_list = movies.query('year == "1993"').index (3)리스트로 가지고 있는 경우: @ 사용 1 2 3 4 5 6 7 8 ratings.query('movieId in @yr1993_list')['rating'].mean() output..

Data Analysis/Python 2021. 2. 9. 19:27

[Python] 엑셀에서처럼 표 내 바꾸기 기능

1 2 3 4 5 6 7 movies1['year'] = movies1['title'].str.extract('(\(\d\d\d\d\))') movies1.isna().sum() #에러 유무 확인 movies1.dropna(axis=0, inplace=True) movies1['year'] = movies1['year'].apply(lambda x: str(x).replace('(','').replace(')','')) movies1.head()

Data Analysis/Python 2021. 2. 9. 19:19

[Python] 한 셀에 들어있는 여러 값을 flatten시키는 법 (get_dummies)

1 genres = movies['genres'].str.get_dummies(sep = '|')

Data Analysis/Python 2021. 2. 9. 18:45

Prev 1 2 3 4 5 Next

목록Data Analysis/Python (38)

지방이의 Data Science Lab

티스토리툴바