지방이의 Data Science Lab

[python] 데이터 셋 쪼개기 유저기준으로 본문

Data Analysis/Python

[python] 데이터 셋 쪼개기 유저기준으로

[지현] 2019. 8. 4. 04:27
1
2
3
4
5
6
7
from sklearn.model_selection import train_test_split
from sklearn.model_selection import GroupShuffleSplit
 
train_inds, test_inds=next(GroupShuffleSplit(test_size=.2,n_splits=2,random_state=7).split(data,groups=data['acc_id']))
train=data.iloc[train_inds]
test=data.iloc[test_inds]
 

 

Comments