Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- #비정형#카카오api#api#크롤링
- #K-means #Clustering
- 카카오APi
- #위도#경도#비정형데이터#크롤링
- 셀레니움
- 웹매크로 #세잔느
- 위도경도
- 파이썬
- 코딩
- #비정형 데이터 #네이버 #지도 #크롤링
- #크롤링 #웹문서
- 숫자빼고 중복되는 코드동작법
- 파이썬 셀레니움
- 구글 지오코드
- 웹크롤링
Archives
- Today
- Total
지방이의 Data Science Lab
[R] 5-fold CV 코드 직접 생성 (숫자빼고 반복되는 코드일 경우, 깨알 팁) 본문
일반적으로 사용하는 caret에서 성능평가가 아닌,
즉, caret에 포함되지 않은 모델을 만들때 유용하다.
train/test set을 각각 5세트로 만들어서 confusion matrix를 직접만들어서 성능을 평가해야하는 경우 사용할 수 있다.
나의 경우 베이지안 네트워크 모델을 사용하기 위해 사용했다.
1
2
3
4
5
6
7
8
9
10
11
12
|
library(forecast)
flds=createFolds(data$target,k=5,list=T,returnTrain = F)
c=c(); f=c()
for(i in 1: 5){
want_assign = data[-flds[[i]],]
name = paste0('train', i, sep='', collapse = ',')
c = c(c, assign(b, a))
want_assign = data[flds[[i]],]
name = paste0('test', i, sep='', collapse = ',')
f = c(f, assign(e, d))}
|
cs |
위 코드에서 assign함수를 사용해줬다.
train1 = data[-flds[[1]],]
test1 = data[flds[[1]],]
train2 = data[-flds[[2]],]
test2 = data[flds[[2]],]
.
.
.
train5 = data[-flds[[5]],]
test5 = data[flds[[5]],]
이렇게 여러번 같은 코드 나열하기 싫어서 한번에 돌리려고 사용한 것이다.
(* 숫자빼고 비슷하게 동작되는 dataset을 계속 만들때 지치지않고 만드려면 아래코드가 유용하다:)
더보기
위의 코드를 이해한 후, 아래코드를 이해하면 조금 더 편리함이 커진다.
get함수를 이해해보자.
|
'Data Analysis > 깨R지식' 카테고리의 다른 글
[R] plot: 두 라인 사이 색칠 법 (0) | 2020.04.22 |
---|---|
[R] 코드 동작시간 잴때 tictoc사용 (1) | 2020.01.05 |
[R] geom_line (geom_path: Each group consists of only one observation. ) (0) | 2020.01.02 |
[R] 조건에 맞는 특정 데이터 추출 (0) | 2019.12.30 |
[R] x축 날짜 데이터 시각화 (0) | 2019.12.28 |
Comments