rbinom과 sample로 Train, Validation, Test 데이터 선택하기

http://class.coursera.org/dataanalysis-001/ 과목에서 보고 올려봅니다.

rbinom() 으로 10000개 데이터에서 트레이닝셋(1인경우), 테스트셋(0인 경우)를 선택. (앞면이 나올 확률이 70%인 동전을 한번 던지는 실험을 10000회 수행)

rbinom(n=10000, size=1, prob=.7)

sample()로 train, validation, test를 데이터 overlapping 안되게 선택.

sample(c("train", "validation", "test"), 10000, replace=TRUE, prob=c(.7, .15, .15))

역시 골프 잘 치는 사람들은 정말 많군요.

Similar Posts:

Post a Comment

Your email is never published nor shared. Required fields are marked *