http://class.coursera.org/dataanalysis-001/ 과목에서 보고 올려봅니다.
rbinom() 으로 10000개 데이터에서 트레이닝셋(1인경우), 테스트셋(0인 경우)를 선택. (앞면이 나올 확률이 70%인 동전을 한번 던지는 실험을 10000회 수행)
rbinom(n=10000, size=1, prob=.7)
sample()로 train, validation, test를 데이터 overlapping 안되게 선택.
sample(c("train", "validation", "test"), 10000, replace=TRUE, prob=c(.7, .15, .15))
역시 골프 잘 치는 사람들은 정말 많군요.