Test set의 크기는 얼마이어야 할까

Udacity deep learning 강의 중에 나온 제안.

차이는 30개 정도를 보면 유의하다고 말할 수 있다. 보통 소수점이하 첫번째자리까지 classifier performance 차이를 검출하고자하므로 0.1% 차이가 30개 test data를 바꾸게 해야함.

따라서 적절한 테스트 데이터 크기는 30,000이다. 왜냐하면 30,000 × 0.001 = 30이므로.

물론 이는 통계적으로 엄밀한 접근은 아니긴합니다.

Similar Posts:

Post a Comment

Your email is never published nor shared. Required fields are marked *