http://r4pda.co.kr/ 에서 확인하실 수 있습니다.
언제부터인지 정확히 기억은 나지 않지만, 이 책을 쓰는 일이 벌써 대략 일년이나 된 작업이 되었습니다. 그간 총 4번에 걸쳐 파일을 업로드했고 매번 3개월 정도의 시간이 걸렸기 때문입니다. 그간 몇분들로부터 내용에 대한 피드백을 받기도 했고, 공유한 내용에 자체에 대해 감사 메일을 주신 분도 계셨습니다. 저로서도 그분들께, 그리고 별다른 말씀없으셨어도 다운받아 가신 독자 분들께 감사드립니다.
원래의 계획은 지난 세달간 머신 러닝 알고리즘을 사용하는 방법에 대해서 기술할 계획이었습니다만, 방향을 바꿔 R에서 데이터를 조작하는데 사용되는 sqldf, plyr, reshape2, data.table, foreach, doMC와 테스팅을 위한 testthat, browser() 그리고 코드 프로파일링 Rprof()에 대한 내용을 기술하였습니다. 이렇게 방향을 바꾼 이유는 당연하게도 데이터 분석에는 모델을 만드는 작업보다 데이터를 분석하기위해 준비하는 과정에 더욱 많은 시간이 소요되기 때문입니다. 그리고 최근에 (부족한 실력이지만) kaggle에 참가하면서 여러가지 새로 알게된 내용도 공유하고 싶어서 방향을 전환해 보았습니다.
그리고 여러곳에서 문장을 고쳐 더 읽기 쉽게 했고, 여기저기 내용을 추가했습니다. 그러면서 내용간 교차 참조를 위한 링크는 항상 꼼꼼히 달아놓았으니 중간까지 읽으신 분이 계속 이어서 읽으시더라도 큰 불편함이 없으시길 기대합니다.
다음 몇달간은 머신 러닝 알고리즘을 수행하는 방법에 대해서 집필할 생각입니다.