Tag: statistics

  • Converting JSON to Data Frame in R

    Here’s an example to load json objects into R’s data frame. You need some formatting of the json file contents if your file is not formatted nicely: Here’s how to for loading the file contents in such case: It takes a bit more effort if json object has some nested elements. This is one of…

  • (무료도서) R을 이용한 데이터 분석 실무 2013.05.12 버젼 올렸습니다.

    http://r4pda.co.kr/ 에서 확인하실 수 있습니다. 이번 업데이트에서는 r-project.org에 속한 ihelp 프로젝트의 메일링 리스트 ihelp-r4pda@lists.r-forge.r-project.org 를 통해서 많은 피드백을 받아서 반영하였습니다. ihelp의 이철희님이 많은 피드백을 주셨고 이에 따라 크고 작은 개선이 이었습니다. 피드백을 받고 가장 크게 바꾼것은 ‘제어문, 연산, 함수’ 챕터를 좀 더 보강한 점입니다. 수정 및 보충 사항외에, 이번에는 선형회귀 챕터를 추가하였습니다. 사실 선형회귀 하나만…

  • R을 이용한 데이터 분석 실무(무료도서) 버젼2 공개합니다.

    http://r4pda.co.kr/에 ‘R을 이용한 데이터 분석 실무’의 두번째 버젼을 방금 업로드 하였습니다. 이번에는 앞서 공개드린 문서의 셀수도 없이 많은 오탈자와 비문을 수정했고, 6장 그래프, 7장 통계분석을 추가하였습니다. 6장 그래프에서 Lattice나 ggplot에 대해서 쓰지 못한 것은 너무 아쉽지만 그 둘을 쓰다보면 상당시간 동안 그래프만 그리고 있게 될것 같아서 잠시 미뤄두고 있습니다. 아직 집필중인 7장의 통계 분석 챕터에도…

  • How to replace factor in R

    Use levels().

  • Amazon EC2 Recipe for R

    I’ve written a preliminary script to run my R processes on amazon ec2. Don’t know if I will end up with buying a new PC or with being an enthusiastic ec2 user. Run: ./ec2_ready.sh && ./ec2_work.sh ec2.config common.sh ec2_ready.sh ec2_work.sh

  • rbinom과 sample로 Train, Validation, Test 데이터 선택하기

    http://class.coursera.org/dataanalysis-001/ 과목에서 보고 올려봅니다. rbinom() 으로 10000개 데이터에서 트레이닝셋(1인경우), 테스트셋(0인 경우)를 선택. (앞면이 나올 확률이 70%인 동전을 한번 던지는 실험을 10000회 수행) sample()로 train, validation, test를 데이터 overlapping 안되게 선택. 역시 골프 잘 치는 사람들은 정말 많군요.

  • Cross Validation in R using cvTools

    Output:

  • (무료도서) R을 이용한 데이터 분석 실무

    R을 배우기 시작한지 시간도 좀 지났고해서 블로그 글을 꾸준히 쓴는 것도 좋지만 좀 더 잘 정리해보자는 생각이 들었습니다. 그래서 몇달전부터 latex을 붙잡고 열심히 씨름한 결과 공개해도 괜찮을 정도의 분량의 문서 작성이 끝났습니다. http://r4pda.co.kr/에 ‘R을 이용한 데이터 분석 실무’라는 제목으로 책을 올렸습니다. 이 책의 컨셉은 어느정도 프로그래밍도 되고, 통계나 머신 러닝기법에 대한 개념이 있는 분이 손쉽게…

  • My certification on Mathematical Biostatistics Bootcamp

    This is earned from coursera.org course. It is a basic statistics course, but the quiz questions are difficult than the course contents. It’s a nice way to brush up basic statistical knowledge.

  • Relative Risk, Odds Ratio

    Relative Risk는 Cohort Study에서 사용되며, Odds Ratio는 Case Control Study에 사용된다. 범주형 자료 분석 : 왜 오즈비(odds ratio) vs 상대 위험도(relative risk) 를 만들었을까?에 설명되어있듯이 Relative Risk가 더 이해하기 쉽지만, Case Control Study처럼 결과를 먼저 뽑은 뒤 원인을 분석하는 방법에는 적당하지 않다. 왜냐하면 어떤 원인에 의해 어떤 결과가 발생한 총비율을 알 수 없기 때문이다. 링크의…