<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Computational Prediction</title>
	<atom:link href="http://mkseo.pe.kr/stats/?feed=rss2" rel="self" type="application/rss+xml" />
	<link>http://mkseo.pe.kr/stats</link>
	<description></description>
	<lastBuildDate>Wed, 15 May 2013 14:28:14 +0000</lastBuildDate>
	<language>en-US</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.5.1</generator>
		<item>
		<title>How to convert list of data frames into one data frame</title>
		<link>http://mkseo.pe.kr/stats/?p=908</link>
		<comments>http://mkseo.pe.kr/stats/?p=908#comments</comments>
		<pubDate>Wed, 15 May 2013 14:28:14 +0000</pubDate>
		<dc:creator>Minkoo Seo</dc:creator>
				<category><![CDATA[Uncategorized]]></category>

		<guid isPermaLink="false">http://mkseo.pe.kr/stats/?p=908</guid>
		<description><![CDATA[Problem to discuss is how to convert the following list of data frames into one data frame. One commonly known approach is to convert the list to vector using unlist(), and then convert to matrix, and then finally make it as data frame. But this has drawback as unlist() will perform type-coercion as vector can [...]]]></description>
				<content:encoded><![CDATA[<p>Problem to discuss is how to convert the following list of data frames into one data frame.</p>
<pre class="brush: r; title: ; notranslate">
x &lt;- list(data.frame(math=90, science=85),
          data.frame(math=98, science=82))
</pre>
<p>One commonly known approach is to convert the list to vector using unlist(), and then convert to matrix, and then finally make it as data frame.</p>
<pre class="brush: r; title: ; notranslate">
&gt; x &lt;- list(data.frame(math=90, science=85),
+           data.frame(math=98, science=82))
&gt; 
&gt; as.data.frame(matrix(ncol=2, byrow=TRUE, unlist(x)))
  V1 V2
1 90 85
2 98 82
</pre>
<p>But this has drawback as unlist() will perform type-coercion as vector can contain only one data type. For example, we get weird names in the example below.</p>
<pre class="brush: r; title: ; notranslate">
&gt; x &lt;- list(data.frame(name=&quot;foo&quot;, value=1),
+           data.frame(name=&quot;bar&quot;, value=2))
&gt; 
&gt; as.data.frame(matrix(ncol=2, byrow=TRUE, unlist(x)))
  V1 V2
1  1  1
2  1  2
</pre>
<p>Solution for this is to use do.call() with rbind(). It calls rbind for each elements in the list.</p>
<pre class="brush: r; title: ; notranslate">
&gt; x &lt;- list(data.frame(name=&quot;foo&quot;, value=1),
+           data.frame(name=&quot;bar&quot;, value=2))
&gt; 
&gt; do.call(rbind, x)
  name value
1  foo     1
2  bar     2
</pre>
<p>But the issue is that the rbind is slow.</p>
<pre class="brush: r; title: ; notranslate">
&gt; x &lt;- lapply(1:10000, function(x) {
+   data.frame(name=paste(x, &quot;foo&quot;), value=x)
+ })
&gt; head(x)
[[1]]
   name value
1 1 foo     1

[[2]]
   name value
1 2 foo     2

[[3]]
   name value
1 3 foo     3

[[4]]
   name value
1 4 foo     4

[[5]]
   name value
1 5 foo     5

[[6]]
   name value
1 6 foo     6

&gt; system.time(do.call(rbind, x))
   user  system elapsed 
 10.100   0.014  10.114 
</pre>
<p>Ten seconds is not bad, right? But it can be several minutes as data frame gets more columns in it.</p>
<p>rbindlist in data.table solves this problem as in the below. See that it takes almost negligible amount of time.</p>
<pre class="brush: r; title: ; notranslate">
&gt; library(data.table)
&gt; x &lt;- lapply(1:10000, function(x) {
+   data.frame(name=paste(x, &quot;foo&quot;), value=x)
+ })
&gt; system.time(rbindlist(x))
   user  system elapsed 
  0.003   0.000   0.003 
</pre>
<p>data.table is subclass of data.frame. Thus, it should work where data.frame is necessary. And, if needed, data.table can be easily converted to data.frame using as.data.frame().</p>
]]></content:encoded>
			<wfw:commentRss>http://mkseo.pe.kr/stats/?feed=rss2&#038;p=908</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Converting JSON to Data Frame in R</title>
		<link>http://mkseo.pe.kr/stats/?p=898</link>
		<comments>http://mkseo.pe.kr/stats/?p=898#comments</comments>
		<pubDate>Sun, 12 May 2013 04:14:27 +0000</pubDate>
		<dc:creator>Minkoo Seo</dc:creator>
				<category><![CDATA[Uncategorized]]></category>

		<guid isPermaLink="false">http://mkseo.pe.kr/stats/?p=898</guid>
		<description><![CDATA[Here&#8217;s an example to load json objects into R&#8217;s data frame. You need some formatting of the json file contents if your file is not formatted nicely: Here&#8217;s how to for loading the file contents in such case: It takes a bit more effort if json object has some nested elements. This is one of [...]]]></description>
				<content:encoded><![CDATA[<p>Here&#8217;s an example to load json objects into R&#8217;s data frame.</p>
<pre class="brush: r; title: ; notranslate">
&gt; library(rjson)
&gt; # This gives you list.
&gt; x &lt;- fromJSON('[{&quot;name&quot;: &quot;foo&quot;, &quot;score&quot;: 95},{&quot;name&quot;: &quot;bar&quot;, &quot;score&quot;: 87}]')
&gt; str(x)
List of 2
 $ :List of 2
  ..$ name : chr &quot;foo&quot;
  ..$ score: num 95
 $ :List of 2
  ..$ name : chr &quot;bar&quot;
  ..$ score: num 87
&gt; x
[[1]]
[[1]]$name
[1] &quot;foo&quot;

[[1]]$score
[1] 95


[[2]]
[[2]]$name
[1] &quot;bar&quot;

[[2]]$score
[1] 87

&gt; # Convert to data frame.
&gt; y = as.data.frame(do.call(rbind, x))
&gt; class(y)
[1] &quot;data.frame&quot;
&gt; y
  name score
1  foo    95
2  bar    87
</pre>
<p>You need some formatting of the json file contents if your file is not formatted nicely:</p>
<pre class="brush: plain; title: ; notranslate">
$ cat data.json 
{&quot;name&quot;: &quot;foo&quot;, &quot;score&quot;: 95}
{&quot;name&quot;: &quot;bar&quot;, &quot;score&quot;: 87}
</pre>
<p>Here&#8217;s how to for loading the file contents in such case:</p>
<pre class="brush: r; title: ; notranslate">
&gt; l &lt;- paste(&quot;[&quot;, paste(readLines(&quot;data.json&quot;), collapse=&quot;,&quot;), &quot;]&quot;)
&gt; l
[1] &quot;[ {\&quot;name\&quot;: \&quot;foo\&quot;, \&quot;score\&quot;: 95},{\&quot;name\&quot;: \&quot;bar\&quot;, \&quot;score\&quot;: 87} ]&quot;
</pre>
<p>It takes a bit more effort if json object has some nested elements. This is one of the ways to get data frame.</p>
<pre class="brush: r; title: ; notranslate">
&gt; # See that x is list of list because of score field.
&gt; (x &lt;- fromJSON(
+ '[{&quot;name&quot;: &quot;foo&quot;, &quot;score&quot;: {&quot;a&quot;: 95, &quot;b&quot;: 97} },{&quot;name&quot;: &quot;bar&quot;, &quot;score&quot;: {&quot;a&quot;: 87, &quot;b&quot;: 98}}]'))
[[1]]
[[1]]$name
[1] &quot;foo&quot;

[[1]]$score
[[1]]$score$a
[1] 95

[[1]]$score$b
[1] 97


[[2]]
[[2]]$name
[1] &quot;bar&quot;

[[2]]$score
[[2]]$score$a
[1] 87

[[2]]$score$b
[1] 98

&gt; # Thanks to as.data.frame, score$a and score$b becomes score.a and score.b.
&gt; (x &lt;- lapply(x, function(x) { as.data.frame(x) }))
[[1]]
  name score.a score.b
1  foo      95      97

[[2]]
  name score.a score.b
1  bar      87      98

&gt; # It's now trivial to convert to data frame.
&gt; (x &lt;- do.call(rbind, x))
  name score.a score.b
1  foo      95      97
2  bar      87      98
&gt; class(x)
[1] &quot;data.frame&quot;
&gt; str(x)
'data.frame':	2 obs. of  3 variables:
 $ name   : Factor w/ 2 levels &quot;foo&quot;,&quot;bar&quot;: 1 2
 $ score.a: num  95 87
 $ score.b: num  97 98
</pre>
<p>Above is just preliminary example of conversion. See <a href="https://github.com/minkooseo/ml/tree/master/json">https://github.com/minkooseo/ml/tree/master/json</a> for more code and examples.</p>
]]></content:encoded>
			<wfw:commentRss>http://mkseo.pe.kr/stats/?feed=rss2&#038;p=898</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>(무료도서) R을 이용한 데이터 분석 실무 2013.05.12 버젼 올렸습니다.</title>
		<link>http://mkseo.pe.kr/stats/?p=893</link>
		<comments>http://mkseo.pe.kr/stats/?p=893#comments</comments>
		<pubDate>Sun, 12 May 2013 03:30:11 +0000</pubDate>
		<dc:creator>Minkoo Seo</dc:creator>
				<category><![CDATA[Uncategorized]]></category>

		<guid isPermaLink="false">http://mkseo.pe.kr/stats/?p=893</guid>
		<description><![CDATA[http://r4pda.co.kr/ 에서 확인하실 수 있습니다. 이번 업데이트에서는 r-project.org에 속한 ihelp 프로젝트의 메일링 리스트 ihelp-r4pda@lists.r-forge.r-project.org 를 통해서 많은 피드백을 받아서 반영하였습니다. ihelp의 이철희님이 많은 피드백을 주셨고 이에 따라 크고 작은 개선이 이었습니다. 피드백을 받고 가장 크게 바꾼것은 &#8216;제어문, 연산, 함수&#8217; 챕터를 좀 더 보강한 점입니다. 수정 및 보충 사항외에, 이번에는 선형회귀 챕터를 추가하였습니다. 사실 선형회귀 하나만 [...]]]></description>
				<content:encoded><![CDATA[<p><a href="http://r4pda.co.kr/">http://r4pda.co.kr/</a> 에서 확인하실 수 있습니다. </p>
<p>이번 업데이트에서는 r-project.org에 속한 ihelp 프로젝트의 메일링 리스트 ihelp-r4pda@lists.r-forge.r-project.org 를 통해서 많은 피드백을 받아서 반영하였습니다. ihelp의 이철희님이 많은 피드백을 주셨고 이에 따라 크고 작은 개선이 이었습니다. 피드백을 받고 가장 크게 바꾼것은 &#8216;제어문, 연산, 함수&#8217; 챕터를 좀 더 보강한 점입니다.</p>
<p>수정 및 보충 사항외에, 이번에는 선형회귀 챕터를 추가하였습니다. 사실 선형회귀 하나만 해도 두꺼운 책 한권이라 모든 내용을 다 쓴다는건 물리적으로 불가능한 일이고, 이 책이 선형회귀 책도 아니니 만큼 적당선에서(?) 마무리 지어봤습니다. </p>
<p>그런데 쓰면 쓸수록 데이터 과학이란 정말로 여러 학문의 교점에 서있단 생각이 듭니다. 글이 도움이 될 수 있는 대상 독자층을 잘 선택하고 쓰면 좋겠는데, 제가 모든 분야를 다 꿰뚫고 있는건 아닌지라 부족함이 많네요. 일단은 앞서 적은 메일링 리스트 <a href="mailto:ihelp-r4pda@lists.r-forge.r-project.org">ihelp-r4pda@lists.r-forge.r-project.org</a>로 책 내용과 관련한 메일등을 주시면 (질문도 환영입니다) 읽는 분이나 저에게나 도움이 될 것 같습니다.</p>
<p>다음 3개월 동안은 머신러닝 알고리즘으로 챕터를 쓸 생각입니다.</p>
]]></content:encoded>
			<wfw:commentRss>http://mkseo.pe.kr/stats/?feed=rss2&#038;p=893</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>R을 이용한 데이터 분석 실무(무료도서) 버젼2 공개합니다.</title>
		<link>http://mkseo.pe.kr/stats/?p=864</link>
		<comments>http://mkseo.pe.kr/stats/?p=864#comments</comments>
		<pubDate>Sat, 16 Feb 2013 12:02:38 +0000</pubDate>
		<dc:creator>Minkoo Seo</dc:creator>
				<category><![CDATA[Uncategorized]]></category>

		<guid isPermaLink="false">http://mkseo.pe.kr/stats/?p=864</guid>
		<description><![CDATA[http://r4pda.co.kr/에 &#8216;R을 이용한 데이터 분석 실무&#8217;의 두번째 버젼을 방금 업로드 하였습니다. 이번에는 앞서 공개드린 문서의 셀수도 없이 많은 오탈자와 비문을 수정했고, 6장 그래프, 7장 통계분석을 추가하였습니다. 6장 그래프에서 Lattice나 ggplot에 대해서 쓰지 못한 것은 너무 아쉽지만 그 둘을 쓰다보면 상당시간 동안 그래프만 그리고 있게 될것 같아서 잠시 미뤄두고 있습니다. 아직 집필중인 7장의 통계 분석 챕터에도 [...]]]></description>
				<content:encoded><![CDATA[<p><a href="http://r4pda.co.kr/">http://r4pda.co.kr/</a>에 &#8216;R을 이용한 데이터 분석 실무&#8217;의 두번째 버젼을 방금 업로드 하였습니다.</p>
<p>이번에는 앞서 공개드린 문서의 셀수도 없이 많은 오탈자와 비문을 수정했고, 6장 그래프, 7장 통계분석을 추가하였습니다. 6장 그래프에서 Lattice나 ggplot에 대해서 쓰지 못한 것은 너무 아쉽지만 그 둘을 쓰다보면 상당시간 동안 그래프만 그리고 있게 될것 같아서 잠시 미뤄두고 있습니다. 아직 집필중인 7장의 통계 분석 챕터에도 쓰고 싶은 내용이 너무나도 많이 남아있습니다만, 그걸 다 쓰고 다음 버젼을 공개하려면 몇달이 걸릴지 가늠하기가 어려워 중간 단계에서 올리게되었습니다.</p>
<p>아마 다음 버젼 역시 2~3개월 후에 올리게 될 것 같습니다. 현재 생각하고 있는 7장의 추가 주제는 다음과 같습니다.<br />
- 추정 및 검정(평균, 분산 비율)<br />
- Permutation Test<br />
- 회귀분석(OLS, GLM 약간)<br />
- 분산분석(ANOVA)<br />
- 비모수 통계</p>
<p>잘 써서 종이 책으로 내도 되지만 이렇게 웹상에 공개하는 것이 더 많은 독자를 만나는 방법이라고 생각해서 이렇게 올리고 있습니다. 많은 트윗, RT, Like, +1 부탁드립니다.</p>
]]></content:encoded>
			<wfw:commentRss>http://mkseo.pe.kr/stats/?feed=rss2&#038;p=864</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
		<item>
		<title>How to replace factor in R</title>
		<link>http://mkseo.pe.kr/stats/?p=851</link>
		<comments>http://mkseo.pe.kr/stats/?p=851#comments</comments>
		<pubDate>Fri, 01 Feb 2013 11:59:11 +0000</pubDate>
		<dc:creator>Minkoo Seo</dc:creator>
				<category><![CDATA[Uncategorized]]></category>

		<guid isPermaLink="false">http://mkseo.pe.kr/stats/?p=851</guid>
		<description><![CDATA[Use levels().]]></description>
				<content:encoded><![CDATA[<p>Use levels().</p>
<pre class="brush: r; title: ; notranslate">
&gt; x &lt;- as.factor(c(&quot;A&quot;, &quot;B&quot;, &quot;C&quot;, &quot;D&quot;, &quot;B&quot;, &quot;A&quot;))
&gt; x
[1] A B C D B A
Levels: A B C D
&gt; levels(x)[levels(x) == &quot;D&quot;] &lt;- &quot;C&quot;
&gt; x
[1] A B C C B A
Levels: A B C
</pre>
]]></content:encoded>
			<wfw:commentRss>http://mkseo.pe.kr/stats/?feed=rss2&#038;p=851</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Amazon EC2 Recipe for R</title>
		<link>http://mkseo.pe.kr/stats/?p=846</link>
		<comments>http://mkseo.pe.kr/stats/?p=846#comments</comments>
		<pubDate>Thu, 31 Jan 2013 14:50:12 +0000</pubDate>
		<dc:creator>Minkoo Seo</dc:creator>
				<category><![CDATA[Uncategorized]]></category>

		<guid isPermaLink="false">http://mkseo.pe.kr/stats/?p=846</guid>
		<description><![CDATA[I&#8217;ve written a preliminary script to run my R processes on amazon ec2. Don&#8217;t know if I will end up with buying a new PC or with being an enthusiastic ec2 user. Run: ./ec2_ready.sh &#038;&#038; ./ec2_work.sh ec2.config common.sh ec2_ready.sh ec2_work.sh]]></description>
				<content:encoded><![CDATA[<p>I&#8217;ve written a preliminary script to run my R processes on amazon ec2. Don&#8217;t know if I will end up with buying a new PC or with being an enthusiastic ec2 user.</p>
<p>Run:<br />
./ec2_ready.sh &#038;&#038; ./ec2_work.sh</p>
<p>ec2.config</p>
<pre class="brush: bash; title: ; notranslate"> 
_your_server_.compute.amazonaws.com
</pre>
<p>common.sh </p>
<pre class="brush: bash; title: ; notranslate">
#!/bin/bash
export SERVER=ubuntu@`cat ec2.config`
export PEM=_your_pem_file_.pem
export COPY=&quot;scp -i ${PEM}&quot;
export SSH=&quot;ssh -t -t -oStrictHostKeyChecking=no -i ${PEM}&quot;
</pre>
<p>ec2_ready.sh</p>
<pre class="brush: bash; title: ; notranslate">
#!/bin/bash
source common.sh

tar cvzf code.tgz _your_code_

${COPY} code.tgz ${DEST}:
${SSH} ${SERVER} &lt;&lt; SSH_END
# Prepare
sudo apt-get update
sudo apt-get -y install r-base-core

tar xvzf code.tgz

# Prepare R
cat &gt; .Rprofile &lt;&lt; END
options(repos=&quot;_your_favorite_repo_&quot;)
END

sudo R --no-save &lt;&lt; END
install.packages(&quot;randomForest&quot;)
install.packages(&quot;DMwR&quot;)
install.packages(&quot;DAAG&quot;)
install.packages(&quot;doBy&quot;)
install.packages(&quot;e1071&quot;)
install.packages(&quot;gbm&quot;)
install.packages(&quot;party&quot;)
install.packages(&quot;plyr&quot;)
install.packages(&quot;stringr&quot;)
END

# Prepare shutdown, so that it terminates at least within 24hrs.
# Otherwise, it takes money!
echo &quot;sudo halt&quot; | at now + 1440 min

SSH_END
</pre>
<p>ec2_work.sh</p>
<pre class="brush: bash; title: ; notranslate">
#!/bin/bash
source common.sh

${SSH} ${SERVER} &lt;&lt; SSH_END
R --no-save &lt;&lt; END &gt; log.txt 2&gt;&amp;1
data(iris)
rf &lt;- randomForest(Species ~., data=iris)
summary(rf)
save(file=&quot;work.RData&quot;)
END
SSH_END

${COPY} ${SERVER}:log.txt .
${COPY} ${SERVER}:work.RData .
</pre>
]]></content:encoded>
			<wfw:commentRss>http://mkseo.pe.kr/stats/?feed=rss2&#038;p=846</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>rbinom과 sample로 Train, Validation, Test 데이터 선택하기</title>
		<link>http://mkseo.pe.kr/stats/?p=844</link>
		<comments>http://mkseo.pe.kr/stats/?p=844#comments</comments>
		<pubDate>Thu, 31 Jan 2013 13:49:48 +0000</pubDate>
		<dc:creator>Minkoo Seo</dc:creator>
				<category><![CDATA[Uncategorized]]></category>

		<guid isPermaLink="false">http://mkseo.pe.kr/stats/?p=844</guid>
		<description><![CDATA[http://class.coursera.org/dataanalysis-001/ 과목에서 보고 올려봅니다. rbinom() 으로 10000개 데이터에서 트레이닝셋(1인경우), 테스트셋(0인 경우)를 선택. (앞면이 나올 확률이 70%인 동전을 한번 던지는 실험을 10000회 수행) sample()로 train, validation, test를 데이터 overlapping 안되게 선택. 역시 골프 잘 치는 사람들은 정말 많군요.]]></description>
				<content:encoded><![CDATA[<p><a href="http://class.coursera.org/dataanalysis-001/">http://class.coursera.org/dataanalysis-001/</a> 과목에서 보고 올려봅니다.</p>
<p>rbinom() 으로 10000개 데이터에서 트레이닝셋(1인경우), 테스트셋(0인 경우)를 선택. (앞면이 나올 확률이 70%인 동전을 한번 던지는 실험을 10000회 수행)</p>
<pre class="brush: r; title: ; notranslate">
rbinom(n=10000, size=1, prob=.7)
</pre>
<p>sample()로 train, validation, test를 데이터 overlapping 안되게 선택.</p>
<pre class="brush: r; title: ; notranslate">
sample(c(&quot;train&quot;, &quot;validation&quot;, &quot;test&quot;), 10000, replace=TRUE, prob=c(.7, .15, .15))
</pre>
<p>역시 골프 잘 치는 사람들은 정말 많군요.</p>
]]></content:encoded>
			<wfw:commentRss>http://mkseo.pe.kr/stats/?feed=rss2&#038;p=844</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Cross Validation in R using cvTools</title>
		<link>http://mkseo.pe.kr/stats/?p=837</link>
		<comments>http://mkseo.pe.kr/stats/?p=837#comments</comments>
		<pubDate>Wed, 19 Dec 2012 13:08:07 +0000</pubDate>
		<dc:creator>Minkoo Seo</dc:creator>
				<category><![CDATA[Uncategorized]]></category>

		<guid isPermaLink="false">http://mkseo.pe.kr/stats/?p=837</guid>
		<description><![CDATA[Output:]]></description>
				<content:encoded><![CDATA[<pre class="brush: r; title: ; notranslate">
library(cvTools)
library(doMC)

registerDoMC(cores=8)

# 10 fold CV
folds &lt;- cvFolds(NROW(iris), K=10)
foreach(i=1:10) %dopar% {
  train &lt;- iris[folds$subsets[folds$which != i], ]
  validation &lt;- iris[folds$subsets[folds$which == i], ]
  # Write modeling and evaluation code here.
  # In this example, I'm just returning training and validation data sets 
  # for illustrative purpose.
  return(list(train=train, validation=validation))
}
</pre>
<p>Output:</p>
<pre class="brush: plain; title: ; notranslate">
...
[[10]]
[[10]]$train
    Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
105          6.5         3.0          5.8         2.2  virginica
29           5.2         3.4          1.4         0.2     setosa
18           5.1         3.5          1.4         0.3     setosa
149          6.2         3.4          5.4         2.3  virginica
2            4.9         3.0          1.4         0.2     setosa
43           4.4         3.2          1.3         0.2     setosa
114          5.7         2.5          5.0         2.0  virginica
104          6.3         2.9          5.6         1.8  virginica
...
[[10]]$validation
    Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
11           5.4         3.7          1.5         0.2     setosa
44           5.0         3.5          1.6         0.6     setosa
67           5.6         3.0          4.5         1.5 versicolor
...
</pre>
]]></content:encoded>
			<wfw:commentRss>http://mkseo.pe.kr/stats/?feed=rss2&#038;p=837</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>(무료도서) R을 이용한 데이터 분석 실무</title>
		<link>http://mkseo.pe.kr/stats/?p=832</link>
		<comments>http://mkseo.pe.kr/stats/?p=832#comments</comments>
		<pubDate>Sat, 24 Nov 2012 01:45:57 +0000</pubDate>
		<dc:creator>Minkoo Seo</dc:creator>
				<category><![CDATA[Uncategorized]]></category>

		<guid isPermaLink="false">http://mkseo.pe.kr/stats/?p=832</guid>
		<description><![CDATA[R을 배우기 시작한지 시간도 좀 지났고해서 블로그 글을 꾸준히 쓴는 것도 좋지만 좀 더 잘 정리해보자는 생각이 들었습니다. 그래서 몇달전부터 latex을 붙잡고 열심히 씨름한 결과 공개해도 괜찮을 정도의 분량의 문서 작성이 끝났습니다. http://r4pda.co.kr/에 &#8216;R을 이용한 데이터 분석 실무&#8217;라는 제목으로 책을 올렸습니다. 이 책의 컨셉은 어느정도 프로그래밍도 되고, 통계나 머신 러닝기법에 대한 개념이 있는 분이 손쉽게 [...]]]></description>
				<content:encoded><![CDATA[<p>R을 배우기 시작한지 시간도 좀 지났고해서 블로그 글을 꾸준히 쓴는 것도 좋지만 좀 더 잘 정리해보자는 생각이 들었습니다. 그래서 몇달전부터 latex을 붙잡고 열심히 씨름한 결과 공개해도 괜찮을 정도의 분량의 문서 작성이 끝났습니다.</p>
<p><a href="http://r4pda.co.kr/">http://r4pda.co.kr/</a>에 &#8216;R을 이용한 데이터 분석 실무&#8217;라는 제목으로 책을 올렸습니다.</p>
<p>이 책의 컨셉은 어느정도 프로그래밍도 되고, 통계나 머신 러닝기법에 대한 개념이 있는 분이 손쉽게 R을 사용해 데이터를 분석할 수 있게 하는 것입니다. 이런 이유로 개념적인 성격의 것은 빼고 (사실 그런 책을 쓸 능력도 안되구요), 실무적으로 적용하는 것에 중심을 두고 쓰고 있습니다. 지금은 데이터 타입, 프로그래밍에 필요한 제어문이나 함수, 데이터 조작이 작성되어있습니다. 이후에는 통계 분석, 시각화, 머신 러닝 알고리즘 적용 등을 작성할 생각입니다. </p>
<p>앞으로 2년은 더 걸리지 않을까? 생각하며 쓰고 있는데, 얼마나 시간이 걸리든 이번에는 끝까지 써볼 생각입니다.</p>
<p>혹시 읽어보시다가 오탈자가 보이거나 잘못된 내용이 있으면 알려주세요. 적극적으로 개선해보겠습니다.</p>
]]></content:encoded>
			<wfw:commentRss>http://mkseo.pe.kr/stats/?feed=rss2&#038;p=832</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>My certification on Mathematical Biostatistics Bootcamp</title>
		<link>http://mkseo.pe.kr/stats/?p=828</link>
		<comments>http://mkseo.pe.kr/stats/?p=828#comments</comments>
		<pubDate>Tue, 20 Nov 2012 14:35:58 +0000</pubDate>
		<dc:creator>Minkoo Seo</dc:creator>
				<category><![CDATA[Uncategorized]]></category>

		<guid isPermaLink="false">http://mkseo.pe.kr/stats/?p=828</guid>
		<description><![CDATA[This is earned from coursera.org course. It is a basic statistics course, but the quiz questions are difficult than the course contents. It&#8217;s a nice way to brush up basic statistical knowledge.]]></description>
				<content:encoded><![CDATA[<p>This is earned from coursera.org course. It is a basic statistics course, but the quiz questions are difficult than the course contents. It&#8217;s a nice way to brush up basic statistical knowledge.</p>
<p><img src="http://mkseo.pe.kr/stats/wp-content/uploads/2012/11/Mathematical-Biostatistics-Bootcamp-728x1024.png" alt="" title="Mathematical Biostatistics Bootcamp" width="728" height="1024" class="alignnone size-large wp-image-829" /></p>
]]></content:encoded>
			<wfw:commentRss>http://mkseo.pe.kr/stats/?feed=rss2&#038;p=828</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
	</channel>
</rss>
