• UC Irvine Machine Learning Repository

    http://archive.ics.uci.edu/ml/ We currently maintain 187 data sets as a service to the machine learning community. You may view all data sets through our searchable interface. Our old web site is still available, for those who prefer the old format. For a general overview of the Repository, please visit our About page. For information about citing…

    Tags:

  • Simpson’s paradox

    http://en.wikipedia.org/wiki/Simpson’s_paradox A와 B를 비교할때 A의 속성 A[0], A[1]이 각각 B[0], B[1]보다 크다고 하더라도 A[0] + A[1] < B[0] + B[1]일 수 있다는 paradox. 또는 벡터 a1, a2, b1, b2가 있을때 a1의 기울기가 b1보다 크고, a2의 기울기가 b2보다 크다하더라도 a1 + a2 의 기울기가 b1 + b2 의 기울기보다 작을 수 있다.

    Tags:

  • Empty? Null?

    컬렉션 또는 문자열을 반환하는 함수에서 Microsoft는 C#의 경우 빈 컬렉션 혹은 빈 문자열을 권장하고 있다고 하네요. 링크된 글에 설명된 이유는, 1. Null을 반환할 경우 NullReferenceException이 날 경우를 대비해야한다는 reliability 문제. 2. Null도 반환되고 empty 컬렉션/문자열도 반환된다면 이 두가지 모두를 함수를 호출한 곳에서 체크해야하는데 어차피 두경우 모두 처리가 비슷할 것이니 합치는게 낫다는 점. 3. .Net이 그렇게…

    Tags:

  • Sharding

    http://www.addsimplicity.com/adding_simplicity_an_engi/2008/08/shard-lessons.html How to set the number of shards is interesting. He recommends 12 as an example because it’s 2*6, 3*4 which means it’s mathematically flexible. He also suggests to think of splitting a shard as tree node split. It would be look more formal if we think of hashing function in the article for sharding…

    Tags:

  • Google Browser Size

    http://googlecode.blogspot.com/2009/12/introducing-google-browser-size.html Data on the browser size and the reach rate. Google also provides with a tool that’ll test your website. It’a amazing that this much precious information is shared with the general public.

    Tags:

  • Javascript lecture from Douglas Crockford

    http://video.yahoo.com/watch/111593/1710507 Lecture from the guru. I’m going to watch this.

    Tags:

  • 미 정찰기 해킹

    “미 최첨단 무인 정찰기, 반군에 해킹”, KBS. KBS에서는 언급되지 않았는데 CNN에서는 고속의 영상 전송을 위해 암호화 하지 않았던 것으로 설명함. 암호화를 하고 싶었지만 데이터를 사방에 전송하기에는 암호화가 충분히 빠르지 않았던 것.

    Tags:

  • Softdelete in database

    Building Scalable Databases: Perspectives on the War on Soft Deletes A가 a를 가지고 있었다는 사실을 알고 있었는데, 더이상 A가 a를 갖고 있지 않을 경우 (A,a)를 DB에서 지워버리는 경우를 hard delete, 데이터가 삭제되었다고 (A,a,isDeleted=True)표시하는 경우를 soft delete로 구분하고 그 장단점을 비교한 글. 출발점은 삭제했다고 그 데이터가 있었다는 사실까지 없어지면 불편하다는 것이고, 그래서 soft delete로 isDeleted=True로 해놓겠다는…

    Tags:

  • Object, Closure, Module practice in Javascript

    Based on the code in ‘Javascript: The Good Parts’. Some doesn’t like the lambda-like structure, and it’s not still clear to me which is better between object oriented pattern like style(prototype) or module like style(the one at the bottom of code snippet below). It’s good that there is a great flexibility, but it’s not good…

    Tags:

  • Functions in Javascript

    prototype and apply looks very interesting. It feels like some lego blocks that I can assemble with great flexibility.

    Tags: