Tag: statistics

  • Hebbian Theory

    https://en.m.wikipedia.org/wiki/Hebbian_theory Hebbian theory is a theory in neuroscience that proposes an explanation for the adaptation of neurons in the brain during the learning process. “Cells that fire together, wire together.” However, this summary should not be taken literally. Hebb emphasized that cell A needs to “take part in firing” cell B, and such causality can…

  • Neural networks 책 구입

    세 권의 책을 소개하려고 합니다. 아직 읽은 책은 아니므로 저의 개인적인 평가는 없지만 여기저기 찾아본 설명을 적었습니다. Neural Networks for Pattern Recognition by Christopher M. Bishop은 저자가 아주 유명한 분이죠. PRML이라는 약자로 잘 알려진 Pattern Recognition and Machine Learning의 저자입니다. 수식이 많아서 어려운 책이란 리뷰가 있습니다만 Peter Norvig이 별점 5를 준 책이기도 합니다. Fundamentals of…

  • 미국 통계학회, P값의 오용(誤用)을 경고하는 성명서 발표

    http://m.ibric.org/trend/news/subread.php?Board=news&id=270293 영가설이 참이라고 가정할 때, 관찰된(또는 그보다 더 극단적인) 결과가 일어날 확률 연구자들은 통계적으로 유의한 결과를 도출하는 데이터분석에만 치중하지 말고, 계산을 통해 이루어지는 모든 통계적 검증과 선택까지도 서술해야 한다. 그러지 않으면 연구결과가 탄탄하다는 착시를 일으킬 수 있다.

  • Deep learning 공부

    드디어 Learning Deep Architectures for AI 를 다 읽었습니다. 문서를 읽으면서 그동안 내가 알고 있다고 생각했던 Boltzmann machine이나 RBM에 대해 실은 내가 아무것도 모르는구나를 깨달았습니다. 그리고 layerwise greedy training이나 distributed sparse representation에 대해 배울 수 있었습니다. 하지만 정말 아무것도 모르는 사람이 읽기에 좋은 시작은 아니었던 듯 합니다. 내용에 디테일이 많은데 그 디테일을 쉽게 이해하기에는 수식이나…

  • Deep learning을 배우기 시작하기위한 자료

    제가 요즘 보는 문서는 Learning Deep Architectures for AI 입니다. 참고로 이 링크는 short version이고 book 형태로 긴 문서도 있습니다. 같은 제목으로 구글 검색해보면 book version도 나옵니다. 둘간의 차이는 내용은 아닌것 같고 포멧팅만 다른 듯 합니다. 이후 볼만한 강의로 Google이 udacity에 공개한 강의가 있습니다. Neural net에 참고할만한 강의는 Coursera에 Geoffrey Hinton의 강의가 있습니다. 일단 저는…

  • Crowd sourcing응 사용한 질의 처리

    Crowdsourced Enumeration Queries는 human worker가 질의 처리에 참여하는 경우 질의 처리 상태의 모니터링에 통계적 기법을 적용한 논문입니다. Human worker가 수행하는 질의 처리 예에는 subjective comparisons, fuzzy matching for predicates and joins, entity resolution 가 있습니다. 이런 시스템의 예로는 CrowdDB: Answering Queries with Crowdsourcing가 있습니다.

  • ADINN

    http://www2.imm.dtu.dk/pubdb/views/publication_details.php?id=6010 Microblog에서 Sentiment analysis를 하기위한 manually annotated lexicon.

  • Hosmer Lemeshow Test

    https://en.m.wikipedia.org/wiki/Hosmer–Lemeshow_test The Hosmer–Lemeshow test is a statistical test for goodness of fit for logistic regression models. Logistic regression을 평가할 때 full model과 비교만하다보면 이런 테스트가 있다는 걸 잊기 쉽다.

  • Lindley’s Paradox

    https://en.m.wikipedia.org/wiki/Lindley%27s_paradox# Lindley’s paradox is a counterintuitive situation in statistics in which the Bayesian and frequentist approaches to a hypothesis testing problem give different results for certain choices of the prior distribution.

  • Convex Optimization 추천 자료

    https://web.stanford.edu/~boyd/cvxbook/ http://www.youtube.com/watch?v=McLq1hEq3UY&list=PL3940DD956CDF0622 마음씨 좋은 분들이 책, 슬라이드를 공개하고 거기에 MOOC 까지 여셨군요. 이 책은 아마존 평점도 매우 높은 편이라 괜찮아 보입니다. 유튜브에도 강의가 올라와 있어 완벽하네요.