• 데이터 사이언티스트 면접 질문 리스트

    데이터 사이언티스트 면접 질문 리스트 넘버웍스란 회사에서 사용한 면접 질문 리스트라고 합니다.

    Tags:

  • Gaussian Process

    Gaussian Process가 무엇인지 이제 어렴풋이나마 이해하게 되었는데 정말 말도 안되게 신기한 녀석이군요. 처음으로 위키피디아 문서가 정의를 이해하는데 부족하다는 느낌이 들어 자료를 정리합니다. 아래 내용이 아주 좋았습니다. 단 몇페이지만 읽어도 감을 잡기 좋았습니다. Gaussian Processes for Regression: A Quick Introduction 동영상은 정의를 완전히 이해하는데는 부족하지만 다양한 예가 나와서 좋았습니다. 유튜브에서 동영상을 열고 관련 동영상에서 다음 챕터를…

    Tags:

  • Hebbian Theory

    https://en.m.wikipedia.org/wiki/Hebbian_theory Hebbian theory is a theory in neuroscience that proposes an explanation for the adaptation of neurons in the brain during the learning process. “Cells that fire together, wire together.” However, this summary should not be taken literally. Hebb emphasized that cell A needs to “take part in firing” cell B, and such causality can…

    Tags:

  • 모든 문제를 내가 해결할 필요는 없다

    프로그래머는 버그가 발생하면 그 원인을 찾고 해결하는데 익숙합니다. 무언가 잘 동작되지 않으면 원인을 찾는데 그치지 않고 문제를 직접해결하게 되기도합니다. 그런데 회사에서 일을 할 때는 모든 문제를 꼭 내가 해결할 필요가 없다는 말을 적고 싶습니다. 해당 컴포넌트를 담당하는 사람이 있다면 그 사람에게 버그 리포팅을 할 수도 있을 것이고, 뭐가 잘못된건지조차 알 수 없다면 담당자에게 문의를 할…

    Tags:

  • Neural networks 책 구입

    세 권의 책을 소개하려고 합니다. 아직 읽은 책은 아니므로 저의 개인적인 평가는 없지만 여기저기 찾아본 설명을 적었습니다. Neural Networks for Pattern Recognition by Christopher M. Bishop은 저자가 아주 유명한 분이죠. PRML이라는 약자로 잘 알려진 Pattern Recognition and Machine Learning의 저자입니다. 수식이 많아서 어려운 책이란 리뷰가 있습니다만 Peter Norvig이 별점 5를 준 책이기도 합니다. Fundamentals of…

    Tags:

  • 미국 통계학회, P값의 오용(誤用)을 경고하는 성명서 발표

    http://m.ibric.org/trend/news/subread.php?Board=news&id=270293 영가설이 참이라고 가정할 때, 관찰된(또는 그보다 더 극단적인) 결과가 일어날 확률 연구자들은 통계적으로 유의한 결과를 도출하는 데이터분석에만 치중하지 말고, 계산을 통해 이루어지는 모든 통계적 검증과 선택까지도 서술해야 한다. 그러지 않으면 연구결과가 탄탄하다는 착시를 일으킬 수 있다.

    Tags:

  • Deep learning 공부

    드디어 Learning Deep Architectures for AI 를 다 읽었습니다. 문서를 읽으면서 그동안 내가 알고 있다고 생각했던 Boltzmann machine이나 RBM에 대해 실은 내가 아무것도 모르는구나를 깨달았습니다. 그리고 layerwise greedy training이나 distributed sparse representation에 대해 배울 수 있었습니다. 하지만 정말 아무것도 모르는 사람이 읽기에 좋은 시작은 아니었던 듯 합니다. 내용에 디테일이 많은데 그 디테일을 쉽게 이해하기에는 수식이나…

    Tags:

  • AMP (Accelerated Mobile Pages)

    https://www.ampproject.org/ 성능을 우선한 설계와 캐싱으로 모바일 페이지 로딩 속도를 향상시키는 open source initiative. 이를 사용중인 회사에는 Google, LinkedIn, Twitter등이 있습니다.

    Tags:

  • Deep learning을 배우기 시작하기위한 자료

    제가 요즘 보는 문서는 Learning Deep Architectures for AI 입니다. 참고로 이 링크는 short version이고 book 형태로 긴 문서도 있습니다. 같은 제목으로 구글 검색해보면 book version도 나옵니다. 둘간의 차이는 내용은 아닌것 같고 포멧팅만 다른 듯 합니다. 이후 볼만한 강의로 Google이 udacity에 공개한 강의가 있습니다. Neural net에 참고할만한 강의는 Coursera에 Geoffrey Hinton의 강의가 있습니다. 일단 저는…

    Tags:

  • Crowd sourcing응 사용한 질의 처리

    Crowdsourced Enumeration Queries는 human worker가 질의 처리에 참여하는 경우 질의 처리 상태의 모니터링에 통계적 기법을 적용한 논문입니다. Human worker가 수행하는 질의 처리 예에는 subjective comparisons, fuzzy matching for predicates and joins, entity resolution 가 있습니다. 이런 시스템의 예로는 CrowdDB: Answering Queries with Crowdsourcing가 있습니다.

    Tags: