엄마통계봇(https://twitter.com/stat_mom)의 데이터를 긁어냈다.
98개의 트윗을 주기적으로 랜덤으로 골라 보여주고 있었다.
1 헉... 이 중에 normality test의 p-value가 0.05보다 큰 적이 있었던 자 내게 돌을 던져라!
2 피셔는 'Studies in Crop Variation. I'를 쓰기 위해 기계식 계산기로 12시간씩 여덟 달 동안 일해야 했단다. 니가 빨간 새들을 날려보내고 있는 그 게임기만 있었다면 하루에 끝났을 텐데...
3 프로포즈는 어디서 받았냐고? 당연히 Brownian Bridge 위에서였지. 얼마나 로맨틱했는지!
4 지금 니가 집에 들어왔다는 것은 5% 유의수준에서 니가 외박을 하지 않았다는 귀무가설을 기각할 수밖에 없구나.
5 적당한 장소가 주어진다면 지구라도 들어보이겠다” - 아르키메데스 적당한 step size 스케쥴이 주어진다면 deep neural network라도 학습해 보이겠다" - 엄마
6 저기, 미정이라고 엄마 친구가 있는데, 갸 아들이 리눅스 클러스터인가 뭔가를 갖춰줘서 MapReduce를 하면 수 테라바이트의 데이터도 순식간에 처리된대! 참 세상 좋아졌구나. 아, 아니다...
7 저기 가는 통계학자는 무어 그리 서러운 일이 있기에 저리 구슬프게 기각 기각 하고 운단 말이더냐?
8 인생은 online learning과 같아... 지나간 기회는 다시 돌아오지 않고 strongly convex 하다 해도 최적의 step size를 미리 알고 조정할 순 없단다. 그저 믿고 질러야 할 때도 있는 법이지.
9 이차원 정규분포는 평균으로 회귀하려는 성질을 갖고, 엄마의 주사는 니 자랑으로 회귀하려는 성질을 갖는단다.
10 이제 엄마 뭐시기 봇 유행도 다 끝난 듯 하지만, 원래 엄마 나이엔 트렌드 쫓기 힘든 것 아니겠니? 요즘 아이들이 통계에
관심이 많다니 엄만 흐뭇하면서도 좀 걱정이 된단다. 통계의 이름을 빌어 이상한 소리 하는 애들은 엄마한테 등짝을 맞을 거야.
11 요즘은 통계학도 분산 처리가 대세라기에 엄마도 AWS 계정을 하나 만들었단다. 네 신용카드에 연결해 놓았으니 그렇게 알도록 하렴!
12 여자의 마음은 갈대와 같단다. 어지간한 바람둥이라도 AUC가 0.6을 넘기기 힘들지.
13 에휴... 엄마 친구네 아들딸들과 비교해 봤을 때 너는 admissible 한 것 같지가 않구나...
14 에구구 우리 이쁜 강아지~! 그래 우리 집안 support vector는 너밖에 없다! 쪽쪽!
15 엄만 학창 시절 객관식 시험을 보는 날이면 선생님의 기출문제를 구해서 Hidden Markov Model을 학습한 다음,
시험장에 들어가선 앞 문제부터 풀며 forward pass를, 그리고 뒤에서부터 검토하면서 backward pass를 했단다.
16 엄만 네가 빈도주의자든 베이지언이든 건강하게만 자라주었으면 좋겠다. 그런데 영 트윗할 아이디어들이 떨어져 가는구나... 재미있는 아이디어 있으면 멘션 좀 줘 보렴.
17 엄만 네가 빈도주의자(frequentist)든 베이지언(Bayesian)이든 건강하게만 자라줬으면 좋겠구나. 그렇지만
fiducial inference를 하겠다고 하면 도시락 싸 들고 다니면서 말릴거야. 자식 이기는 부모 없다지만...
18 엄만 slice sampling은 기가 막히게 코딩하는데 이상하게 무 채썰기는 잘 안되는구나...
19 엄마의 팔로워 수가 언제 십만을 돌파할 지 내일까지 예측 모델을 만들어 오렴.
20 엄마의 너에 대한 사랑은 특성 함수(characteristic function)로도 표현할 수 없단다!
21 엄마도 한때는 지금의 deep learning처럼 잘 나갔단다. 하지만 역시 deep learning처럼 아무도 엄마를 함부로 다루지 못했지!
22 엄마는 사실 하늘 나라 선녀였지만 p-value를 조작한 죄로 옥황상제의 노여움을 사 지상으로 내려왔단다. 흑흑...
23 엄마는 사실 최대 우도 추정치(maximum likelihood estimator) 처럼 아주 섬세한 여자란다. 하지만
아빠는 대조적으로 사전확률분포(prior)가 아주 굳은 남자라 도통 사후확률분포(posterior)가 바뀌지 않지.
24 엄마는 떡을 썰테니 너는 이 코시 분포 모델의 MLE를 찾도록 하렴.
25 엄마는 느이 아빠가 F 분포의 분산을 암산으로 계산하는 것을 보고 반해서 결혼했단다.
26 엄마는 ggplot2를 써보려다가 그만 GG를 치고 말았단다.
27 엄마는 Fisher와 차를 마시고 올 테니 문단속 잘 하고 있어야 한다?
28 엄마나 너나 asymptotically 똑같이 늙어가는 처지니까 상수만큼 더 나이 먹었다고 괄시하지 말도록 하렴.
29 엄마가 한창 땐 계산자(sliderule)로 MCMC 샘플링을 했단다. 요즘 애들은 그게 뭔지도 잘 모르지? 각 차원 당
샘플 천개씩은 손으로 뽑아 봐야 curse of dimensionality가 이런 거구나 알게 된단다.
30 엄마가 통계학적으로 좀 이상한 얘기를 한다고 해서 의아하게 생각할 필요 없어. 엄마 나이 되면 다 이해하게 된단다.
31 엄마가 통계학에 입문할 때는 확률미적분학은 기본으로 깔고 시작했단다. 요즘 애들은 카드 경우의 수도 잘 못 세면서 통계를
하겠다고 그러던데 어디 그래서 내용이 이해가 가겠니? 편리한 프로그램들이 많다지만 이론을 이해하지 못한다면 말짱 소용이 없단다!
32 엄마가 죽기 전에 니가 짠 MCMC 샘플러가 posterior에 수렴하는 걸 볼 수 있으려는지...?
33 엄마가 좋아, 아빠가 좋아? 어디 한 번 Bayes risk를 최소화해 보렴.
34 엄마가 장 보고 돌아올 때까지 이 데이터의 outlier를 모두 골라놓으렴.
35 엄마가 자꾸 한 말 또하고 또하고 하는 것은 나이가 들어서 그렇단다. 지겨울 땐 @d_ijk_stra 를 못살게 굴면 뭔가 새로운 게 나올지도 몰라.
36 엄마가 빈도주의자(frequentist)인지 베이지언인지 궁금해하는 사람들이 있는데, 엄마는 먹고사니지언이란다...
클라이언트가 기뻐할 수 있는 기법이라면 뭐든 쓸 수 있지! 니 분유값 대려니 어쩔 수 없었다. 기계학습 연구자들이 우리 파에
속한단다.
37 엄마가 베이지안하고 사이좋게 지내라고 했니 안했니!?
38 엄마가 문제를 하나 낼게. X1, X2,
X3이 각각 평균이 Y1, Y2, Y3이고 분산은 모두 1인 정규분포를 따른단다. X1, X2, X3이 모두 독립일 때, Y1,
Y2, Y3을 추정해 봐. 쉬운 듯 싶으면서도 아리송하지?
39 엄마가 메져 이론을 좋아하는 건 괜히 연속 분포인 경우와 이산 분포인 경우를 나누어 두 번씩 식을 유도할 필요가 없기 때문이란다. 그래서 분량은 절반으로 줄었는데 이상하게 독자도 절반으로 줄더구나.
40 엄마가 매를 때리는 횟수는 사실 Robbins-Monro 알고리즘에 의해 결정된단다.
41 엄마가 노래 한 곡 뽑아 볼게! 구멍난 코드에~ 메모리가 흘러 넘쳐~ 잡아보려 해도~ GDB를 실행 해도~ 손가락 사이로
빠져나가~ 아차, 이건 옆집 아줌마 @umma_coding_bot 18번인데 실수했구나. 그래도 엄마도 코딩 좀 했단다.
42 엄마가 prior를 고르는 비밀은 며느리도 모른단다!
43 엄마가 kaggle competition에 나가지 않는 것은 deep learning이 더 주목을 받을 수 있도록 양보해 주기 위해서란다.
44 엄마 말은 asymptotically 모두 옳고, convergence rate까지 얘기해줄 수 있다마는, 그렇다고 해서 '오늘' 옳은 판단을 내릴 수 있는 것은 아니란다. 그건 내일도 마찬가지고...
45 엄마 말씀은 오러클보다 진실에 더 빨리 수렴한단다.
46 엄마 말 잘 들으면 자다가도 p < 0.01 별이 뜬단다. 물론...
47 어머나, 다이너마이트 플랏이다! 피해~~~~~~~~~~~!
48 얘, 잠깐 와서 설문조사 좀 하고 갈래? http://www.surveymonkey.com/s/2LY9669 어떤 사람들이 엄마 얘기를 즐겨 듣는지 궁금해서 그래. 엄마는 트위터에서도 통계 분석을 멈추지 않는단다!
49 아이구, 얘 됐다. 엄만 나이가 들어서 그런지 영 알인지 달걀인지는 잘 모르겠구나. 엄마는 포트란이면 괜찮으니 엄마 걱정 말구 니 일이나 해.
50 아까 낮에 선생님께서 전화하셨는데 너 k-means를 하면서 k-means++를 쓰지 않았다던데... 그게 정말이니...?
엄마가 너를 어떻게 키웠는데... 니가 이럴 수가 있니... 그냥 초기값만 바꿔주면 되는 알고리즘을... 어머, 현기증 나...
51 아가, 여기 와서 이 Q-Q 플랏을 좀 봐줄래? 이제 눈이 침침해서인지 영 요게 직선인지 모르겠구나.
52 아, 오늘같이 오슬오슬 추운 날은 그냥 이 Markov blanket을 덮고 푹 자면 세상 만사로부터 자유로워질 수 있단다. ...너희들이 간식 해달라고 자꾸 깨우지만 않는다면 말이지.
53 심슨의 역설을 쉽게 가르쳐 줄게! 니가 형보다 많이 맞는다고 해서 꼭 엄마가 불공평하다 할 수 있는 건 아니란다. 맞을
짓을 했을 때 맞는 확률은 너보다 네 형이 더 높아도, 네가 맞을 짓을 훨씬 더 많이 한다면 매 맞는 수는 네가 더 높아지는
거지.
54 수학자들이 if A then B를 연구한다면 통계학자들은 if A then probably B를 연구하지. 하지만 응용 분야에선 보통 앞의 if A then은 쏙 빼먹고 B therefore B'! 라고 결과를 발표한단다.
55 솔직히 수리통계학에 대한 지식 없이는 회귀분석이나 ANOVA 같은 응용통계의 도구들을 '이해'할 수 없단다. 그런데 보통 응용통계부터 먼저 배우기 때문에 이해보다 암기에 급급해 통계에 대한 흥미를 잃곤 하는 것 같구나.
56 선형대수학에 대한 이해 없이 회귀분석을 공부하는 것은 for 문 없이 C 프로그래밍을 하는 것과 같단다.
57 상관관계와 인과관계를 구분하지 못하는 애는 결혼 상대로 데려올 꿈도 꾸지 말도록 하렴.
58 사실 트윗에 영어로 된 통계 용어를 너무 많이 쓰는 것 같아, 요즘은 좋은 한국어 표현이 있는지 꼭 찾아본단다. 그런데
엄마가 exponential family에 갖고 있는 포근한 이미지에 비해 '지수족'은 뭔가 무서운 느낌이 들더라구..
오들오들..
59 사실 M-estimator는 Mom-estimator의 준말이란다. 엄마 말이 다 옳다는 것을 이제 알겠지?
60 빅데이터란? R에서 안 돌아가면 빅데이터란다. 별다른 툴 설치하지 않고...
61 분류(classification) 분석 문제를 만났을 때 로지스틱 회귀분석을 하면 통계학자, 서포트 벡터 머신을 쓰면 기계학습자, 그리고 의사 결정 나무를 쓰면 데이터 마이너란다.
62 베이즈 정리를 쓴다고 베이지안인 건 아니란다. 베이즈 정리는 중요하고, 베이지언 통계도 중요하며, 베이지언 통계는 베이즈 정리를 쓰지만, 베이즈 정리가 중요하기 때문에 베이지안이 중요한 건 아니지...
63 뭐? 애인이랑 여행을 가겠다고? 코시 분포의 평균 구하는 소리 하고 있구나.
64 뭐...!? 요즘 하는 트윗을 보면 엄마통계봇이 아니라 엄마기계학습봇 아니냐고...!? 너 어쩜 엄마한테 못하는 소리가 없니! 응? 대세에 맞춰 엄마데이터사이언스봇이 되라고?? 너 당장 집에서 나가!
65 뭐, 니가 empirical Bayesian이라고? 그럼 엄마는 theoretical Bayesian이란 소리니??
66 몇 대 맞을지를 기하분포와 푸아송분포 중 무엇에서 고를래? 기대값은 같단다.
67 러시아에선 prior가 베이지안을 고른단다.
68 느이 할아버지가 좀 대단하신 분이긴 하지만, 엄마와 아빠가 주어진 이상 할아버지와 너는 조건부 독립(conditionally independent)이란다. 즉 넌 망했지...
69 눈 크게 뜨고 잘 보렴. 이 scatterplot에는 10억개의 점이 찍혀 있단다.
70 네가 태어나기 전, 엄마는 Bernoulli로, 아빠는 Pareto로 이름을 바꾼 후 네 이름은 Poisson이라 지어 exponential family가 되어볼까 한참 고민했단다.
71 네가 엄마 생일선물을 사온 걸 보면 precision도 recall도 형편없구나...
72 네가 어제 분류 정확도가 90%라고 자랑했었지? 오늘 엄마가 데이터를 들여다 보니 데이터 레이블의 비율이 99:1이더구나...
73 네가 어떻게 태어났냐고? 오러클(oracle)이 물어다 줬단다.
74 네 하드의 사용 용량은 음란 동영상 용량을 추정하기 위한 completely sufficient statistic이란다.
75 네 컴퓨터의 하드 디스크 사용량과 네 방 크리넥스의 사용량 사이에 아주 강한 상관관계가 발견되었다.
76 네 수학 객관식 성적을 피어슨 카이 스퀘어 검정으로 분석해 본 결과 니가 모든 문제를 다 찍었다는 귀무 가설을 기각할 수 없었단다. 다음 시험에도 성적이 이 모양이면 p-value 곱하기 백 대만큼 맞는다!
77 네 성적이 submartingale인지 supermartingale인지 엄마는 요새 고민중이란다.
78 네 방은 exponential family 같아. 잠자고 게임하기 위한 조건을 만족하면서 엔트로피를 최대화하고 있구나.
79 네 Metropolis Sampler의 acceptance rate가 100%라는 소문이 있던데 설마... 아니겠지? 엄만 우리 아가를 믿어요.
80 넌 왜 쌍둥이로 태어나지 않은 거니!? 그랬으면 A/B test를 할 수 있었을 텐데...
81 너희 형제는 Dirichlet Distribution과 Multinomial Distribution 처럼 항상 서로 잘 어울리며 돕고 살아야 한다!
82 너희 삼형제의 소득은 앙상블해 봐도 썩 답이 안 나오는구나...
83 너를 낳기 전엔 엄마도 라플라스 분포처럼 아주 날렵했는데 이젠 가우스 분포처럼 몸매가 퍼지고 말았구나.
84 너 이리 좀 와 보렴. 니! (찰싹) 눈엔! (찰싹) 이게! (찰싹) 정규! (찰싹) 분포로! (찰싹) 보이니!
85 너 오늘 변덕이 마치 다중공선성(multicollinearity) 높은 데이터에서 회귀계수(regression coefficient) 오르락내리락 하듯 하는구나!
86 내 추정치의 비대칭도(skewness)를 아무에게도 알리지 마라...!
87 내 자식이 카테고리가 50개인 빈도 데이터를 파이 차트로 그리다니... 엄마를 잠시만 혼자 있게 해주렴. 시간이 필요하단다.
88 까마귀의 이륙과 배의 낙하 사이에 대한 상관관계를 검증해 보니 5% 유의 수준에서 상관관계가 없다는 귀무가설을 기각할 수
있었단다. 그러나 엄마의 이 연구는 다음날 신문 1면에 <까마귀 날자 배 떨어져>로 보도되었지.
89 기뻐하렴, 엄마의 논문이 Anals of Statistics에 실리게 되었다는 소식이란다! 음...!?
90 그러고 보니 엄마는 R을 안 쓰는데 프로필 사진이 알이로구나! 내일까지 하나 그려오도록 해라.
91 구글러들은 구글 플러스에서 놀고 베이지안들은 베이지안 네트워크에서 논단다.
92 가만 보자, 하나 두울 세엣 넷... 어, 어디까지 셌더라? 요즘은 정신이 가물가물 해서 몇 개까지 가설검정을 했는지 영 헷갈리는구나. p-value 계산해야 하는데...
93 Singular Value Decomposition이 학계에서 앞으로 몇번이나 더 재발견될지 궁금하구나. 2013년인 지금도 현재진행형이지...
94 R을 쓰면 통계학자, MATLAB을 쓰면 기계학습자란다. 이제 'A면 통계학자', 'B면 기계학습자' 시리즈도 꽤 많아졌구나. 그런데 결정론적인 주장이라 마음에 들지 않는다. 이제 슬슬 로지스틱 회귀분석으로 넘어가야겠지??
95 LDA를 보고 Linear Discriminant Analysis를 떠올리면 통계학자, Latent Dirichlet Allocation을 떠올리면 기계학습자란다.
96 KL(p||q)를 쓸 것이냐, KL(q||p)를 쓸 것이냐, 그것이 문제로다. -엄마, variational inference를 고민하며
97 George E. P. Box는 모든 모형은 틀렸다(All Models are Wrong)고 말했지. 하지만 엄마 말은 모두 옳단다!
98 Chinese Restaurant Process와 Indian Buffet Process에 이어 엄마가 Korean BBQ Process를 제안했지만 안타깝게도 식품위생법에 걸려 논문이 리젝됐단다.
'다이어리 > 다이어리' 카테고리의 다른 글
학교에 있는 컴퓨터들 다 덤벼 (0) | 2014.09.06 |
---|---|
환각 (0) | 2014.09.04 |
아이디어는 서브밋하기 전 까지는 숨겨야 한다는 조언을 들었다. (0) | 2014.08.30 |
(제목 없음) (0) | 2014.08.30 |
시비를 걸었다. (0) | 2014.08.29 |
충남대학교 경제학과 홍성표 교수님, 그가 썼던 논문들 (0) | 2014.08.29 |
이젠 나도 모르겠다. (0) | 2014.08.21 |
(제목 없음) (0) | 2014.08.17 |
집이 이사를 간다. (0) | 2014.08.12 |
절대로 속으면 안되는 키워준다 드립 (내용 없음) (0) | 2014.08.12 |