토픽의 수명을 추정하려는 연구를 진행중인데
뉴스를 크롤링하려 했더니, 크롤링 시간이 너무 오래 걸려서 arXiv로 시선을 돌렸더니, arXiv API 진짜 만세다.
첨부한 그림은 arXiv 시작일(1991년)부터 지금까지, arXiv에 등재된 논문 중 title에 "Bayesian"이라는 단어가 포함된 것을
일별, 월별, 연별로 count한 것이다.
뉴스 크롤링은 언제 끝날지 기약없이 돌고 있는데, arXiv를 이용한 이 그림은 그리는 데 20분도 안걸렸다.
(물론 Bayesian이라는 단어가 너무 common word라서 20분 씩이나 걸린거지만, 좀 specific한 단어를 선택하면 그냥 순식간에 된다. 가령 "author:YooGeun Song"이라는 쿼리를 날린다던지...)
이제 그냥 수식에만 집중하면 된다.
만세!
'다이어리 > 다이어리' 카테고리의 다른 글
급하게 대전에 왔다가 올라가는 길. (0) | 2016.06.10 |
---|---|
I got an award. (0) | 2016.06.10 |
조별 과제의 폐해 (0) | 2016.06.08 |
(제목 없음) (0) | 2016.06.05 |
결국나는로봇이아니다 (0) | 2016.06.04 |
상식적으로 나도 로봇이 아니니까 (0) | 2016.06.03 |
이번 주말 만큼은 잠을 잘 수 있겠지? (0) | 2016.06.03 |
생각해보니, 종속변수가 non-negative이면 통상적인 선형모형을 적용하면 안되겠구나. (0) | 2016.05.30 |
진심으로 1주일 넘게 잠을 제대로 자지 못하고 있다. (0) | 2016.05.30 |
비판적인 생각을 하며 방어기제를 온전하게 갖고 있는 것은 좋아보인다. (0) | 2016.05.29 |