토픽의 수명을 추정하려는 연구를 진행중인데
뉴스를 크롤링하려 했더니, 크롤링 시간이 너무 오래 걸려서 arXiv로 시선을 돌렸더니, arXiv API 진짜 만세다.


첨부한 그림은 arXiv 시작일(1991년)부터 지금까지, arXiv에 등재된 논문 중 title에 "Bayesian"이라는 단어가 포함된 것을
일별, 월별, 연별로 count한 것이다.
뉴스 크롤링은 언제 끝날지 기약없이 돌고 있는데, arXiv를 이용한 이 그림은 그리는 데 20분도 안걸렸다.
(물론 Bayesian이라는 단어가 너무 common word라서 20분 씩이나 걸린거지만, 좀 specific한 단어를 선택하면 그냥 순식간에 된다. 가령 "author:YooGeun Song"이라는 쿼리를 날린다던지...)
이제 그냥 수식에만 집중하면 된다.
만세!

+ Recent posts