사실 나는 데이터시각화 연구실에 있으면서도, 시각화 공부보다는, 다른 공부를 더 많이 하는 편이다. (오히려 통계학 전공이었던 석사 때 보다도 더 어려운 통계학 공부라던지, 당시에 못했던 공부를 보충하던지 하고 있는 경우가 많다.)
데이터 시각화와 통계학은 올바른 정보를 전달해주고자 한다는 공통 목표가 있는데, 시각화와 비교했을 때는 통계학이 훨씬 진입장벽이 높은 편이기 때문에, 그만큼 시간도 많이 투자하게 되는 것이다.
이렇게 공부하다보면, 시각화 분야에서 못하는 일을 통계학에서 하는 경우가 무척 많고, 또 그 반대가 되는 경우도 무척 많아서, 조인시키기가 수월해진다.
다만 같은 맥락으로, 왜 이런 어려운 분석을 해야하는지를 시각화 연구자들에게 어필할 때는 어려움을 겪곤 한다. 통계학 연구자들에게 새로운 시각화 방법을 제시하면 무척 재미있어하지만 말이다.

어제 나는 Qualcomm Innovation Award 수상자로서 연구 경과 발표를 했고, 내용은 "Bayesian Non-parametric Cox-regression을 이용한 Topic의 수명 추정"이었다.
Topic에 대한 Synthetic Data를 만들지 못했기 때문에, real data로만 적합한 결과를 보여주었는데,
Qualcomm Korea 사장님이 굉장히 재밌게 보셨는지, 쉬는 시간에 따로 나를 찾아오셔서 여러가지 질문을 하시곤 했다.
물론 잘 답변해드리고, 덕분에 인사도 나누고 했지만, 사실 속으로는 맨 처음 하셨던 질문이 너무 뼈아팠다.
"그래서, 그게 다른 데에서도 topic의 수명을 잘 맞추나요?"
처음부터 어떠한 상태의 데이터를 활용해야하는지, 그에 따른 정확도는 어땠는지를 평소처럼 synthetic data를 이용해서 잘 보여주었다면, 나오지 않았을 질문이었기 때문이다.
.
뭐 이미 상은 받았고, 경과 발표 잘 끝났으면 했던거라, 결국은 잘 끝났으니 되었다만
찜찜한 기분은 어쩔 수 없다. 학회에는 이런 정도로만 갖다 내서는 안된다고 생각한다.
내가 발표한거지만, 내가 그렇게 허술하게 결과를 마무리지은걸 용서할 수 없다. 


1.

n > 1, n ≥ k인 a_1^k + a_2^k + ... + a_n^k = b^k는 성립하지 않는다는 오일러 추측 (Euler's sum of powers conjecture)을 k = 5일때 컴퓨터 연산을 통해 반증한 논문





2.
본문에 있는 단어가 "can" 하나만 있다.


요즘 진지하게 수학 분야 연계전공을 고민하고 있다. 우리 학교에는 금융공학 연계전공이 수학 박사 과정과 연계되고 있다. 전필과목은 확률론 1, 2, 확률과정론, 확률론특수연구. 이름은 "금융공학"이지만, 금융분야가 아닌 과목들을 들으면서 커버하는 것도 가능하다.
전공을 하면, 억지로라도 힘들게 공부할 수밖에 없게 되니 어떻게든 남는게 많을 수 있다는 장점이 있지만
한 학기만 더 다니면 코스웍이 끝나가는 마당에, 연구시간을 챙길 생각을 안한다는 부정적인 생각도 든다.
무엇보다도, 꼭 수업을 듣는 것만이 공부는 아니기 때문에, 연구 성과를 만들어가는데 박차를 가해야하는 내게는 오히려 쥐약이 될 수도 있다.
온전하게 이수한다면 수학박사 학위도 수여받을 수 있는데, 난 공부를 더 잘 할 수 있는지가 중요하기 때문에, 학위를 받는지 여부는 고려사항이 아니다.
학기 끝날 때 까지 고민해보자. 현명한 판단을 할 수 있게 되면 좋겠다.

+ Recent posts