그냥 뜬금없이 드는 생각인데
이왕 쓰는 실험용 데이터라면, 조금 더 우리에게 가까운 데이터를 써보는건 어떨까?
가령 비전 분야에서 Lenna 사진 보다는 위안부 소녀상 사진을 이용한다던지,
자연언어처리 분야에서 spam mail 분석보다는 Human rights in North Korea에 대해 다룬다던지...

1.
근데 써놓고나서 구글링 조금 해보니 생각보다 이런 분석은 많이 이루어지고 있네. human rights에 대한건 OECD에서 매년 발표하는 보고서가 있는 것 같다. 내가 자주 참고했던 regression 책은 air pollution에 관한 데이터 가지고 책의 절반 이상 분량의 챕터를 넘나들며 지지고 볶고 하고 있고...

2.
근데 어찌보면 정치적일수도 있어서 안하는게 나을지도 모르겠다. 야구 데이터, Lenna 사진같은건 많은 사람들이 그냥 재밌게 받아줄 수 있고, spam mail 같은건 누구나 불편함을 공감하는 소재이지만
순수하게 연구 성과를 어필하고자 하는데 위안부 소녀상, human rights 이런 이야기를 꺼내면, 누군가는 불편해질 수 있고, 그러다보면 원래 연구의 취지를 벗어난 싸움이 일어날 수도 있어서...

3.
결론은, 뭔가 큰 뜻을 품은게 아니라면, 나 같은 소심한 속물은 절대 그러면 안되는 것 같기도 하다.

#결론은내가속물이다


+ Recent posts