그냥 뜬금없이 드는 생각인데
이왕 쓰는 실험용 데이터라면, 조금 더 우리에게 가까운 데이터를 써보는건 어떨까?
가령 비전 분야에서 Lenna 사진 보다는 위안부 소녀상 사진을 이용한다던지,
자연언어처리 분야에서 spam mail 분석보다는 Human rights in North Korea에 대해 다룬다던지...
1.
근데 써놓고나서 구글링 조금 해보니 생각보다 이런 분석은 많이 이루어지고 있네. human rights에 대한건 OECD에서 매년 발표하는 보고서가 있는 것 같다. 내가 자주 참고했던 regression 책은 air pollution에 관한 데이터 가지고 책의 절반 이상 분량의 챕터를 넘나들며 지지고 볶고 하고 있고...
2.
근데 어찌보면 정치적일수도 있어서 안하는게 나을지도 모르겠다. 야구 데이터, Lenna 사진같은건 많은 사람들이 그냥 재밌게 받아줄 수 있고, spam mail 같은건 누구나 불편함을 공감하는 소재이지만
순수하게 연구 성과를 어필하고자 하는데 위안부 소녀상, human rights 이런 이야기를 꺼내면, 누군가는 불편해질 수 있고, 그러다보면 원래 연구의 취지를 벗어난 싸움이 일어날 수도 있어서...
3.
결론은, 뭔가 큰 뜻을 품은게 아니라면, 나 같은 소심한 속물은 절대 그러면 안되는 것 같기도 하다.
#결론은내가속물이다
'다이어리 > 다이어리' 카테고리의 다른 글
내가 풀었던 문제를 되짚어보고 있는데 왜 오답인지 모르겠다. (0) | 2016.05.10 |
---|---|
엄청 열심히 했는데 이 결과는 뭐지 싶었는데 (0) | 2016.05.09 |
왜 딥러닝은 모델을 학습한 뒤 그 결과를 바탕으로 성능만 이야기하고, 모델 자체에 대한 검정을 이야기하는 경우는 찾기 힘든걸까? (0) | 2016.05.08 |
의료 분야와 접목한 시각화 분야에서, 문제를 디자인하는 방법을 정립하는 것이 잘 안되고 있는 것 같이 느껴져서 좀 심각해졌다. (0) | 2016.05.06 |
박사과정이 끝날 때까지 이랬으면 좋겠다. (0) | 2016.05.04 |
그래도 cs 데이터들은 parametric 방법들로만 분석하면 안된다. (내용 없음) (0) | 2016.04.30 |
진작 이해했으면 얼마나 좋았을까 하는 아쉬움과, 이제는 이해가 되서 좋다는 느낌이 동시에 들어서 마음이 복잡하다. (0) | 2016.04.26 |
요 며칠 핫식스만 마시면서 무리했어서 그런지 온 몸에 근육통이 장난 아니다. (0) | 2016.04.26 |
미친듯이 cheating sheet을 만들다보니, 그냥 이걸로 공부가 된다. (0) | 2016.04.25 |
삼십몇만원짜리 계산기 두드려보니 신세계였다. (0) | 2016.04.24 |