사실 데이터를 모델에 막 때려넣어보는 모습은 딥러닝에서만의 이야기는 아니다.
데이터가 전혀 연속적이지 않은 데도 그걸 회귀분석을 한다던지 하는 일은, 누구나 학부 때 한 번 쯤은 실수해봤을 것이다. 그리고 놀랍게도, 최근에 산업공학과 대학원 수업 발표 수업에 참여하면서 보니, 이런 일이 대학원생한테서도 종종 발견되었다.
그리고 특정 가구에서의 담배 관련 총지출은 담배 가격이 비슷비슷하니 그냥 평균적인 담배 가격으로 스케일링하면 된다던지 (실제로는 안비슷하다), 근 25년동안에 산업구조가 정체되어 있을 것이라던지 하는 근거없는 가정을 들이밀기도 하고 말이다. 물론 더 어려운 분석을 하기 위한, 가정으로 떡칠을 한 시작을 먼저 하는 것이라면 동의하지만 말이다.
.
탐색적 방법도 좋고, 데이터마이닝도 좋고, 기계학습도 좋고, 딥러닝도 좋지만, 애초에 데이터를 엄밀히 살펴보지도 않고, 충분히 고민하지도 않고, 무엇보다도 그 방법을 사용하는 이유를 충분히 찾지 않고 그냥 때려넣으면 그건 아무 소용이 없다.
설마 "아 몰랑 기계가 알아서 하겠지." 하고 생각하는건 아니겠지?
'다이어리 > 다이어리' 카테고리의 다른 글
발표 준비중 (0) | 2017.01.02 |
---|---|
이게 뭐야. (0) | 2017.01.02 |
연구스럽지 않은건 잘 안가지만, 이건 가봐야징. (0) | 2017.01.02 |
신이 만들지 않은 데이터는 어지간해선 parametric하지 않아요. (내용 없음) (0) | 2017.01.02 |
물론 이렇게 거창하게 얘기 안해도, 그동안 나는 데이터 분석을 블랙박스 모형에 맡기는걸 대차게 까면서 살아오긴 했다. (0) | 2017.01.02 |
그냥 여유를 갖고 해야겠다. (0) | 2017.01.02 |
공학관 크리스마스 트리 (0) | 2017.01.02 |
요즘 Teaching Fellow로서 짧은 기초통계학 수업을 진행하는데 꿀잼이다. (0) | 2017.01.02 |
#딥러닝에아무데이터나때려넣는모습도본격적으로혼나야한다 (0) | 2017.01.02 |
데이터의 분석 가능성이 높아진다는건 좋은 현상인 것 같다. (0) | 2017.01.02 |