사실 데이터를 모델에 막 때려넣어보는 모습은 딥러닝에서만의 이야기는 아니다.
데이터가 전혀 연속적이지 않은 데도 그걸 회귀분석을 한다던지 하는 일은, 누구나 학부 때 한 번 쯤은 실수해봤을 것이다. 그리고 놀랍게도, 최근에 산업공학과 대학원 수업 발표 수업에 참여하면서 보니, 이런 일이 대학원생한테서도 종종 발견되었다.
그리고 특정 가구에서의 담배 관련 총지출은 담배 가격이 비슷비슷하니 그냥 평균적인 담배 가격으로 스케일링하면 된다던지 (실제로는 안비슷하다), 근 25년동안에 산업구조가 정체되어 있을 것이라던지 하는 근거없는 가정을 들이밀기도 하고 말이다. 물론 더 어려운 분석을 하기 위한, 가정으로 떡칠을 한 시작을 먼저 하는 것이라면 동의하지만 말이다.
.
탐색적 방법도 좋고, 데이터마이닝도 좋고, 기계학습도 좋고, 딥러닝도 좋지만, 애초에 데이터를 엄밀히 살펴보지도 않고, 충분히 고민하지도 않고, 무엇보다도 그 방법을 사용하는 이유를 충분히 찾지 않고 그냥 때려넣으면 그건 아무 소용이 없다.
설마 "아 몰랑 기계가 알아서 하겠지." 하고 생각하는건 아니겠지?

+ Recent posts