얼마전에 Pattern Sequence based Forecasting 방법에 앙상블을 적용한 페이퍼에 대해 리뷰를 할 때, Strong Reject로 scoring을 한 적이 있었다.
그 때 그렇게 scroing을 한 이유는 다른 이유였지만, 사실 차마 리뷰에 쓰지 않았던 것이 하나 있었는데, 앙상블을 적용하면 안될 상황에 적용했다는 비평도 할 수 있었다는 느낌을 그 페이퍼로부터 받았었었다.
앙상블이 사실 늘 좋은 결론을 내뱉어준다는 것이 상식처럼 되어있고, 사실 나도 어느 한 프로젝트에서 앙상블을 적용하고 있긴 하지만
사실 계속 그 리뷰했던 페이퍼를 떠올리곤 하면서, 모델이 전부 다른 전제 하에서 만들어졌다면, 앙상블이 항상 좋지만은 않을 수 있겠다는 생각이 든다.
물론 흔하게 알려져있는 앙상블의 단점으로, 직관적이지 않다느니 해석이 어렵다느니 하는 단점들을 교과서에서 보기도 했지만,
나는 그런 얘기를 하려는게 아니라, p-hacking에서와 같은 재현성 이슈가 앙상블에도 나타날 수 있는거 아닌가 하는 생각이, 그 PSF 논문 리뷰 이후로 계속 머릿속에서 맴돌고 있다.
'다이어리 > 다이어리' 카테고리의 다른 글
그냥 내가 해서 보여줘야겠다. (0) | 2017.01.19 |
---|---|
transformation은 항상 하는 것은 아니다. 필요할 때 하는 것이다. 괜히 필요없을 때 했다가 되돌리지 않아서 정보가 왜곡되면 곤란하다. (0) | 2017.01.19 |
#여전히그렇더라도아니라고믿고싶다 (0) | 2017.01.19 |
기계학습 교과서와 통계학 교과서에서 서로 같은 이름의 무언가를 설명하고 있어도, 늘상 무언가 미묘한 차이가 있다. (0) | 2017.01.19 |
아마 이 책의 다음 개정판이 나온다면 수정될 문구가 아닐까 싶다. (0) | 2017.01.19 |
새벽 동안에 겪은 망할 결정장애. (0) | 2017.01.08 |
수학 박사 연계전공은 조금 현실적인 문제로 재고하게 되었다. (0) | 2017.01.08 |
이전처럼 거칠게 아규하진 않아도 될 것 같으니, 고집을 좀 줄여야하지 않을까 싶다. (0) | 2017.01.08 |
내가 얼마전에, 딥러닝을 공부하는 연구실 후배와 anomaly detection을 위한 statistical approach를 이야기해준 적 있었는데 (0) | 2017.01.08 |
차라리 그 블랙박스가 더이상 블랙박스가 아니게 하여, 그 결과물이 나름 옳은 결정이라고 받아들여져 사람들이 수긍까지 할 수 있게 하는 방향이 더 좋지 않은가, 나는 그렇게 생각한다. (1) | 2017.01.02 |