얼마전에 Pattern Sequence based Forecasting 방법에 앙상블을 적용한 페이퍼에 대해 리뷰를 할 때, Strong Reject로 scoring을 한 적이 있었다.
그 때 그렇게 scroing을 한 이유는 다른 이유였지만, 사실 차마 리뷰에 쓰지 않았던 것이 하나 있었는데, 앙상블을 적용하면 안될 상황에 적용했다는 비평도 할 수 있었다는 느낌을 그 페이퍼로부터 받았었었다.
앙상블이 사실 늘 좋은 결론을 내뱉어준다는 것이 상식처럼 되어있고, 사실 나도 어느 한 프로젝트에서 앙상블을 적용하고 있긴 하지만
사실 계속 그 리뷰했던 페이퍼를 떠올리곤 하면서, 모델이 전부 다른 전제 하에서 만들어졌다면, 앙상블이 항상 좋지만은 않을 수 있겠다는 생각이 든다.
물론 흔하게 알려져있는 앙상블의 단점으로, 직관적이지 않다느니 해석이 어렵다느니 하는 단점들을 교과서에서 보기도 했지만,
나는 그런 얘기를 하려는게 아니라, p-hacking에서와 같은 재현성 이슈가 앙상블에도 나타날 수 있는거 아닌가 하는 생각이, 그 PSF 논문 리뷰 이후로 계속 머릿속에서 맴돌고 있다.

+ Recent posts