어떤 분석을 할 때는 어떤 제약이 있으니, 어떠어떠한 분석을 먼저 하고, 그것이 만족 되면 그 다음 본 분석을 하고...
뭐 이런게 정답이긴 한데
"어떤 분석을 하기 위해"가 아니라 "어떠한 현상이 있는지를 알기 위해, 발견하기 위해, 파악하기 위해"라고 한다면
관련된, 알고 있는 모든 분석을 다 해보는게 정말 방법일수 있겠다 싶다.
연구하는 사람이라면 정말 부지런해야겠다 하는 생각이 든다.

가령 예를 들어서, t-test를 한다고 해도, 정규성검정 여부에 얽매이지 말고, 모수적인 방법과 비모수적인 방법을 다 써보는거지. t-test, Wilcoxon test를 둘 다 해서, 둘 다 같은 결과가 나온다면 해피한거고, 그렇지 않다면 그 원인을 찾아나가야 하는거고. 그 과정에서 무언가를 알 수도 있게 될테고...

그래서인지 iris 데이터 같은 것이 SVM에서 쓰였다가 베이지안 네트워크에서 쓰였다가 클러스터링에서 쓰였다가 막 여기저기 불려다니며 난리가 나는걸테지.
하여튼 이를 위해서는 그만큼 많이 알아야 하기도 하겠지.

+ Recent posts