그냥 잡담입니다.
최근 missing 데이터를 imputation하는 과정에 대해서 정말 짧게 고민해본 적이 있었는데요.
감히, 솔직히 말씀드리면, 이게 왜 필요한걸까 하는 생각을 좀 했었습니다. 데이터는 완벽하게 수집된 것이 응당 좋으니 어떻게든 그렇게 수집하는게 좋은데 왜 이런 일을 하는 것일까?
그런데 오늘 대학원 학우에게 다른 이야기를 들었었는데요.
"데이터를 수집하는 데는 응당 비용이 들기 마련이고, 추가 수집이 어려운 상황이 있기 마련이다.
수리적으로 그 과정을 imputation한 것으로 분석하는 것이, 완벽한 데이터로 분석하는 것에 미치지 못할 수는 있어도,
어쨌든, missing이 있을 지언즉, 지금 그 데이터셋은 수집한 사람으로서는 원하는 정보를 얻기 위한 소중한 자료일 수 있다.
그 소중한 자료에게 생명을 주는 것이 imputation하는 과정일 것이다."
그 이야기를 들으니 그 분야가 달리 보이는 것 같습니다.
'다이어리 > 다이어리' 카테고리의 다른 글
최적화 알고리즘에서는, 컴퓨터를 사용해서 numerical한 방법으로 path를 하나하나 선택해나가게 되는데, 이 과정이 흡사 sampling과 같다는 느낌을 받았던 기억이 있습니다. (0) | 2014.11.10 |
---|---|
무대뽀로 생각하는 것 보다는 그래도 어느정도 최적화된 답이 있는게 좋지 않을까 하는 생각이 든다. (0) | 2014.11.09 |
다들 날 위한 걱정 싹 갖다버려. 그리고 이거나 머겅. (0) | 2014.11.09 |
가깝지만 먼 곳으로 떠나려고 보니 오히려 마음이 편해진다. (0) | 2014.11.09 |
미리 공부를 시작해도 되겠지? (내용 없음) (0) | 2014.11.08 |
경제학은 최소한의 비용으로 최대한의 효용을 창출해서, 많은 이들을 행복하게 만들 수 있는 학문이라고 생각합니다. (0) | 2014.11.08 |
정치경제학은 어떻게 공부하는 것일까? (0) | 2014.11.08 |
보통은 예측이라고 하면, (0) | 2014.11.08 |
컴파일러가 사람인줄 알고 존경해. (0) | 2014.11.07 |
욕 먹다 R 배겠다. 그래서 R User Group. (0) | 2014.11.07 |