애초에 entropy를 계산할 때 median을 이용했더라면 어땠을까 하는 생각이 든다. (물론 그 다음부터는 최적화 방법도 죄다 달라지겠지만.)
코드 description 다 써가니, 이거 다 쓰고 한 번 풀어봐야겠다.
'다이어리 > 다이어리' 카테고리의 다른 글
꼭 게임이 아니어도, 결국은 적절한 reward만 정의할 수 있다면, state가 바뀌는 상황에 대해서도 기계가 얼마든지 적응하며 좋은 결과를 내는 반복수행을 하게끔 시킬 수 있게 된다는 것이다. (0) | 2016.10.26 |
---|---|
역시 기초가 중요하다. 공감. (0) | 2016.10.26 |
그래도 이런건 안아깝다. (0) | 2016.10.26 |
딥러닝을 포함한 주류 머신러닝의 또 다른 문제는, 통계적 방법론을 갖다 쓴다고 말을 하고 있지만, 정작 에러텀을 붙이지 않고 그냥 대수적인 처리만으로 접근해서 쓴다는 데에 있다. (0) | 2016.10.26 |
강화학습 이제 어느정도 실습 해볼 수 있을만큼 공부가 된 것 같당. (0) | 2016.10.26 |
내 첫 딥러닝 관련 논문이 뭘로 어떻게 흐름을 잡아야 할지 떠오른 것 같다. (0) | 2016.10.26 |
나 혼자 어정쩡한 분석 하느니 그게 낫겠다. (0) | 2016.10.26 |
그래도 어쨌든 숙제로나마 분석해볼 기회가 온 셈이다. (0) | 2016.10.26 |
책의 추천사를 보고 진심으로 감동받은건 오랫만이다. (0) | 2016.10.26 |
마지막 문장의 근거가 무엇일까? (0) | 2016.10.26 |