Lecture 4
lecture 3 복습 softmax function 은 무엇인가 linear classification output 큰 것을 그냥 쓸수있는데 unbound 되어있다. 그냥 큰것을 고르는것보다 확률적으로 해석하기 위해 사용한다. loss function 은 무엇인가? quantify how good or bad this prediction optimization loss 를 줄이는 방향으로 현재 시점에서 모든 파라미터 미분을 하면서 내려가는 부분 왜 완벽하지 않은가?