본문 바로가기

Programming Project/cs231n

(3)
cs231n assignment를 위한 numpy 함수들 정리 아직 assignment 1 까지만 커버되고 2 3 용은 충분히 둘러보지 못했어요. 그치만 아래 함수들만 가지고도 기본적인 부분은 충분히 커버 될 것 같아요. 힘든 함수를 써야하면 assignment에 HINT!! 라고 되어 있으니까 그부분 참고하시면 좋지 않을까 싶습니다. 기본 함수들 * 과 dot matrix a와 matrix b가 있다고 하자 이때, a*b는 element-wise product를 반환하며, a.dot(b) 혹은 np.dot(a,b)는 둘간의 내적을 반환한다. linalg.norm (norm 구해주는 함수) numpy array of shape (DY, D) 가 있고 (이 변수는 X) numpy array of shape (DX, D) 가 있고 (이 변수는 X_train) X와 X_..
Deep Reinforcement Learning 정리 노트(cs231n 참고) 이 글은 cs231n보면서 같이 보시면 도움이 되실 것이에오! 유튜부 말구 참고한 링크 https://www.slideshare.net/CurtPark1/dqn-reinforcement-learning-from-basics-to-dqn https://www.popit.kr/torch-dqn-%EA%B0%95%ED%99%94%ED%95%99%EC%8A%B5-%EC%86%8C%EA%B0%9C/ agent 가 environment와 상호작용하면서 reward를 얻어내는 방식을 구현하려 한다. 목표는 어떻게 하면 reward를 최대화 하는지 공부하는 것이다. 글의 순서는 위와 같다. RL이 뭔지 배우고, Markov Decision Process에 대해 배우고, RL 알고리즘의 두개의 주된 알고리즘인 Q-Lea..
Variational Autoencoder (VAE) 설명 (cs231n 참고) 기존 강의는 pixelCNN의 설명부터 시작한다. VAE는 intractable한 (조절이 까다로운?) latent(잠재) vector z에 대한 density function을 알아내려 한다. 다만 바로 직접적으로 모델을 학습시킬 수는 없고, 대신 likelihood 의 lower bound를 derive and optimize한다고 써있는데 아래에서 더 자세히 알아보도록 하자. 우선 VAE의 배경이 되는 Autoencoder는 data를 만들어내기 위하여 사용하지 않고, label 되어있지 않은 트레이닝 데이터로부터 lower dimensional feature을 unsupervised learning을 통해 배운다. input data x가 있고 이 데이터로부터 feature z를 생성하도록 Enc..