딥러닝 학습 순서 요약

728x90

1. 좋은 weight를 찾는 것이 우리의 목표입니다. 그래서 처음에는 랜덤한 값을 넣습니다.

2. 그리고 나서 데이터를 넣고 예측을 하게 됩니다.

3. 당연히 처음에는 예측을 못합니다.

4. 정답이랑 비교해서 얼마나 예측을 못했는지 Loss 함수를 통해 Loss라는 계산값을 얻습니다.

5. Loss를 계산 했는데, 엄청 못하는고만 ~ 이것을 알았습니다.

6. 덜 못하게 만들어야 하는데, 그러면 weight를 바꿔야 합니다.

7. 어떻게 바꿀꺼야? 미분을 해서 바꾼다.

가중치를 어떻게 업데이트할지 결정하기 위해, Loss를 가중치에 대해 미분(gradient)을 합니다.
이 미분값을 이용해 가중치를 업데이트합니다.
이 과정은 "Gradient Descent(경사 하강법)"이라 불리며, 여기서 LR은 학습률(Learning Rate), G는 Gradient입니다.
업데이트 식은 가중치에 기울기(gradient)를 학습률만큼 곱한 값을 빼주는 형태입니다.

8. W(new) = W(old) - LR * G

위의 식에서 새로운 가중치(Wnew)는 이전 가중치(Wold)에서 학습률(LR)과 기울기(G)를 곱한 값을 빼는 방식으로 업데이트됩니다. 이 과정을 반복하여 Loss가 최소화되는 최적의 가중치를 찾아갑니다.

728x90

딥러닝 프레임워크 추천 (1)	2023.01.01
딥러닝 이란? (1)	2022.12.30
딥러닝은 학습을 어떻게 할까? (1)	2022.02.20
인공신경망 - ANN (Artifical Neural Network) 그리고 딥러닝 이란? (0)	2022.02.20

티스토리툴바