[Deep Learning] RNN의 구조

AI/Deep Learning

[Deep Learning] RNN의 구조

sangwonYoon 2023. 3. 24. 02:52

sequential data를 처리하기 위한 모델인 RNN(Recurrent Neural Network)에 대해 알아보자.

Sequential Model

Naive sequence model

Autoregressive model

Markov model

Latent autoregressive model

RNN (Recurrent Neural Network)

The problem of long-term dependencies

RNN 구조에서는 먼 과거에 대한 정보가 잘 고려되지 않는 문제점이 있다.

LSTM (Long Short Term Memory)

RNN 구조의 한계인 long-term dependency 문제를 해결하기 위해 등장했다.

previous cell state

cell 밖으로 나가지 않는 정보이다.

이전 time step의 정보들을 요약해서 가지고 있다.

previous hidden state

직전 timestep의 output이다

forget gate

previous cell state에서 어떤 정보를 버릴지 결정한다.

input gate

cell state에서 보존할 정보를 결정한다.

output gate

업데이트된 cell state로 output을 만든다.

GRU (Gated Recurrent Unit)

2개의 gate(reset gate, update gate)만을 이용해 LSTM에 비해 단순해진 아키텍쳐이다.

cell state 없이, hidden state만 존재한다.

저작자표시 (새창열림)

'AI > Deep Learning' 카테고리의 다른 글

[Deep Learning] LSTM을 직접 구현해보자! (0)	2023.03.29
[Deep Learning] modern CNN의 특징 (0)	2023.03.24
[Deep Learning] Regularization (0)	2023.03.21
[Deep Learning] 최적화 기법 (0)	2023.03.21
[Deep Learning] 모델 최적화를 위한 중요한 개념들 (0)	2023.03.21

현재글[Deep Learning] RNN의 구조

선한 영향력을 나누는 지속 가능한 개발자가 되기 위해 공부중입니다.

LSTM, 논문 리뷰, 부스트캠프 AI TECH, 판다스, pandas, 부스트캠프, pytest, Andrew Ng, github, airflow, pytorch, mojo, 파이썬 테스트, github actions, prompt engineering, 넘파이, 파이썬, 부스트캠프 AI Tech 5기, numpy, 네이버 부스트캠프,

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

지식을 나누면 두배로