๊ฐํํ์ต์ผ๋ก ๋ง๋ ์ด์ ๋์น๋ ๋ถ๋ค๊ณผ ํจ๊ปํ๋ Study Group BNM2h ์
๋๋ค.
โ๋น(B)๊ฐ์ค๋ โ๏ธ๋(N)์ด์ค๋ ๐ ๋งค(M)์ผ โณ2(h)์๊ฐ ๊ฐํํ์ต๊ณผ ํจ๊ป!
๊ณต๋ถํ๋ฉด์ ๊ธฐ๋ก์ ๋ชฉ์ ์ผ๋ก Repository๋ฅผ ์ ํค์๋๊ฐ๋ณด๋ ค๊ณ ํฉ๋๋ค.:seedling:
Reinforcement Learning์ ๊ธฐ๋ณธ ์๊ณ ๋ฆฌ์ฆ๋ค์ ๊ณต๋ถํ๋ฉฐ ์์ฑ๋ code๋ค์
๋ง์ reference๋ค๊ณผ ์ฑ
๋ค์ ์ฐธ๊ณ ํ์ฌ Pytorch๋ก ์์ฑ๋์์ต๋๋ค.
๋ง์ ์์๊ณผ ๊ด์ฌ ๋ถํ๋๋ฆฝ๋๋ค:blush:
- @curieuxjy
- @Rackhun
- @11wooa
- @jeongeun980906
- @LeejwUniverse
ํ์ดํ์ ๋ฐฉํฅ์ ์คํฐ๋ ์์ ์ ๋๋ค.
| Algorithm | Thanks to | Code | Paper |
|---|---|---|---|
| DQN | - | - | - |
| REINFORCE | - | - | - |
| A2C | @Rackhun | code | paper |
| A3C | - | - | - |
| DDPG | @LeejwUniverse | code | paper |
Study์์ ๊ณต๋ถํ ์์๋๋ก ์์ฑ๋์์ต๋๋ค.
| Name | ์ ์ | ์ถํ์ฌ | Github link | Duration |
|---|---|---|---|---|
| PyTorch๋ฅผ ํ์ฉํ ๊ฐํํ์ต/์ฌ์ธต๊ฐํํ์ต ์ค์ ์ ๋ฌธ | ์ค๊ฐ์ ์ ํ๋ก ์ง์/์ฌํจ์ญ ์ฎ๊น | ์ํค๋ถ์ค | github | 2020.02.23~2020.03.31 |
| ์ํ์ผ๋ก ํ์ด๋ณด๋ ๊ฐํํ์ต ์๋ฆฌ์ ์๊ณ ๋ฆฌ์ฆ | ๋ฐ์ฑ์ ์ง์ | ์ํค๋ถ์ค | github | 2020.03.31~ |
Thanks to GOOD repositories!

