본문 바로가기 메뉴 바로가기

수학 프로그래밍으로 세상 보이기

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

수학 프로그래밍으로 세상 보이기

검색하기 폼
  • 분류 전체보기 (78)
    • 회의록 (0)
    • 수학&물리 (17)
    • 프로그래밍 (23)
      • DirectX12 (7)
      • OpenGL (3)
      • C# (9)
      • Unreal (4)
    • 아이디어 (0)
    • 개인폴더 (0)
      • 홍병선 (0)
      • 임현상 (0)
      • 박지혁 (0)
    • Unity (16)
    • 강화학습 (4)
    • Mesh Processing (14)
    • Book Review (2)
    • Game Review (1)
    • 개인정보처리방침 (1)
  • 방명록

ML (1)
수박 겉핥기 강화학습 - 내 머리를 강화하자 #2

이번 포스팅에서는 DQN으로 알려진 논문 Human-level control through deep reinforcement learning 논문에 대해서 리뷰하는 시간을 가져보겠습니다. 이번 포스팅에서 나오는 모든 이미지의 저작권은 위 논문의 저자에게 있습니다. Nature에 2015년에 발표된 논문이고 저자는 DeepMind의 Volodymyr Minih입니다. 제목을 보면 "Deep Reinforcement Learning을 통해 Human Level의 Control이 가능하다"라고 볼 수 있습니다. 그러면 어떤 일에서 어떤 강화학습을 통해 얼만큼 가능한지 살펴보도록 하겠습니다. 1. Introduction 강화학습은 Agent가 환경에서 어떤 행동을 해야하는지에 대해 최적화 하는 방법을 제공합니다..

강화학습 2020. 9. 18. 14:43
이전 1 다음
이전 다음
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG
  • Unreal
  • RubiksCube
  • 수학
  • 순열
  • 중복 조합
  • Mesh
  • 값 형식
  • Scriptable Render Pipeline
  • normalized device coordinate
  • DirectX12
  • Unity
  • MeshProcessing
  • 통계학
  • 중복 순열
  • collision detection
  • 경우의 수
  • RL
  • VTK
  • opengl
  • perspective projection
  • AABB
  • 루빅스큐브
  • CollisionDetection
  • Mesh Processing
  • C#
  • 조합
  • 최적화
  • 유니티
  • value type
  • 참조 형식
more
«   2025/12   »
일 월 화 수 목 금 토
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31
글 보관함

Blog is powered by Tistory / Designed by Tistory

티스토리툴바