Python과 Tensorflow를 이용한 강화학습의 이해와 활용

Python과 Tensorflow를 이용한 강화학습의 이해와 활용

훈련일정	06월07일~ 06월09일
교육시간	주간(21시간) 9시~17시
훈련일수	3일
총훈련시간	21 시간
강사	김수현
강의장	비대면 온라인 교육
강의실번호	-강의실
주제명	AI(데이터사이언스)
정원	25명

교육목표

- 강화 학습의 기본 원리와 동작을 이해할 수 있다.
- 강화 학습과 관련된 수학적 이론 및 용어를 구분할 수 있다.
- 강화 학습에 사용되는 기본 알고리즘을 이해할 수 있다.
- 강화 학습 & 딥강화학습 구현 코드를 분석하고 활용할 수 있다.

교육대상

수강 대상
가. AI 제품 기획/설계/기술지원/테스팅/감리/컨설팅 관련 자
나. 강화학습 & 딥강화학습의 원리와 핵심 알고리즘을 파악하고자 하는 자
다. 강화학습 & 딥강화학습 모델을 구현하고자 하는 개발자
* 사전지식 : 파이썬 프로그래밍, 머신러닝/딥러닝 기본 지식, 딥러닝 CNN 모델 구현

신청 자격
협약기업 재직자(고용보험 납부) 및 회원사 재직자 지원가능

과정 수강 안내
1. 과정 개강/폐강 확정
개/폐강 여부는 개강 1주일 전에 확정됩니다. 추후 과정 확정 여부 및 기타 안내사항은 교육을 신청해주신 모든 분들에게 개별 안내 드립니다.
2. 교육 대기상태
교육 "대기"상태에서는 교육 승인상태가 아닙니다. 개강이 확정 된 후 교육 승인되신 분들은 교육 '확정' 상태로 변경됩니다.
3. 개강 안내
개강 안내 메일 및 문자는 개강 일주일 전에 발송됩니다.

과정 커리큘럼
가. 강화학습 기초
- 실습 환경 구축하기
- 강화학습 개념 이해하기
- MDP (Markov Decision Process) 이해하기
- 벨만(Bellman) 방정식 이해하기

나. Dynamic 프로그래밍과 강화 학습
- Grid World와 Dynamic Programming 구현하기
- Dynamic Programming 1 - 정책 이터레이션 구현하기
- Dynamic Programming 2 - 가치 이터레이션 구현하기

2일차
다. 강화학습 알고리즘 살사와 큐러닝
- 몬테 카를로 예측과 시간차 예측 이해 및 구현하기
- 강화 학습 알고리즘 살사 (SARSA) 이해 및 구현하기
- 강화 학습 알고리즘 큐러닝 (Q-Laerning) 이해 및 구현하기

라. 인공신경망을 결합한 딥강화학습 구현
- Value Function Approximation 이해하기
- 인공신경망을 결합한 강화학습 Deep Q-Networks 구현하기
- 인공신경망을 결합한 강화학습 Policy Gradient 구현하기

3일차
마. 딥강화학습 DQN 구현
- 딥강화학습 DQN 구현 1 - 카트폴 구현하기
- 딥강화학습 DQN 구현 2 - 아타리 게임 구현하기

바. 딥강화학습 Actor-Critic 구
- 딥강화학습 Actor-Critic(A2C) 구현 1 - 카트폴 구현하기
- 딥강화학습 Actor-Critic(A3C) 구현 2 - 아타리 게임 구현하기
패널티 안내
선착순으로 마감되는 교육과정일 경우 교육을 받고 싶어도 받지 못하는 분들이 계실 수 있습니다.
원활한 강의 진행을 위해 아래 경우에 패널티가 부여됨을 알려드립니다.
- 교육 당일 사전 연락없이 결석 시 (당일 No Show)
- 교육 중 사전 연락없이 이탈 시
패널티를 3번 이상 부여받은 경우 수강생은 3개월 동안 수강제한을 받습니다.
이러한 수강생이 3분 이상일 경우 재직 중이신 회사의 모든 수강생은 3개월 수강제한을 받습니다.
비대면 과정
해당 과정은 Zoom을 통한 비대면 라이브 과정입니다.
필수는 아니오나 과정 수강 시 캠 활성화 요청 드립니다.

교육내용

과정명	Python과 Tensorflow를 이용한 강화학습의 이해와 활용
강사명	김수현
기간	06월07일~ 06월09일
총훈련시간	21 시간
담당자	[성남(오리)] 031-606-9337 [가산] 02-6278-9354

태그