[비대면] Python과 Tensorflow를 이용한 강화학습의 이해와 활용

교육일정

결과가 없습니다.

교육목표

- 강화 학습의 기본 원리와 동작을 이해할 수 있다.
- 강화 학습과 관련된 수학적 이론 및 용어를 구분할 수 있다.
- 강화 학습에 사용되는 기본 알고리즘을 이해할 수 있다.
- 강화 학습 구현 코드를 분석하고 활용할 수 있다.
- Tensorflow와 Keras 등을 이용하여 강화 학습에 사용되는 기본 알고리즘을 구현할 수 있다.

교육내용

가. 강화학습 기초
나. Dynamic 프로그래밍과 강화 학습
다. 강화학습 알고리즘 살사와 큐러닝
라. 강화학습과 인공신경망
마. 강화학습 DQN & Actor-Critic 구현 사례

교육대상

수강 대상
- AI 제품 기획/설계/기술지원/테스팅/감리/컨설팅 관련 자
- 강화 학습의 원리와 핵심 알고리즘을 파악하고자 하는 자
- 강화 학습 알고리즘을 구현하고자 하는 개발자

신청 자격
협약기업 재직자(고용보험 납부) 및 회원사 재직자 지원가능

과정 수강 안내
1. 과정 개강/폐강 확정
개/폐강 여부는 개강 1주일 전에 확정됩니다. 추후 과정 확정 여부 및 기타 안내사항은 교육을 신청해주신 모든 분들에게 개별 안내 드립니다.
2. 교육 대기상태
교육 대기상태에서는 수강에 제한이 있을 수 있습니다. 개강이 확정 된 후 교육 승인되신 분들은 교육 '확정' 상태로 변경됩니다.
3. 개강 안내
개강 안내 메일 및 문자는 개강 일주일 전에 발송됩니다.


패널티 안내

선착순으로 마감되는 교육과정일 경우 교육을 받고 싶어도 받지 못하는 분들이 계실 수 있습니다.
원활한 강의 진행을 위해 아래 경우에 패널티가 부여됨을 알려드립니다.
- 교육 당일 사전 연락없이 결석 시 (당일 No Show)
- 교육 중 사전 연락없이 이탈 시
패널티를 3번 이상 부여받은 경우 수강생은 3개월 동안 수강제한을 받습니다.
이러한 수강생이 3분 이상일 경우 재직 중이신 회사의 모든 수강생은 3개월 수강제한을 받습니다.



과정 커리큘럼

가. 강화학습 기초
- 실습 환경 구축하기
- 강화학습 개념 이해하기
- MDP (Markov Decision Process) 이해하기
- 벨만(Bellman) 방정식 이해하기

나. Dynamic 프로그래밍과 강화 학습
- Grid World와 Dynamic Programming 구현하기
- Dynamic Programming 1 - 정책 이터레이션 구현하기
- Dynamic Programming 2 - 가치 이터레이션 구현하기

다. 강화학습 알고리즘 살사와 큐러닝
- 몬테 카를로 예측과 시간차 예측 이해 및 구현하기
- 강화 학습 알고리즘 살사 (SARSA) 이해 및 구현하기
- 강화 학습 알고리즘 큐러닝 (Q-Laerning) 이해 및 구현하기

라. 강화학습과 인공신경망
- Value Function Approximation 이해하기
- 인공신경망을 결합한 강화학습 Deep Q-Networks 구현하기
- 인공신경망을 결합한 강화학습 Policy Gradient 구현하기

마. 강화학습 DQN 구현 사례
- 강화학습 DQN 구현 사례 1 - 카트폴 구현하기
- 강화학습 DQN 구현 사례 2 - 아타리 게임 구현하기

바. 강화학습 Actor-Critic 구현 사례
- 강화학습 Actor-Critic(A2C) 구현 사례 1 - 카트폴 구현하기
- 강화학습 Actor-Critic(A3C) 구현 사례 2 - 아타리 게임 구현하기


비대면 과정

해당 과정은 Zoom을 통한 비대면 라이브 과정입니다.
필수는 아니오나 과정 수강 시 캠 활성화 요청 드립니다.

문의센터

[판교 교육장] 031-606-9337, [가산 교육장] 02-6278-9353

연관과정

선수과정

  • 결과가 없습니다.

[비대면] Python과 Tensorflow를 이용한 강화학습의 이해와 활용

후수 과정

  • 결과가 없습니다.