强化学习(1)基本概念与Q-learning模型的python简单实现
admin
2024-01-20 13:21:31
0次
强化学习概念与python实现
- 1. 强化学习简介
- 1.1 强化学习的基本特点与优势
-
- 1.2 强化学习的基本结构组成
- 1.3 典型强化学习Q-learning的结构
- 1.3.1 Q-value定义
- 1.3.2 Q-table的定义与设置
- 1.3.3 策略Policy函数和价值Value函数
- 1.3.4 贝尔曼方程(Bellman function)
- 1.3.4 Q-learning的流程(伪代码)
- 2. Python实现
- 2.1. 任务描述、包引用、参数初始化设置
- 2.2 Q表初始化函数
- 2.3. 动作选择函数--随机与贪婪两种叠加
- 2.4. 环境反馈函数
相关内容