《智能科学技术著作丛书》序
序
前言
第1章 机器学习概述
1.1 机器学习的概念
1.2 机器学习的发展历史
1.3 机器学习的分类
1.3.1 基于学习策略的分类
1.3.2 基于学习方法的分类
1.3.3 基于学习方式的分类
1.3.4 基于数据形式的分类
1.3.5 基于学习目标的分类
1.4 机器学习的主要策略
1.4.1 基于神经网络的学习
1.4.2 进化学习
1.4.3 强化学习
1.5 本书主要内容及安排
1.6 本章小结
参考文献
第2章 基于时间差分的神经网络预测控制
2.1 方法的提出
2.2 基于时间差分的Elman网络预测控制
2.2.1 Elman网络预测模型
2.2.2 反馈校正模型
2.2.3 参考轨迹
2.2.4 滚动优化算法
2.3 仿真研究
2.3.1 预测仿真
2.3.2 跟踪仿真
2.4 本章小结
参考文献
第3章 基于径向基函数网络的机械手迭代学习控制
3.1 机械手迭代学习控制
3.2 基于RBF网络的迭代学习控制
3.2.1 选取查询点的k个最接近样例
3.2.2 利用RBF网络拟合k个数据点
3.2.3 预测查询点的控制输入
3.3 仿真研究
3.4 本章小结
参考文献
第4章 自适应T-S型模糊径向基函数网络
4.1 RBF网络和模糊推理系统的功能等价性
4.2 自适应T-S型FRBF网络结构
4.3 自适应T-S型FRBF网络学习
4.3.1 网络学习动态
4.3.2 网络结构学习
4.3.3 网络参数学习
4.3.4 算法步骤
4.4 仿真研究
4.5 本章小结
参考文献
第5章 基于强化学习的自适应PID控制
5.1 Actor-Critic学习
5.2 基于强化学习的自适应PID控制
5.2.1 基于强化学习的自适应PID控制结构
5.2.2 基于RBF网络的Actor-Critic学习
5.3 控制器设计步骤
5.4 仿真研究
5.5 本章小结
参考文献
第6章 基于动态回归网络的强化学习控制
6.1 Q学习
6.2 基于Elman网络的强化学习控制
6.2.1 基于Elman网络的Q学习
6.2.2 Elman网络学习算法
6.2.3 基于Elman网络的Q学习方法步骤
6.3 仿真研究
6.4 本章小结
参考文献
第7章 基于自适应FRBF网络的强化学习
7.1 基于自适应FRBF网络的Actor-Qitic学习
7.1.1 基于自适应FRBF网络的Actorcritic学习结构
7.1.2 自适应FRBF网络的学习
7.1.3 算法步骤
7.1.4 仿真研究
7.2 基于自适应FRBF网络的Q学习
7.2.1 基于自适应FRBF网络的Q学习结构
7.2.2 自适应FRBF网络的学习
7.2.3 算法步骤
7.2.4 仿真研究
7.3 本章小结
参考文献
第8章 基于支持向量机的强化学习
8.1 SVM
8.1.1 机器学习
8.1.2 核学习
8.1.3 SVM的思想
8.1.4 SVM的重要概念
8.2 基于SVM的强化学习
8.2.1 基于SVM的Q学习结构
8.2.2 基于滚动时间窗机制的SVM
8.2.3 算法步骤
8.2.4 仿真研究
8.3 基于协同最小二乘SVM的强化学习
8.3.1 基于协同最小二乘SVM的Q学习
8.3.2 LS-SVRM逼近状态一动作对到值函数的映射关系
8.3.3 LS-SVCM逼近状态空间到动作空间的映射关系
8.3.4 仿真研究
8.4 本章小结
参考文献
第9章 基于高斯过程分类器的强化学习
9.1 基于高斯过程分类器的强化学习
9.2 在线高斯过程分类器学习
9.3 算法步骤
9.4 仿真研究
9.5 本章小结
参考文献
第10章 基于图上测地高斯基函数的策略迭代强化学习
10.1 环境的图论描述
10.2 测地高斯基函数
10.3 递归最小二乘策略迭代
10.4 算法步骤
10.5 仿真研究
10.6 本章小结
参考文献
第11章 多目标优化问题的差分进化一分布估计算法
11.1 多目标优化
11.2 多目标优化的差分进化一分布估计算法
11.2.1 多目标优化的DE-EDA混合算法步骤
11.2.2 多目标优化的DE子代生成策略
11.2.3 多目标优化的EDA子代生成策略
11.3 实例研究
11.4 本章小结
参考文献
第12章 基于细菌觅食行为的分布估计算法在预测控制中的应用
12.1 方法的提出
12.2 基于改进分布估汁算法的预测控制
12.2.1 预测模型
12.2.2 反馈校正模型
12.2.3 基于改进分布估计算法的滚动优化
12.3 实验分析
12.3.1 Benchmark函数实验
12.3.2 预测控制的曲线跟踪实验
12.4 本章小结
参考文献
第13章 一种多样性保持的分布估计算法
13.1 混沌模型
13.2 多样性保持分布估计算法
13.3 Benchmark函数实验
13.4 在支持向量机参数选择中的应用
13.4.1 算法步骤
13.4.2 Chebyshev混沌时间序列预测
13.5 本章小结
参考文献
附录 部分机器学习算法MATLAB源程序
程序1 第11章 多目标差分进化-分布估计算法MATLAB源程序
程序2 第12章 基于细菌觅食行为的分布估计算法部分MATLAB源程序
程序3 第13章 一种多样性保持的分布估计算法部分MATLAB程序