目录介绍
第1章人工智能与数据处理概述1
1.1人工智能概述1
1.1.1人工智能是什么1
1.1.2人工智能的发展背景1
1.1.3为什么要研究人工智能6
1.1.4中国人工智能的发展现状和未来7
1.2信息处理概述10
1.2.1信息处理技术是什么11
1.2.2信息处理技术的发展12
1.2.3信息处理技术的国内外研究现状和发展趋势13
第2章机器学习概述17
2.1什么是机器学习17
2.1.1对机器学习的感性认识17
2.1.2机器学习的本质17
2.1.3对机器学习的全面认识18
2.1.4机器学习、深度学习与人工智能之间的关系18
2.2机器学习的基本概念19
2.2.1数据集、特征和标签19
2.2.2监督式学习和非监督式学习20
2.2.3强化学习和迁移学习21
2.2.4特征数据的类型21
2.2.5训练集、验证集和测试集21
2.2.6机器学习的任务流程22
2.3机器学习的语言、框架和库22
2.3.1Python语言工具22
2.3.2框架23
2.3.3机器学习库25
2.4机器学习的主流框架25
2.4.1深度学习框架Caffe25
2.4.2开源软件库TensorFlow26
2.4.3上层接口Keras28
2.4.4百度飞桨30
2.4.5深度学习框架的对比32
第3章机器学习模型34
3.1什么是模型34
3.2模型与算法的区别37
3.3模型的训练37
3.3.1数据集37
3.3.2探索性数据分析38
3.3.3数据预处理38
3.3.4数据分割39
3.3.5模型建立40
3.3.6机器学习任务42
3.3.7分类任务的直观说明44
3.4模型拟合效果45
3.4.1欠拟合和过拟合45
3.4.2出现欠拟合和过拟合的原因及解决方案46
3.5模型的评估与改进47
3.5.1评估方法47
3.5.2性能度量50
3.5.3机器学习算法与人类表现的比较55
3.5.4改进策略55
第4章机器学习算法57
4.1有监督学习和无监督学习57
4.2半监督学习58
4.2.1基本概念58
4.2.2分类59
4.3决策树算法59
4.4朴素贝叶斯算法59
4.5回归算法60
4.5.1线性回归60
4.5.2逻辑回归61
4.6集成算法62
4.6.1简述62
4.6.2Bagging62
4.6.3Boosting63
4.7聚类算法64
4.7.1均值漂移聚类65
4.7.2基于密度的聚类——DBSCAN65
4.7.3用高斯混合模型的最大期望聚类65
4.7.4图团体检测66
4.8学习向量量化68
4.9KNN算法68
4.9.1KNN算法介绍69
4.9.2使用KNN算法要注意的问题70
4.9.3KNN算法的优缺点71
4.10支持向量机71
4.10.1支持向量机简述71
4.10.2支持向量机的应用72
4.11时间序列预测算法72
4.11.1Prophet算法72
4.11.2Arima算法76
4.11.3Arimax算法77
第5章深度学习算法78
5.1深度学习概述78
5.1.1深度学习的起源78
5.1.2从感知机到神经网络79
5.1.3神经网络之后的又一突破——深度学习83
5.1.4什么是深度学习84
5.1.5深度学习的研究现状85
5.2神经网络85
5.2.1从生物神经网络到人工神经网络85
5.2.2什么是神经网络87
5.2.3神经网络的训练89
5.2.4神经网络的优化和改进90
5.3卷积神经网络92
5.3.1卷积运算92
5.3.2卷积层94
5.4反向传播神经网络94
5.4.1BP网络特性分析95
5.4.2BP网络的设计97
5.4.3BP网络的局限性98
5.4.4BP网络的改进98
第6章TensorFlow99
6.1TensorFlow简介99
6.2TensorFlow的安装101
6.3TensorFlow的核心组件和工作原理103
6.4TensorFlow的部署116
6.5TensorFlow的安全性117
6.6TensorFlow生态系统118
6.6.1TensorFlow社区118
6.6.2TensorFlow项目118
6.6.3应用开发118
6.6.4TensorFlow面向研究118
6.7TensorFlow版本介绍119
第7章联邦学习120
7.1背景介绍120
7.2联邦学习概述122
7.2.1联邦学习的定义122
7.2.2联邦学习的分类122
7.2.3联邦学习系统的架构125
7.2.4核心挑战128
7.3联帮学习的相关概念129
7.4现状分析130
7.4.1沟通效率130
7.4.2系统异质性132
7.4.3统计异质性132
7.4.4隐私133
7.4.5激励机制134
7.5联邦学习的发展方向134
7.6联邦学习的应用135
7.7企业联邦学习与数据联盟135
7.8结论与展望136
第8章知识图谱137
8.1知识图谱概述137
8.1.1知识图谱的定义138
8.1.2知识图谱的架构138
8.1.3开放知识图谱139
8.2知识图谱的发展历史140
8.2.1人工智能的三大学派140
8.2.2知识图谱的发展路径140
8.3知识图谱的价值142
8.4知识图谱的构建144
8.4.1知识提取145
8.4.2语义类提取145
8.4.3属性和属性值抽取146
8.4.4关系抽取146
8.4.5知识表示147
8.4.6知识融合147
8.5知识图谱相关技术148
8.5.1知识图谱与数据库系统149
8.5.2知识图谱与智能问答149
8.5.3知识图谱与机器推理150
8.5.4知识图谱与推荐系统152
8.5.5区块链与去中心化的知识图谱153
8.6国内外典型的知识图谱项目153
8.6.1早期的知识库项目153
8.6.2互联网时代的知识图谱154
8.6.3中文开放知识图谱155
8.6.4垂直领域知识图谱156
第9章专家系统158
9.1专家系统的定义158
9.2专家系统的发展历史159
9.2.1孕育时期159
9.2.2形成期159
9.2.3暗淡期159
9.2.4蓬勃发展期160
9.2.5集成发展期161
9.3专家系统的分类161
9.4专家系统的结构164
9.5专家系统的特点和优点166
9.6构建专家系统的步骤170
9.7传统程序设计与专家系统开发之间的区别171
9.8人在专家系统中的作用172
第10章大数据174
10.1大数据简介174
10.1.1大数据的应用174
10.1.2国内大数据发展现状175
10.2大数据平台技术176
10.2.1大数据技术的演进177
10.2.2分布式计算系统概述177
10.2.3Hadoop178
10.2.4Spark181
10.2.5Storm182
10.2.6Kafka184
10.2.7各类技术平台的比较185
10.3大数据存储与计算技术187
10.3.1数据存储和计算188
10.3.2大数据管理技术190
10.3.3数据安全191
10.3.4数据质量192
第11章数据挖掘193
11.1数据挖掘概述193
11.1.1数据挖掘的概念193
11.1.2数据挖掘产生的背景193
11.1.3数据挖掘与数据分析的区别193
11.2数据的采集194
11.2.1数据采集的概念194
11.2.2数据采集的特点194
11.2.3数据采集的数据源195
11.2.4数据采集方法195
11.3数据预处理技术201
11.3.1数据清洗201
11.3.2数据转换202
11.3.3数据脱敏204
11.4数据挖掘与知识发现207
11.4.1知识发现208
11.4.2关联规则挖掘与非相关文献知识发现的差异性208
11.4.3数据挖掘与知识发现的关系208
11.4.4知识挖掘与文本挖掘209
11.5机器学习和数据挖掘算法210
11.5.1分类210
11.5.2聚类210
11.5.3回归分析210
11.5.4关联规则211
11.5.5协同过滤214
第12章模式识别215
12.1模式识别的概念215
12.1.1模式的描述方法215
12.1.2模式识别系统215
12.1.3统计模式识别研究的主要问题216
12.1.4模式、模式类和模式识别216
12.2模式系统概述216
12.2.1模式识别的步骤216
12.2.2模式识别的典型应用217
12.2.3监督模式识别和非监督模式识别218
12.2.4模式识别系统的典型组成218
12.3统计模式识别220
12.3.1距离分类法(最小距离分类法)220
12.3.2判别函数法221
12.3.3概率分类法224
12.4概率密度函数估计225
12.4.1最大似然估计226
12.4.2贝叶斯估计与贝叶斯学习229
12.4.3概率密度估计的非参数方法232
12.5线性分类器237
12.5.1线性判别函数的基本概念237
12.5.2Fisher线性判别分析239
12.5.3感知器242
12.5.4最小平方误差判别244
12.5.5最优分类超平面与线性支持向量机246
12.5.6多类线性分类器252
第13章自然语言处理255
13.1自然语言处理简介255
13.1.1自然语言处理的基本概念255
13.1.2自然语言处理的方法257
13.1.3学派之分262
13.2基于规则的自然语言理解262
13.2.1简单句理解262
13.2.2复合句理解264
13.2.3转化文法和转换网络264
13.3统计语言模型265
13.3.1语言模型265
13.3.2ngram模型267
13.3.3神经网络语言模型268
第14章数据可视化技术275
14.1数据可视化技术的发展275
14.1.1可视化技术的发展历程275
14.1.2数据可视化表示276
14.2数据可视化技术概述276
14.2.1数据分析方法277
14.2.2数据可视化工具280
14.2.3数据可视化技术在行业中的应用284
14.3GIS技术287
14.3.1简介287
14.3.2环境应用287
14.3.3主要问题288
14.3.4发展趋势289
14.3.5相关技术290
14.4虚拟现实、增强现实数据交互与呈现技术291
14.4.19种AR/VR交互方式292
14.4.2VR关键技术293
14.4.3AR关键技术294
14.5平台技术295
14.5.1D3295
14.5.2DateV295
14.5.3ECharts295
14.5.4Beiyoucharts295
14.6可视化平台示例296
参考文献298