图书中心

大数据与人工智能首页>图书中心>IT新学科新专业

人工智能与大数据处理技术
  • 书     名:人工智能与大数据处理技术
  • 出版时间:2025-07-23
  • 编 著 者:刘刚 杨檬嘉 曲泓润
  • 版       次:1-1
  • I  S  B N:978-7-5635-7569-5
  • 定       价:¥59.00元

内容简介线

本书分为两个部分:人工智能和大数据处理技术。在人工智能部分,本书介绍了机器学习和深度学习的基本概念、模型和算法。为了更好地解决数据隐私问题,本书进一步介绍了联邦学习的概念和模型,并在系统级别上介绍了知识图谱和专家系统的构建等。人工智能与大数据应用密不可分,因此在大数据处理技术部分,本书重点介绍了大数据处理的相关算法和数据可视化技术。此外,本书还提供了一些相关算法和应用的案例。
本书适合作为大部分与信息和人工智能相关的本科专业的教材,也适合作为非信息类专业研究生的教材。

目录介绍线

第1章人工智能与数据处理概述1

1.1人工智能概述1

1.1.1人工智能是什么1

1.1.2人工智能的发展背景1

1.1.3为什么要研究人工智能6

1.1.4中国人工智能的发展现状和未来7

1.2信息处理概述10

1.2.1信息处理技术是什么11

1.2.2信息处理技术的发展12

1.2.3信息处理技术的国内外研究现状和发展趋势13

第2章机器学习概述17

2.1什么是机器学习17

2.1.1对机器学习的感性认识17

2.1.2机器学习的本质17

2.1.3对机器学习的全面认识18

2.1.4机器学习、深度学习与人工智能之间的关系18

2.2机器学习的基本概念19

2.2.1数据集、特征和标签19

2.2.2监督式学习和非监督式学习20

2.2.3强化学习和迁移学习21

2.2.4特征数据的类型21

2.2.5训练集、验证集和测试集21

2.2.6机器学习的任务流程22

2.3机器学习的语言、框架和库22

2.3.1Python语言工具22

2.3.2框架23

2.3.3机器学习库25

2.4机器学习的主流框架25

2.4.1深度学习框架Caffe25

2.4.2开源软件库TensorFlow26

2.4.3上层接口Keras28

2.4.4百度飞桨30

2.4.5深度学习框架的对比32

第3章机器学习模型34

3.1什么是模型34

3.2模型与算法的区别37

3.3模型的训练37

3.3.1数据集37

3.3.2探索性数据分析38

3.3.3数据预处理38

3.3.4数据分割39

3.3.5模型建立40

3.3.6机器学习任务42

3.3.7分类任务的直观说明44

3.4模型拟合效果45

3.4.1欠拟合和过拟合45

3.4.2出现欠拟合和过拟合的原因及解决方案46

3.5模型的评估与改进47

3.5.1评估方法47

3.5.2性能度量50

3.5.3机器学习算法与人类表现的比较55

3.5.4改进策略55




第4章机器学习算法57

4.1有监督学习和无监督学习57

4.2半监督学习58

4.2.1基本概念58

4.2.2分类59

4.3决策树算法59

4.4朴素贝叶斯算法59

4.5回归算法60

4.5.1线性回归60

4.5.2逻辑回归61

4.6集成算法62

4.6.1简述62

4.6.2Bagging62

4.6.3Boosting63

4.7聚类算法64

4.7.1均值漂移聚类65

4.7.2基于密度的聚类——DBSCAN65

4.7.3用高斯混合模型的最大期望聚类65

4.7.4图团体检测66

4.8学习向量量化68

4.9KNN算法68

4.9.1KNN算法介绍69

4.9.2使用KNN算法要注意的问题70

4.9.3KNN算法的优缺点71

4.10支持向量机71

4.10.1支持向量机简述71

4.10.2支持向量机的应用72

4.11时间序列预测算法72

4.11.1Prophet算法72

4.11.2Arima算法76

4.11.3Arimax算法77

第5章深度学习算法78

5.1深度学习概述78

5.1.1深度学习的起源78

5.1.2从感知机到神经网络79

5.1.3神经网络之后的又一突破——深度学习83

5.1.4什么是深度学习84

5.1.5深度学习的研究现状85

5.2神经网络85

5.2.1从生物神经网络到人工神经网络85

5.2.2什么是神经网络87

5.2.3神经网络的训练89

5.2.4神经网络的优化和改进90

5.3卷积神经网络92

5.3.1卷积运算92

5.3.2卷积层94

5.4反向传播神经网络94

5.4.1BP网络特性分析95

5.4.2BP网络的设计97

5.4.3BP网络的局限性98

5.4.4BP网络的改进98

第6章TensorFlow99

6.1TensorFlow简介99

6.2TensorFlow的安装101

6.3TensorFlow的核心组件和工作原理103

6.4TensorFlow的部署116

6.5TensorFlow的安全性117

6.6TensorFlow生态系统118

6.6.1TensorFlow社区118

6.6.2TensorFlow项目118

6.6.3应用开发118

6.6.4TensorFlow面向研究118

6.7TensorFlow版本介绍119

第7章联邦学习120

7.1背景介绍120

7.2联邦学习概述122

7.2.1联邦学习的定义122

7.2.2联邦学习的分类122

7.2.3联邦学习系统的架构125

7.2.4核心挑战128

7.3联帮学习的相关概念129

7.4现状分析130

7.4.1沟通效率130

7.4.2系统异质性132

7.4.3统计异质性132

7.4.4隐私133

7.4.5激励机制134

7.5联邦学习的发展方向134

7.6联邦学习的应用135

7.7企业联邦学习与数据联盟135

7.8结论与展望136

第8章知识图谱137

8.1知识图谱概述137

8.1.1知识图谱的定义138

8.1.2知识图谱的架构138

8.1.3开放知识图谱139

8.2知识图谱的发展历史140

8.2.1人工智能的三大学派140

8.2.2知识图谱的发展路径140

8.3知识图谱的价值142

8.4知识图谱的构建144

8.4.1知识提取145

8.4.2语义类提取145

8.4.3属性和属性值抽取146

8.4.4关系抽取146

8.4.5知识表示147

8.4.6知识融合147

8.5知识图谱相关技术148

8.5.1知识图谱与数据库系统149

8.5.2知识图谱与智能问答149

8.5.3知识图谱与机器推理150

8.5.4知识图谱与推荐系统152

8.5.5区块链与去中心化的知识图谱153

8.6国内外典型的知识图谱项目153

8.6.1早期的知识库项目153

8.6.2互联网时代的知识图谱154

8.6.3中文开放知识图谱155

8.6.4垂直领域知识图谱156

第9章专家系统158

9.1专家系统的定义158

9.2专家系统的发展历史159

9.2.1孕育时期159

9.2.2形成期159

9.2.3暗淡期159

9.2.4蓬勃发展期160

9.2.5集成发展期161

9.3专家系统的分类161

9.4专家系统的结构164

9.5专家系统的特点和优点166

9.6构建专家系统的步骤170

9.7传统程序设计与专家系统开发之间的区别171

9.8人在专家系统中的作用172

第10章大数据174

10.1大数据简介174

10.1.1大数据的应用174

10.1.2国内大数据发展现状175

10.2大数据平台技术176

10.2.1大数据技术的演进177

10.2.2分布式计算系统概述177

10.2.3Hadoop178

10.2.4Spark181

10.2.5Storm182

10.2.6Kafka184

10.2.7各类技术平台的比较185

10.3大数据存储与计算技术187

10.3.1数据存储和计算188

10.3.2大数据管理技术190

10.3.3数据安全191

10.3.4数据质量192

第11章数据挖掘193

11.1数据挖掘概述193

11.1.1数据挖掘的概念193

11.1.2数据挖掘产生的背景193

11.1.3数据挖掘与数据分析的区别193

11.2数据的采集194

11.2.1数据采集的概念194

11.2.2数据采集的特点194

11.2.3数据采集的数据源195

11.2.4数据采集方法195

11.3数据预处理技术201

11.3.1数据清洗201

11.3.2数据转换202

11.3.3数据脱敏204

11.4数据挖掘与知识发现207

11.4.1知识发现208

11.4.2关联规则挖掘与非相关文献知识发现的差异性208

11.4.3数据挖掘与知识发现的关系208

11.4.4知识挖掘与文本挖掘209

11.5机器学习和数据挖掘算法210

11.5.1分类210

11.5.2聚类210

11.5.3回归分析210

11.5.4关联规则211

11.5.5协同过滤214

第12章模式识别215

12.1模式识别的概念215

12.1.1模式的描述方法215

12.1.2模式识别系统215

12.1.3统计模式识别研究的主要问题216

12.1.4模式、模式类和模式识别216

12.2模式系统概述216

12.2.1模式识别的步骤216

12.2.2模式识别的典型应用217

12.2.3监督模式识别和非监督模式识别218

12.2.4模式识别系统的典型组成218

12.3统计模式识别220

12.3.1距离分类法(最小距离分类法)220

12.3.2判别函数法221

12.3.3概率分类法224

12.4概率密度函数估计225

12.4.1最大似然估计226

12.4.2贝叶斯估计与贝叶斯学习229

12.4.3概率密度估计的非参数方法232

12.5线性分类器237

12.5.1线性判别函数的基本概念237

12.5.2Fisher线性判别分析239

12.5.3感知器242

12.5.4最小平方误差判别244

12.5.5最优分类超平面与线性支持向量机246

12.5.6多类线性分类器252

第13章自然语言处理255

13.1自然语言处理简介255

13.1.1自然语言处理的基本概念255

13.1.2自然语言处理的方法257

13.1.3学派之分262

13.2基于规则的自然语言理解262

13.2.1简单句理解262

13.2.2复合句理解264

13.2.3转化文法和转换网络264

13.3统计语言模型265

13.3.1语言模型265

13.3.2ngram模型267

13.3.3神经网络语言模型268

第14章数据可视化技术275

14.1数据可视化技术的发展275

14.1.1可视化技术的发展历程275

14.1.2数据可视化表示276

14.2数据可视化技术概述276

14.2.1数据分析方法277

14.2.2数据可视化工具280

14.2.3数据可视化技术在行业中的应用284

14.3GIS技术287

14.3.1简介287

14.3.2环境应用287

14.3.3主要问题288

14.3.4发展趋势289

14.3.5相关技术290

14.4虚拟现实、增强现实数据交互与呈现技术291

14.4.19种AR/VR交互方式292

14.4.2VR关键技术293

14.4.3AR关键技术294

14.5平台技术295

14.5.1D3295

14.5.2DateV295

14.5.3ECharts295

14.5.4Beiyoucharts295

14.6可视化平台示例296

参考文献298