内容简介
链路预测旨在利用网络的拓扑性质、节点特征等预测原本不相连的两个节点未来产生连接的概率。如何更有效地挖掘节点的信息一直是影响链路预测性能的重要因素。目前提出的链路预测算法普遍存在预测性能差或算法时间复杂度高的问题,造成了链路预测应用的局限。高阶的链路预测算法考虑了节点的1阶相似性、2阶相似性、……、n阶相似性,融入了更多节点间的信息,可以更好地表示节点之间的关系,从而更有效地挖掘网络的信息。
本书从复杂网络角度出发,对基于高阶编码的链路预测算法进行了总结与探索。全书分为4部分,由11章构成。第1部分(第1~3章)介绍了复杂网络与链路预测相关的基础知识以及经典的基于节点相似性的链路预测算法;第2部分(第4~7章)考虑了节点与邻居的邻居节点的高阶相似性关系,介绍了基于网络表示学习的高阶编码链路预测算法;第3部分(第8、9章)从物理学的角度出发,考虑节点与节点之间的相互作用力以及节点的高阶特征,介绍了基于复杂网络引力场的高阶编码链路预测算法;第4部分(第10、11章)介绍了链路预测当下的主流应用。最后,本书做了整体总结,并指出了待改之处。
本书可作为研究复杂网络、链路预测和推荐系统等领域的参考,也适合企业开发者和项目经理阅读。另外,对链路预测感兴趣的本科生和研究生也同样可以参考本书。
目录介绍
目录
第1部分基础知识
第1章复杂网络3
1.1复杂网络简介3
1.1.1复杂网络的由来4
1.1.2复杂网络的图表示5
1.1.3复杂网络的计算机表示6
1.1.4路径与最短路径8
1.1.5连通性10
1.2复杂网络的拓扑性质10
1.2.1节点的度11
1.2.2度分布13
1.2.3平均路径长度13
1.2.4直径13
1.2.5集聚系数14
1.2.6节点中心性16
1.3典型的复杂网络模型19
1.3.1随机网络模型19
1.3.2小世界网络模型22
1.3.3无标度网络模型27
第2章链路预测30
2.1链路预测方法30
2.2链路预测技术33
2.3数据集划分34
2.3.1随机抽样34
2.3.2逐项遍历34
2.3.3k折叠交叉检验35
2.3.4熟识者抽样35
2.4评价指标37
2.4.1AUC37
2.4.2精确度38
2.4.3排序分39
2.5应用40
|目录|
|目录|
第3章基于节点相似性的链路预测算法42
3.1基于局部信息的节点相似性算法42
3.1.1基于共同邻居的节点相似性算法42
3.1.2基于AdamicAdar的相似性算法47
3.1.3基于资源分配的相似性算法48
3.1.4基于偏好连接的相似性算法48
3.1.5基于局部朴素贝叶斯模型的相似性算法49
3.2基于路径的节点相似性算法52
3.2.1基于局部路径的相似性算法52
3.2.2Katz相似性算法53
3.2.3LHNII相似性算法53
3.3基于随机游走的节点相似性算法54
3.3.1基于平均通勤时间的相似性算法54
3.3.2基于随机游走的余弦相似性算法55
3.3.3有重启的随机游走相似性算法56
3.3.4基于局部随机游走的相似性算法57
3.3.5基于叠加效应的随机游走相似性算法58
3.4其他节点相似性算法59
3.4.1基于矩阵森林理论的相似性算法59
3.4.2TSCN相似性算法60
3.5基于节点相似性的链路预测算法主函数61
第2部分基于网络表示学习的高阶链路预测算法
第4章基于矩阵分解的DeepWalk链路预测算法71
4.1问题描述71
4.2模型框架73
4.2.1基于矩阵分解的DeepWalk算法74
4.2.2LPMF算法76
4.3实验分析78
4.3.1实验数据78
4.3.2基准方法79
4.3.3评价指标79
4.3.4实验结果与分析80
4.3.5度分布可视化81
4.3.6调参与分析82
4.3.7网络表示可视化84
4.3.8案例研究84
第5章基于网络节点文本增强的链路预测算法87
5.1问题描述87
5.2模型框架88
5.2.1基于矩阵分解的DeepWalk算法88
5.2.2基于文本信息的DeepWalk算法89
5.2.3TELP算法89
5.3实验分析92
5.3.1实验数据92
5.3.2基准方法92
5.3.3实验结果与分析92
5.3.4度分布可视化94
5.3.5调参与分析94
5.3.6网络表示可视化95
5.3.7案例研究96
第6章基于高阶近似的链路预测算法99
6.1问题描述99
6.2模型框架100
6.2.1NEU算法100
6.2.2LPHOPA算法101
6.3实验分析104
6.3.1实验数据104
6.3.2基准方法104
6.3.3实验结果与分析104
6.3.4时间复杂度对比108
6.3.5度分布可视化109
第7章联合多视图特征的链路预测算法111
7.1问题描述111
7.2模型框架113
7.2.1不同阶网络特征获取113
7.2.2不同阶网络特征加权115
7.2.3基于HONR的链路预测算法116
7.3实验分析117
7.3.1实验数据117
7.3.2基准方法118
7.3.3实验结果与分析118
7.3.4参数分析122
7.3.5网络表示可视化124
第3部分基于复杂网络引力场的高阶链路预测算法
第8章基于复杂网络引力场的链路预测算法129
8.1问题描述129
8.2模型框架130
8.2.1复杂网络引力场模型130
8.2.2LPGFCN算法131
8.3实验分析133
8.3.1实验数据133
8.3.2基准方法134
8.3.3实验结果与分析134
8.3.4度分布可视化136
第9章基于复杂网络引力场与节点收缩的链路预测算法138
9.1问题描述138
9.2模型框架141
9.2.1基于节点收缩的节点重要性评估方法141
9.2.2改进的复杂网络引力场模型142
9.2.3LPGFCNNC算法143
9.3实验分析149
9.3.1实验数据149
9.3.2基准方法149
9.3.3实验结果与分析149
9.3.4度分布可视化152
第4部分链路预测的应用
第10章链路预测在知识图谱中的应用157
10.1知识图谱的表示157
10.2知识图谱嵌入技术158
10.2.1距离变换嵌入模型159
10.2.2语义匹配嵌入模型161
10.3利用链路预测完成知识图谱补全任务163
第11章链路预测在商品推荐系统中的应用165
11.1商品推荐系统简介165
11.2基于内容的商品推荐167
11.3基于协同过滤的商品推荐168
11.4相关数据集170
参考文献172