内容简介
了解微生物之间以及微生物与环境之间如何交互,是微生物生态学的重要研究课题。然而,由于传统的基于实验室培养的研究方法存在一定局限性,因此,生物学家对真实环境中微生物群落内部的交互了解甚少。宏基因组测序及人工智能技术的发展使得研究人员可以通过分析微生物基因组序列来了解真实环境中微生物的组成和丰度,并构建关联推断算法分析微生物群落中的复杂交互作用。本书首先对微生物宏基因组测序及其分析流程进行介绍,其次详细介绍了构建关联推断算法需要考虑的问题,最后对基于统计和人工智能的多种微生物关联推断算法进行探讨,并阐述了基于自然语言构建微生物关联知识图谱的新思路。在关联推断算法的介绍过程中,本书以基于肠道菌群疾病的辅助诊断和太湖蓝藻水华问题为例,介绍了相关方法在微生物研究中的应用。
目录介绍
目录
第1章绪论1
1.1宏基因组学概述1
1.1.1第二代测序技术6
1.1.2鸟枪法宏基因组测序技术8
1.1.316S rRNA基因宏基因组测序技术9
1.1.4微生物组成与丰度估计10
1.1.5宏基因组学的应用12
1.2微生物关联推断研究意义14
1.2.1海洋微生物关联推断14
1.2.2人类肠道微生物关联推断15
1.3微生物关联推断研究成果17
1.3.1通用关联推断算法18
1.3.2OTUOTU关联推断算法18
1.3.3EFOTU关联推断算法19
1.3.4非线性关联推断算法19
1.3.5其他关联推断算法19
第2章
宏基因组学分析流程20
2.116S rRNA测序数据分析21
2.1.1测序数据预处理21
2.1.2可操作分类单元划分22
2.1.3物种注释23
2.1.4多样性分析23
2.2宏基因组学数据分析24
2.2.1测序数据预处理与组装25
2.2.2基因预测与功能注释26
2.2.3功能丰度谱构建与分析26
2.2.4物种丰度谱构建与分析27
2.2.5代谢通路富集分析28
2.3分箱与基因组构建29
2.3.1分箱原理与已有方法介绍29
2.3.2分箱结果质量评估和去冗余31
2.3.3物种鉴定32
微生物关联推断生物信息学研究及应用
|目录|
第3章关联推断算法简介34
3.1关联推断中存在的问题36
3.1.1组成成分偏差36
3.1.2过度散布37
3.1.3间接关联38
3.1.4环境因素40
3.1.5非线性关联与时间变化40
3.2关联推断算法42
3.2.1通用关联推断算法42
3.2.2OTUOTU关联推断算法43
3.2.3EFOTU关联推断算法46
3.2.4非线性关联推断算法47
3.2.5其他关联推断算法48
第4章基于宏基因组数据构建布尔蕴含网络的BIMS算法49
4.1BIMS方法介绍50
4.1.1BIMS算法流程50
4.1.2OTU丰度与环境数据预处理53
4.1.3布尔蕴含关系推断53
4.1.4布尔蕴含关系网络构建56
4.1.5扩展到三维布尔蕴含关系56
4.2BIMS功效的仿真实验59
4.2.1仿真数据集的产生59
4.2.2仿真结果60
4.2.3BIMS功效讨论62
4.2.4三维仿真结果分析64
4.3真实数据分析与讨论67
4.3.1真实数据67
4.3.2二维布尔网络构建与分析67
4.3.3三维布尔网络构建与分析73
4.4BIMS方法研究讨论75
第5章基于层次贝叶斯模型的静态关联推断77
5.1模型结构78
5.2模型参数估计81
5.3实验数据生成和处理85
5.3.1仿真数据生成及评价85
5.3.2TARA海洋数据处理87
5.3.3结肠癌数据处理88
5.3.4西英吉利海峡数据处理88
5.4实验结果和讨论88
5.4.1仿真实验结果88
5.4.2TARA海洋数据实验结果101
5.4.3结肠癌数据实验结果106
5.4.4西英吉利海峡数据实验结果107
第6章基于环境变化的多关联网络推断110
6.1模型假设111
6.2模型结构112
6.3基于EM算法的参数估计113
6.4基于分治算法的参数估计115
6.5实验数据生成和处理118
6.5.1仿真数据生成118
6.5.2评价指标118
6.5.3美国肠道项目数据集处理119
6.6实验结果和讨论119
6.6.1仿真实验结果119
6.6.2结肠癌数据集实验结果127
6.6.3TARA海洋数据集结果130
6.6.4美国肠道微生物项目实验结果134
第7章
人体肠道微生物与疾病的关联研究138
7.1数据收集与分析141
7.1.1数据收集141
7.1.2数据处理142
7.1.3机器学习模型训练与评估142
7.1.4确定疾病的微生物标志物143
7.2主要结果144
7.2.1数据描述144
7.2.2将肠道微生物群信息添加到人类变量中显著增强了肠道微生物
与IBD的关联强度144
7.2.3将肠道微生物群信息添加到人类变量中提高了肠道微生物与
IBS、CDI和UH的关联强度147
7.2.4将肠道微生物群信息添加到人类变量中对肠道微生物与DI、
SIBO、LI和CD的关联强度没有影响149
7.3讨论150
7.3.1与人体疾病有关的重要微生物150
7.3.2与人体疾病有关的重要变量151
7.3.3去除益生菌、维生素B补充剂和维生素D补充剂摄入频率152
7.3.4不同疾病的最佳模型和模型性能随OTU数的变化而变化153
第8章
基于自然语言的微生物关联网络构建157
8.1数据采集及预处理159
8.2实体标注及命名体识别159
8.3关联提取和筛选160
8.4关联网络结果统计160
8.5软件架构和实现163
第9章
关联推断在水体微生物中的应用与研究164
9.1蓝藻水华微生物164
9.1.1蓝藻水华的概念164
9.1.2太湖蓝藻水华微生物165
9.1.3太湖蓝藻水华的宏基因组学研究166
9.1.4样本采集167
9.1.5半定量活检和扫描电镜分析170
9.1.6DNA提取与高通量测序170
9.2数据分析171
9.2.116S rRNA测序数据分析171
9.2.2宏基因组测序数据分析172
9.2.3两种优势藻藻块的比较分析173
9.3主要结果174
9.3.1数据描述和环境数据分析174
9.3.2优势蓝藻属的交替演变175
9.3.3附着细菌的交替演变179
9.3.4生态网络的交替演变182
9.3.5蓝藻藻块组成变化的驱动因子184
9.4讨论186
9.4.1水华中不同藻属的季节演变现象186
9.4.2蓝藻和附着细菌的共生关系187
第10章总结与展望190
10.1总结190
10.2展望191
参考文献193