深度测序数据的生物信息学分析及实例 [Bioinformatics for Deep Sequencing Data with Examples]

深度测序数据的生物信息学分析及实例 [Bioinformatics for Deep Sequencing Data with Examples] pdf epub mobi txt 电子书 下载 2025

沈百荣 编
图书标签:
  • 生物信息学
  • 深度测序
  • NGS
  • 基因组学
  • 数据分析
  • Python
  • R
  • 生物统计学
  • 基因表达
  • 变异分析
想要找书就要到 静流书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
出版社: 科学出版社
ISBN:9787030545800
版次:1
商品编码:12197531
包装:平装
丛书名: 生物信息学数据分析丛书
外文名称:Bioinformatics for Deep Sequencing Data with Examples
开本:16开
出版时间:2017-09-01
用纸:胶版纸
页数:205###

具体描述

内容简介

  《深度测序数据的生物信息学分析及实例》几乎涵盖了深度测序数据分析及应用的各个方面,适用于从事深度测序数据分析研究的技术人员和学者。在《深度测序数据的生物信息学分析及实例》中,不仅可以了解到深度测序技术应用的领域,还可以通过具体实例,了解到不同软件的相关算法、原理及使用方法,以帮助选择适合自身研究和应用所需要的深度测序数据分析的解决方案。
  《深度测序数据的生物信息学分析及实例》适合从事生物信息学、系统生物学、医学信息学、转化医学、精准医学、健康管理等研究领域的读者阅读。

内页插图

目录

目录
前言
1 深度测序技术与生物信息学 1
1.1 深度测序的常用平台 1
1.1.1 Illumina测序系统 1
1.1.2 Roche 454测序仪 5
1.1.3 Applied Biosystems SOLiD测序仪 7
1.1.4 PacBio RSII单分子测序 8
1.1.5 Ion PGM和Proton半导体测序仪 8
1.2 深度测序技术对生物医学研究和社会的影响 9
1.2.1 生物医学大数据与生物医学研究范式的改变 9
1.2.2 深度测序技术对经济市场的影响 10
1.2.3 深度测序技术对社会的影响 11
1.3 深度测序数据处理的挑战 12
1.3.1 数据存取方面的挑战 12
1.3.2 计算技术方面的挑战 13
1.3.3 数据应用方面的挑战 14
1.3.4 人才缺失与跨学科人才教育的挑战 15
1.4 常见的软件和分析平台介绍 15
1.4.1 生物信息学杂志特刊中的软件及其分类 15
1.4.2 R与Bioconductor软件平台 16
参考文献 17
2 深度测序相关数据库和数据格式 19
2.1 深度测序相关的数据库 19
2.2 深度测序相关的数据格式 22
2.2.1 序列与质量分数相关格式 22
2.2.2 序列比对的相关格式 24
2.2.3 序列组装的相关格式 24
2.2.4 突变的相关格式 25
2.2.5 序列注释及可视化的相关格式 25
2.3 格式转换 27
2.3.1 数据格式转换软件NGSFormatConverter 27
2.3.2 NGSFormatConverter的安装与应用 29
参考文献 30
3 碱基识别 32
3.1 深度测序碱基识别简介 32
3.2 Illumina平台碱基识别软件 33
参考文献 36
4 基因组序列比对 37
4.1 短序列片段比对软件的发展 37
4.1.1 深度测序技术带来的机遇 37
4.1.2 深度测序数据带来的比对定位瓶颈 37
4.2 深度测序片段比对软件的比较 39
4.2.1 深度测序片段比对软件 39
4.2.2 深度测序片段比对定位软件算法比较 40
4.2.3 比对定位软件性能比较 45
4.2.4 比对定位软件评价 47
4.3 深度测序片段比对软件实例演示 50
4.4 展望 51
参考文献 53
5 小片段序列组装 55
5.1 问题阐述:小片段序列组装 55
5.1.1 小片段组装类型 55
5.1.2 当前组装过程的挑战 56
5.1.3 小片段组装过程的意义 56
5.2 组装策略:如何将小片段组装成重叠群 58
5.2.1 基因组序列的组装 58
5.2.2 转录组序列的组装 63
5.3 算法评价:如何选取一个合适的组装软件 63
5.3.1 基因组组装软件的选择 64
5.3.2 转录组组装软件的选择 66
5.4 程序示例:如何执行一个片段组装过程 67
5.4.1 基因组测序数据的组装 67
5.4.2 转录组测序数据的组装 69
5.5 总结和展望:组装算法何去何从 70
参考文献 71
6 染色质免疫共沉淀测序数据分析 73
6.1 ChIP-Seq简介 73
6.1.1 ChIP-Seq的出现 73
6.1.2 ChIP-Seq的基本实验流程 75
6.1.3 影响ChIP-Seq实验成功的因素 76
6.2 ChIP-Seq数据计算分析 77
6.2.1 碱基识别 77
6.2.2 定位到基因组 78
6.2.3 富集区域的鉴定 78
6.2.4 其他下游分析 80
6.3 Peak Calling算法比较 81
6.4 ChIP-Seq数据分析应用实例 84
6.4.1 峰的寻找 84
6.4.2 基因关联 86
6.4.3 Motif发现 87
6.4.4 注释分析 87
6.4.5 可视化 88
6.5 ChIP-Seq软件的改进和发展方向 89
参考文献 91
7 转录组测序数据分析 93
7.1 RNA-Seq简介 93
7.2 RNA-Seq技术的应用 96
7.3 RNA-Seq数据处理与软件 97
7.3.1 概述 97
7.3.2 剪接位点预测软件 98
7.3.3 基因表达水平分析软件 101
7.3.4 综合性分析软件 102
7.4 软件安装与使用 105
7.4.1 选择性剪接软件 105
7.4.2 基因表达水平分析软件 110
7.4.3 综合性分析软件 111
7.5 展望 118
参考文献 119
8 microRNA-Seq数据分析 121
8.1 microRNA简介 121
8.2 深度测序与microRNA-Seq技术 122
8.2.1 概述 122
8.2.2 microRNA-Seq实验流程 123
8.2.3 microRNA-Seq数据处理 123
8.3 microRNA-Seq数据分析软件 125
8.3.1 概述 125
8.3.2 本地分析软件 126
8.3.3 在线分析软件 138
8.4 软件性能比较 146
8.4.1 测试数据与环境配置 146
8.4.2 运行时间比较 147
8.4.3 敏感度与准确度比较 147
8.4.4 新的miRNA预测 148
参考文献 149
9 变异检测 151
9.1 引言 151
9.2 基因组多态性 153
9.3 变异的类型及其检测 157
9.3.1 SNP 157
9.3.2 结构变异 159
9.4 变异检测软件实例 166
9.4.1 Genome Analysis Toolkit简介 166
9.4.2 Genome Analysis Toolkit安装 166
9.4.3 Genome Analysis Toolkit使用 168
9.5 展望 171
参考文献 172
10 单细胞测序数据分析 176
10.1 单细胞测序技术的简要发展历程 176
10.2 单细胞测序的技术实现及主要分类 177
10.2.1 常用单细胞分离的技术 178
10.2.2 单细胞基因组测序技术 179
10.2.3 单细胞转录组测序技术 180
10.2.4 单细胞表观遗传组测序技术 181
10.3 单细胞测序的技术应用 181
10.3.1 单细胞测序技术在癌症生物中的应用 182
10.3.2 单细胞测序技术在发育生物中的应用 182
10.3.3 单细胞测序技术在微生物学研究中的应用 183
10.3.4 单细胞测序技术的临床应用前景 183
10.4 单细胞测序技术的数据分析实例 183
10.4.1 输入数据以及数据分析工具介绍 184
10.4.2 数据的读入与归一化 184
10.4.3 根据归一化后的数据鉴定样本中高度差异表达的基因 184
10.5 单细胞测序技术的未来发展趋势 185
参考文献 186
11 深度测序的数据可视化软件 188
11.1 数据可视化技术的生物问题和应用背景 188
11.1.1 生物问题 188
11.1.2 应用背景 188
11.2 数据可视化相关软件介绍和比较 189
11.2.1 基于网络的可视化浏览器 190
11.2.2 基于本地平台的可视化软件 191
11.3 软件示例 197
11.3.1 Savant安装 197
11.3.2 Savant运行实例 198
参考文献 205

前言/序言

  近年来,以快速、低成本、高通量为特点的深度测序(又称下一代测序,nextgeneration sequencing,NGS)技术极大地推动了相关科学和产业的进步,是未来精准医疗和健康产业的基石。深度测序产生了海量的数据,需要新的、专业的技术、方法和软件来分析与处理。目前,国内外已有大量优秀的研究人员发表了针对深度测序数据分析的新方法和新软件的论文。但是,国内外全面介绍深度测序数据分析及实例的书籍尚不多见。本书的编写目的就是为不同专业背景的读者提供一本实用的关于深度测序数据分析的书籍。
  本书几乎涵盖了深度测序数据分析及应用的各个方面,适用于从事深度测序数据分析研究的技术人员和学者。在本书中,不仅可以了解到深度测序技术应用的领域,还可以通过具体实例,了解到不同软件的相关算法、原理及使用方法,以帮助选择适合自身研究和应用、学习所需要的深度测序数据分析的解决方案。同时,我们构建了本书配套的网站以方便读者进行实例学习,网址为http://sysbio.suda.edu.cn/NGS_book/index.php.
  本书共包括11章。第1章主要介绍了深度测序技术的常用平台和原理、对现代生物医学研究范式的影响、对生物信息学带来的挑战和机遇,以及深度测序数据分析的常见软件和平台;第2章介绍了深度测序相关的数据库和数据格式;第3章介绍了碱基识别的方法;第4章介绍了基因组序列比对;第5章介绍了序列片段的组装:第6章介绍了染色质免疫共沉淀测序数据分析;第7章介绍了转录组测序数据的分析;第8章介绍了microRNA-Seq的数据分析;第9章介绍了变异检测;第10章介绍了单细胞测序数据分析;第11章介绍了深度测序数据的可视化软件。本书的编写工作是苏州大学系统生物学研究中心师生多年来共同努力的结果,由于NGS领域发展迅速,且我们的时间和学识有限,难免有错误与不当之处,还希望读者反馈指正,我们将在以后再版时进行修改和更正。
  本书各章的编写分工如下:前言及第1章,沈百荣、钱福良、李庆辉、汤溢飞:第2章,吴文涛:第3章,王晶;第4章,尚婧;第5章,张文宇;第6章,李庆辉、荆鑫华;第7章,严文颖、林宇鑫、汤溢飞;第8章,林宇鑫、李粤;第9章,崔卫荣、严文颖、蒋峻峰;第10章,张文宇;第11章,李吟、汤思捷。网站由林宇鑫、刘行云、严文颖开发。
现代统计学在数据驱动决策中的应用:理论、方法与前沿实践 本书旨在为读者提供一个全面、深入且前沿的现代统计学视角,重点关注其在处理复杂、高维数据以及驱动数据驱动决策中的关键理论、方法论和实际应用。 本书内容不涉及生物信息学、测序技术或特定生物学数据的分析,而是立足于统计学这一学科的广阔基础,探讨如何利用严谨的数学框架和计算工具从海量数据中提取有效信息、建立可靠模型并做出审慎推断。 第一部分:现代统计学的理论基石与重塑 本部分将系统回顾并深化读者对现代统计学核心概念的理解,特别关注其在面对“大数据”时代挑战时所发生的理论演进。 第1章:概率论与数理统计的现代视角 本章将超越传统的参数估计与假设检验框架,探讨随机过程、高维概率分布的特性,以及在信息论指导下对数据不确定性的量化。我们将深入讨论贝叶斯理论的现代复兴及其在复杂模型构建中的作用,包括马尔可夫链蒙特卡洛(MCMC)方法论的严谨性、收敛诊断和模型选择的先进策略。 第2章:统计推断的局限与超越 我们聚焦于传统渐近理论(如中心极限定理)在高维或小样本情境下的局限性。内容涵盖: 非参数与半参数方法: 重点介绍核密度估计(KDE)、广义可加模型(GAMs)的统计效率和解释性,以及如何在不预设严格分布假设下进行可靠推断。 重采样技术(Bootstrap/Jackknife): 详细阐述这些方法的统计有效性、偏差修正技术,以及它们在构建稳健置信区间中的应用场景。 经验似然(Empirical Likelihood): 探讨如何利用非参数方法构建似然函数,从而在不依赖特定函数形式下获得高效的推断。 第3章:信息论与统计决策理论 本章将统计学与信息论相结合,探讨如何通过信息量(如Kullback-Leibler散度)来度量模型之间的差异。重点内容包括: 模型选择准则的优化: 深入解析AIC、BIC的局限,并介绍现代信息准则,如WAIC(Widely Applicable Information Criterion)和LOO-CV(Leave-One-Out Cross-Validation)在贝叶斯框架下的应用及其统计学意义。 统计决策理论基础: 从损失函数的设计到最小化风险,探讨如何在不确定性下制定最优决策规则。 第二部分:高维数据建模与机器学习的统计基础 随着数据维度(特征数量)的增长,传统的线性模型面临多重共线性、模型过拟合等挑战。本部分着眼于利用统计学原理来驯服高维数据。 第4章:正则化与降维的统计学视角 本章将正则化技术视为约束优化问题,而非单纯的预测技巧。 Lasso、Ridge和弹性网络(Elastic Net): 深入剖析 $L_1$ 和 $L_2$ 范数的统计学动机,讨论它们在变量选择和系数收缩上的差异,以及如何通过交叉验证优化正则化强度。 主成分分析(PCA)的统计解释: 将PCA视为基于方差最大化的线性降维,讨论如何评估主成分的显著性,以及它与因子分析(Factor Analysis)在统计结构上的区别。 稀疏表示学习: 介绍如何设计稀疏模型以增强模型的可解释性和计算效率。 第5章:广义线性模型(GLMs)的扩展与混合效应模型 本章超越标准线性回归,探讨更灵活的建模框架。 GLMs 进阶: 深入研究泊松回归、负二项回归、Logistic回归背后的指数族分布理论,以及如何诊断和修正拟合中的过度离散问题。 混合效应模型(Mixed-Effects Models): 详细介绍随机效应和固定效应的统计学意义,重点在于如何处理具有层次结构或重复测量的复杂数据集,包括随机截距模型和随机斜率模型的设计与推断。 第6章:统计学习中的偏差-方差权衡(Bias-Variance Trade-off) 这是连接传统统计学与现代机器学习的关键章节。 泛化误差的分解: 从统计学的角度严格推导预测误差可以分解为可归约误差、偏差平方和方差。 模型复杂度与泛化能力: 讨论VC维、Rademacher复杂度等统计工具如何量化模型的复杂度,以及它们如何指导我们选择既不过拟合也不欠拟合的模型。 第三部分:前沿应用:因果推断与时间序列的现代方法 本部分探讨在复杂观测数据中识别“关系”而非仅仅是“相关性”的关键统计工具,以及处理序列依赖性的现代技术。 第7章:基于潜在结果框架的因果推断 本章完全聚焦于统计学中的因果推断,脱离特定领域的数据类型。 核心假设的严格定义: 深入探讨可比性(Ignorability/Unconfoundedness)、一致性(Consistency)和稳定单元处理值假设(SUTVA)的统计含义和检验难度。 倾向得分(Propensity Score)方法: 详细讲解匹配、分层和逆概率权重(IPW)的设计、实施和统计局限性。 双重稳健(Doubly Robust)估计器: 介绍如何结合结果模型和倾向得分模型以提高估计的稳健性。 第8章:现代时间序列分析与非线性建模 本章侧重于处理时间依赖性的数据,强调从经典ARIMA模型到状态空间模型的演进。 状态空间模型与卡尔曼滤波: 阐述如何利用状态空间表示法对隐藏的动态过程进行估计、平滑和预测,特别是在处理噪声观测时。 非线性时间序列模型: 介绍如非线性自回归模型(NAR)以及如何利用GARCH族模型来刻画波动率的动态聚集现象。 第9章:贝叶斯层次模型与大数据的适应性 本部分将贝叶斯方法应用于处理具有多层结构和大规模参数空间的复杂模型。 层次建模的统计优势: 讲解如何通过共享信息(信息汇集)来提高小群体或稀疏数据点的估计精度。 计算效率的提升: 介绍变分推断(Variational Inference, VI)作为MCMC的替代方案,如何在牺牲少量精度的情况下,大幅提升在大数据集上的可扩展性。 本书的最终目标是培养读者严谨的统计思维,使其能够根据数据的特性、研究问题的性质,选择、应用并批判性地评估最恰当的统计方法,最终实现稳健、可解释的数据驱动决策。 读者在完成本书学习后,将具备应对各种复杂、高维数据集的统计学理论深度和实践能力。

用户评价

评分

这本书最吸引我的地方在于其“深度”和“实例”相结合的定位。在生物信息学领域,充斥着各种零散的教程和论文,要形成一个系统性的知识体系非常困难。我希望这本书能够提供一个完整的框架,从最基础的测序原理和数据类型讲起,逐步深入到复杂的分析流程。我尤其关注书中所述的“生物信息学分析”的深度。它是否会深入到算法的层面,解释某些关键分析工具背后的原理?还是更侧重于工具的实际应用和参数调优?我更倾向于后者,因为对于我这样需要快速解决实际问题的科研人员来说,掌握如何有效地使用这些工具,比理解复杂的算法细节更为迫切。而“实例”的加入,则让我看到了这本书的实践价值。我希望这些实例能够覆盖不同的测序技术(如全基因组测序、外显子组测序、RNA测序)和不同的研究领域(如疾病研究、进化研究、农业育种)。例如,书中能否展示如何利用RNA-seq数据进行基因表达差异分析,如何构建基因调控网络,或者如何进行de novo基因组组装。我希望这些实例能够提供完整的分析流程,从数据预处理到结果解读,甚至包括如何生成具有说服力的图表。这本书在我眼中,应该是一本能够帮助我快速上手,并解决实际研究问题的“实战宝典”。

评分

我对这本书的期望,主要集中在它能否有效地架起生物学与计算机科学之间的桥梁。作为一名生物学背景的研究者,我深知如今的生物学研究越来越离不开海量的数据,而深度测序正是产生这些数据的“主力军”。然而,这些数据本身并不能直接告诉我答案,它们需要经过复杂的生物信息学分析才能转化为有意义的生物学见解。这本书的书名,特别是“生物信息学分析”这一部分,让我看到了一线希望。我希望它能提供一种循序渐进的学习方法,从基本的数据格式(如FASTQ, BAM, VCF)讲起,到常用的分析软件(如BWA, GATK, SAMtools, STAR, DESeq2)的安装和使用,再到具体的分析流程设计。特别吸引我的是“实例”二字,我非常渴望看到作者是如何将这些技术细节与实际的生物学问题相结合的。例如,如何利用深度测序数据发现新的致病基因突变,如何分析不同处理组之间的基因表达差异,或者如何重构微生物群落的组成和功能。我希望书中的实例能够足够具体,包含详细的命令行操作、脚本示例,甚至是一些数据可视化图表的生成过程,这样我才能真正地“上手”操作,而不是仅仅停留在理论层面。这本书如果能让我理解“为什么”要这样做,以及“如何”做到,那我将受益匪浅。它能否帮助我将零散的知识点串联起来,形成一个完整的分析框架,是我最为关心的。

评分

这本书的出现,对我来说,简直就是雪中送炭。我一直觉得,深度测序技术改变了我们观察生命的方式,但随之而来的海量数据,却成了许多科研工作者的一道难以逾越的坎。市面上虽然有不少关于生物信息学的书籍,但要么过于理论化,要么过于零散,很难找到一本既系统又实用的。这本书的书名——“深度测序数据的生物信息学分析及实例”,完美地击中了我的痛点。我期待它能够像一位经验丰富的老司机,带我安全、高效地驶入生物信息学分析的快车道。我希望书中能够详细地介绍各种主流的测序数据处理流程,比如如何进行质量控制,如何将reads比对到参考基因组,以及如何进行基因组变异检测。特别是“实例”部分,我希望能够看到一些贴近实际的研究场景,比如,如何分析一个肿瘤样本的全基因组测序数据,找出可能导致癌症发生的基因突变;或者如何利用RNA测序数据,研究不同药物处理对细胞基因表达的影响。我希望书中提供的实例能够包含详细的操作步骤,甚至是可以直接运行的代码,这样我才能真正地学以致用,而不是停留在“看明白”的层面。如果这本书能够让我从一个对生物信息学分析感到迷茫的初学者,变成一个能够独立完成基本数据分析的研究者,那它的价值将是巨大的。

评分

刚拿到这本书,我最大的感受就是它的“厚重感”。翻开第一页,就被密密麻麻的字和各种图表吸引住了。我一直对基因测序技术充满好奇,尤其是近些年发展迅猛的深度测序,感觉它打开了通往生命奥秘的另一扇大门。这本书的书名就直接点明了主题,对于像我这样,虽然对生物学有基本了解,但对信息学和数据分析却知之甚少的读者来说,这无疑是一条充满挑战但又引人入胜的学习路径。我设想,这本书应该会从基础概念讲起,比如什么是深度测序,它有哪些优势,以及在哪些领域有着广泛的应用。然后,逐步深入到数据分析的部分,这应该也是全书的核心。我期待能够看到各种主流的生物信息学分析流程和工具的介绍,比如序列比对、变异检测、基因组组装、转录组分析等等。而且,书名中“实例”二字让我非常期待,因为理论知识往往是枯燥的,只有结合实际案例,才能更好地理解抽象的概念,并学会如何将这些工具和方法应用到具体的研究问题中。我希望书中的实例能够覆盖一些比较热门和前沿的研究方向,比如癌症基因组学、微生物组学,甚至是单细胞测序的应用。我非常想知道,作者是如何将这些复杂的分析步骤,通过清晰的图示和代码示例,呈现在读者面前的。这本书在我眼中,更像是一本“百科全书”,一本“实操指南”,能够帮助我从零开始,逐步掌握深度测序数据分析的核心技能,最终能够独立地对这些数据进行探索和解读。

评分

翻阅这本书的封面,我的脑海中勾勒出一个它应有的轮廓:它大概是一本非常扎实的工具书,对于我们这些在实验室里辛勤耕耘、却常常被海量测序数据压得喘不过气的科研工作者来说,无疑是一份宝藏。我期待它能像一位经验丰富的向导,带领我们穿越生物信息学分析的迷宫。从拿到原始的测序文件开始,到最终产出具有生物学意义的报告,每一个环节都需要精准的操作和深刻的理解。我希望这本书能详细讲解如何对原始数据进行质量控制,如何去除低质量的reads,如何进行比对,以及如何处理比对后的文件。更重要的是,我非常关注书中关于变异检测的章节,这是深度测序应用中最核心的部分之一。书中是否会提供详细的步骤来识别SNP、Indel,甚至是结构变异?它们在癌症研究、遗传病诊断等领域有着至关重要的作用。而“实例”部分,我希望它能涵盖一些实际的科研场景,比如,如何分析一个癌症样本的全基因组数据,寻找驱动基因;或者如何通过转录组分析,探索植物对逆境胁迫的响应机制。我期待书中能够提供可以直接复制粘贴的代码片段,并附带详细的解释,让我能够理解每一步操作背后的逻辑。如果这本书能让我从“不知如何下手”的状态,转变为“能够独立完成大部分分析”,那它的价值将是无法估量的。

评分

讲的比较浅 只能说是个概览

评分

新书包装好!

评分

好书,值得购买值得收藏值!

评分

很好,不错,不错,内容很适合,好好阅读

评分

《深度测序数据的生物信息学分析及实例》几乎涵盖了深度测序数据分析及应用的各个方面,适用于从事深度测序数据分析研究的技术人员和学者。

评分

正版,好书,有意思,题材新颖

评分

给别人买的,挺基础的!

评分

纸张和印刷都不错,网上买书也方便

评分

纸张和印刷都不错,网上买书也方便

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou 等,本站所有链接都为正版商品购买链接。

© 2025 windowsfront.com All Rights Reserved. 静流书站 版权所有