內容簡介
本書閱讀對象為本科、研究生和從事生物學及其相關專業領域(如醫學、農
學等)科研與開發人員等,可以作為生物信息學專業學生的入門教材和非生物信
息學專業學生和科研工作者的基礎教材。本書共分為四部分:生物信息學基礎
(一篇)、高通量測序數據分析(第二篇)、生物信息學外延與交叉(第三篇)和生
物信息學資源與實踐(第四篇)。各篇內容:(1)作為生物信息學的基礎篇,一
篇包括8章內容,涵蓋序列數據産生、分子數據庫、序列聯配算法、基因預測、係統
發生樹構建和蛋白質結構預測等。同時也涵蓋瞭生物信息學計算機基礎部分,
包括操作係統、主要編程語言等。該篇主要目的是使初學者掌握生物信息學的
基本概念和主要方法。(2)第二篇為高通量序列數據分析,主要針對目前第二代
和第三代測序技術産生的核苷酸序列數據,涵蓋基於高通量測序數據的基因組
拼接、基因組變異、轉錄組、非編碼RNA、甲基化和宏基因組等生物信息學分析原
理和技術。(3)第三篇為生物信息學外延與交叉,介紹瞭與生物信息學緊密相關
的四個生物學領域:係統生物學、群體遺傳學、數量遺傳學和閤成生物學。(4)
後一篇為生物信息學資源與實踐篇,主要羅列瞭生物信息學主要相關術語、專業
詞匯、數據庫和公開軟件等資源,並提供瞭8個生物信息學實驗課程內容。上述
一篇和第四篇內容建議作為本科教學的基本內容,第二篇和第三篇可以作為
研究生和生物信息學專業學生教學內容。
作者簡介
樊龍江 浙江大學生物信息學研究所和作物科學研究所教授,生物信息學和作物遺傳育種專業博士生導師。教育部“新世紀優秀人纔支持計劃”獲得者,浙江省生物信息學學會副理事長,德國DAAD訪問學者。自2000年起,直接參與浙江大學生物信息學學科籌建,為浙江大學第一批生物信息學專業導師。
目錄
緒論
第一節 生物信息與生物信息學
一、迅速增長的生物信息
二、生物信息學的概念
第二節 生物信息學簡史與展望
一、生物信息學發展簡史
二、生物信息學技術的應用
三、生物信息學學科展望
第三節 本書的組織與使用
*第一篇 生物信息學基礎
第1-1章 生物信息類型及其産生途徑
第一節 生物信息的類型
第二節 DNA測序技術
一、第一代測序技術
二、第二代測序技術
三、第三代測序技術
第三節 高通量測序技術的應用
一、DNA/RNA相關測序
二、蛋白質一DNA/RNA互作測序
三、甲基化/宏基因組測序
第四節 蛋白質序列及其結構測定
一、蛋白質序列與蛋白質互作測定
二、蛋白質結構測定
第1-2章 分子數據庫
第一節 分子數據庫概述
一、分子數據庫概念
二、數據庫記錄格式
三、數據庫冗餘、序列遞交和檢索
第二節 核苷酸及其相關數據庫
一、DNA/RNA序列數據庫
二、基因組數據庫
三、非編碼RNA數據庫
第三節 蛋白質及其相關數據庫
第四節 代謝途徑等專業數據庫
一、代謝途徑數據庫
二、代謝組學數據庫和錶型數據庫
第1-3章 兩條序列聯配算法及序列搜索
第一節 序列聯配基本概念
第二節計分矩陣
一、計分矩陣的一般原理
二、氨基酸替換矩陣
三、位置特異性計分矩陣(PSSM)
第三節 兩條序列聯配算法
一、Needleman-Wunsch算法
二、Smith-WaterTnan算法
第四節 BLAST算法及數據庫搜索
一、BLAST算法
二、利用BLAST 進行數據庫序列搜索
三、序列相似性的統計推斷
第1-4章 多條序列聯配算法及功能域分析
第一節 多序列聯配概念及其算法
一、多序列聯配概念
二、多序列全局聯配算法
三、多序列局部聯配算法
第二節 蛋白質序列功能域分析與模型
一、功能域概念
二、功能域模型
第三節 熵與信息量
一、不確定性與信息量
二、信息熵的應用
第1-5章 基因預測與功能注釋
第一節 基因組序列構成與基因預測
一、基因組序列的基本構成
二、基因預測及其基本方法
……
第1-6章 係統發生樹構建
第1-7章 蛋白質結構預測與藥物設計
第1-8章 生物信息學計算機基礎
*第二篇 高通量測序數據分析
第2-1章 基因組拼接與分析
第2-2章 基因組變異與分析
第2-3章 轉錄組分析
第2-4章 非編碼RNA分析
第2-5章 甲基化與組蛋白修飾分析
第2-6章 宏基因組分析
第2-7章 蛋白質組分析
*第三篇 生物信息學外延與交叉
第3一1章 係統生物學
第3-2章 群體遺傳學
第3-3章 數量遺傳學
第3-4章 閤成生物學
*第四篇 生物信息學資源與實踐
第4-1章 生物信息學常用代碼和關鍵詞
第4-2章 生物信息學數據庫和在綫分析工具
第4-3章 生物信息學實驗
第4-4章 生物信息學常用英文術語及釋義
參考文獻
精彩書摘
《生物信息學》:
自開始接觸生物信息學以來,一晃已近二十年瞭。我是在攻讀博士學位期間開始注意並學習生物信息學的。我的博士生導師鬍秉民為應用數學專業教授,主要從事生態係統模型模擬研究。雖然已具備一定數量統計和數量遺傳學基礎,但當時對於生物信息學,我還是非常陌生的,通過自學纔開始一點點瞭解這門新興學科。2001—2003 年間,中國科學院理論物理研究所郝柏林院士在浙江大學首次開設“生物信息學”研究生課程,我作為他的助教,係統地學習瞭生物信息學;同時,在他的帶領下從事水稻基因組分析。自那時起,浙江大學生物信息學學科和相應研究機構也逐步建立起來,如,2001 年浙江大學成立生物信息學研究所,硃軍和楊煥明任所長;2003 年浙江大學建立IBM 生物計算聯閤實驗室等。2004 年郝院士離開杭州加入復旦大學,生物信息學研究生課程就由硃軍教授和我承擔下來。現在該課程作為浙江大學全校研究生公共課程,已成為一門重點建設課程,每年選課人數都在150 人左右。
20 世紀末,我國生物信息學還處於起步階段,學習資料很少。學生時常索要學習材料,於是我整理瞭備課筆記,取名《生物信息學劄記》,於2001 年6 月上傳到實驗室主頁上供學生參考。隨著生物信息學的發展,分彆於2005 年3 月和2010 年1 月更新劄記兩次。由於網絡傳播的作用,許多生物信息學初學者都讀過該劄記,在國內産生瞭一定的影響。本書是在該劄記框架基礎上,補充大量新材料編寫而成的。
生物信息學學科內容涵蓋廣且發展很快。基於國內外生物信息學相關教材,以及自身對生物信息學的粗淺理解,我把生物信息學大緻分為四部分(篇) 內容:第一部分即基礎篇,為生物信息學的基礎知識。這部分內容總體變化不大(與10~15 年前比較),它是生物信息學的核心知識,生物信息學教學最重要的部分,應為必講內容。第二部分高通量測序數據分析篇,是最近十年纔齣現的生物信息學新內容。2005 年高通量測序技術突破後,針對該技術産生的序列數據,齣現大量生物信息學新算法和新工具。第三部分生物信息學外延與交叉,重點介紹與生物信息學密切相關的其他生物學學科。生物信息學引入瞭這些學科的部分核心技術(或反過來被引入),如數量遺傳學、群體遺傳學和新興學科閤成生物學。第四部分為生物信息學資源與實踐篇。生物信息學數據庫和軟件工具對生物學學科至關重要,所以這部分也是生物信息學重要組成部分。同時,該篇中以實踐為目的的生物信息學教學資源是課堂教學的一個很好補充。
……
前言/序言
復旦大學理論生命科學研究中心郝柏林特為該書作序
1959 年9 月,我國自行研製的104 真空管電子計算機通過國傢鑒定。它每秒鍾可以執行1 萬條浮點運算指令。2016 年6 月,在世界超級計算機500 強名單中位居首位的是我國無锡超算中心的神威太湖之光計算機,其峰值運算速度達到每秒9 億億次(93104.6 Tflops)。57 年間,運算速度提高瞭9 萬億倍。信息技術的如此發展速度是人類在所有其他科學技術領域不能比擬的,它注定要改變社會生産和生活的方方麵麵,生物學和醫學的研究也不例外。
1953 年,DNA 雙螺鏇結構的發現,把生物學推進到瞭分子水平。生命活動的核心過程由核酸和蛋白質兩大類高分子,以及它們與其他分子的相互作用決定。DNA 和蛋白質序列的測定,特彆是永無止境的基因組測序,導緻生物大數據的迅
猛增長。生物信息學應運而生。
1999 年,我提齣建立國傢級生物醫學信息中心的建議。雖然建立“中心”的計劃由於科學管理體製問題而長期擱淺,但我國生物信息學的研究和教學在廣大同行推動下仍然不斷進步。2001 年初,我和張淑譽在杭州參加華大基因的秈稻基因組測序任務。相當一部分測序工作在西湖邊上麯苑風荷附近的杭州華大基因完成。西湖“西進”之後,現在那裏隻剩下金庸茶館的一座亭子。那時華大基因楊煥明教授等學者與浙江大學相關院係商議,著手建立生物信息學研究生點。我自始至終參與瞭籌劃過程,並且承諾為2001—2003 年的三屆研究生講授“生物信息學引論”大課。浙江大學請當時已經是副教授的農學院樊龍江博士做我的“助教”。這是一位極其稱職的“助教”。他每課必在,認真地批改學生作業,同時還參加瞭水稻基因組的研究。
2004 年以後,硃軍教授和樊龍江等繼續生物信息學的講授和研究。我高興地看到,十幾年來浙江大學的生物信息學無論在學生培養,還是在科學研究方麵都取得瞭明顯成績。現在樊龍江聚團隊之力,主編瞭《生物信息學》一書,更是值得祝賀的好事。不過我自己隻有同一兩位閤作者共同寫書的經曆,對於現在比較時興的團隊著述沒有經驗,也不大放心。好在樊龍江告訴我,他在統一全書文字和體例方麵,下瞭很大功夫。我想,讀者們是會對此有所評價的。
生物信息學 下載 mobi epub pdf txt 電子書