-
>
宇宙、量子和人类心灵
-
>
考研数学专题练1200题
-
>
希格斯:“上帝粒子”的发明与发现
-
>
神农架叠层石:10多亿年前远古海洋微生物建造的大堡礁
-
>
二十四史天文志校注(上中下)
-
>
声音简史
-
>
浪漫地理学:追寻崇高景观
生物信息学 版权信息
- ISBN:9787030197719
- 条形码:9787030197719 ; 978-7-03-019771-9
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 所属分类:>
生物信息学 内容简介
主要涉及生物信息数据库、序列比对、分子系统发育分析、基因组学与基因预测、蛋白质结构与功能预测、转录组与蛋白质组分析以及Perl语言在生物信息学中的应用等内容,力求使读者全面了解和掌握生物信息学领域的重要基础知识与基本操作技能。
生物信息学 目录
前言
1绪论 1
1.1生物信息学的历史 1
1.2生物信息学的应用 7
1.3生物信息学与其他学科的关系 8
2生物数据库介绍 11
2.1序列数据库 11
2.2基因组数据库 21
2.3结构数据库 22
2.4功能数据库 24
2.5其他数据库资源 25
3序列比对 27
3.1概述 27
3.2序列比对的得分系统 29
3.3两条序列比对方法 38
3.4多条序列比对方法 48
4生物信息学常用概率统计学方法简介 59
4.1概述 59
4.2序列对位显著性检验 69
4.3贝叶斯统计在序列对位中的应用 78
5数据库搜索 83
5.1数据库检索 83
5.2数据库搜索相似序列 93
5.3序列提交 105
6分子系统发育分析 112
6.1系统发育与系统发育树 112
6.2距离法 115
6.3*大简约法 120
6.4极大似然法 122
7基因组学与基因预测 124
7.1引言 124
7.2基因组测序技术及序列组装 128
7.3功能基因组学 130
7.4比较基因组学 145
8蛋白质结构与功能预测 151
8.1蛋白质结构简介 151
8.2蛋白质三维结构分类及蛋白质家族 161
8.3三维结构比对 167
8.4蛋白质基本性质预测 170
8.5蛋白质二级结构预测 173
8.6蛋白质高级结构预测 177
8.7蛋白质互作分析 185
8.8药物发现与设计 192
9转录组与蛋白质组分析 198
9.1转录组与基因芯片简介 198
9.2基因芯片数据采集与分析 203
9.3蛋白质组简介213
9.4双向凝胶电泳数据分析 216
9.5蛋白质质谱数据分析 225
10Per1语言在生物信息学中的应用 240
10.1Per1简介 241
10.2数据结构和程序控制 243
10.3编写生物信息学应用程序 254
10.4BioPer1应用 261
生物信息学 节选
1绪论 1.1生物信息学的历史 生物信息学就其概念而言,可以追溯到1956年在美国田纳西州Gat1inburg召开的*次“生物学中的信息理论研讨会”。20世纪80年代末期,林华安博士认识到将计算机科学与生物学结合起来的重要意义,开始留意要为这一领域构思一个合适的名称。起初,考虑到与将要支持他主办一系列有关生物信息会议的佛罗里达州立大学超大型计算机计算研究所的关系,他使用的是“compbio”。之后,他又将其更改为兼具法国风情的“bioinformatique”,看起来似乎有些古怪。因此不久,他便进一步把它更改为“bioinformatics(或bio/informatics)”。但由于当时的电子邮件系统与今日不同,该名称中的“一”或“/”符号经常会引起许多系统问题,于是林博士将其去除。1987年,林华安博士正式把这一学科命名为“生物信息学”(bioinformatics)。 20世纪60年代,Zucherkand1和Pau1ing就开创了分子进化这一个全新的研究领域,主要是通过序列分析研究序列变化与进化之间的关系。这一时期,Davhoff和他的同事们收集了当时已知的氨基酸序列,这就是“蛋白质序列与结构图册”,这一蛋白质数据库后来成为著名的蛋白质信息源PIR。 20世纪70年代到80年代初期,生物化学技术有了很大的发展,DNA测序方法的J1H现,产生出许多生物分子序列数据。如何根据序列推测结构和功能,这一生物学问题促使了一系列著名的序列比较方法的出现。其中,Need1eman-Wunsch序列比对算法的提出是生物信息学发展中*重要的里程碑。同年,Gibbs和Mc1ntvre发表的矩阵打点作图法也是进行序列比较的一个著名方法。Dayhoff提出的点突变模型的PAM矩阵作为比较氨基酸相似性的得分矩阵,这一矩阵的广泛使用大大地提高了序列比较算法的性能。1980年Science第209卷发表了关于计算分子生物学的综述。1981年,Smith和Waterman提出了著名的局部对位排列算法,同年,Doo1itt1e提出关于序列模式的概念。1982年,著名的GCG分子计算工具出现。1985年,FASTP序列分析运算法则发表。1988年,Pearson和1ipman发表了著名的FASTA序列运算法则。1990年,目前常用的数据库搜索程序B1AST建立。1997年,B1AST的改进版本PSI-B1AST投入实际应用。 20世纪80年代以后,作为储存生物信息重要组成部分的生物信息数据库陆续建立。1982年,欧洲分子生物学实验室EMBI。诞生,提供核酸序列数据库服务。同年, 美国国立卫生研究院下属的国立生物技术信息中心建立了GenBank。1986年,日本核酸序列数据库DDBJ诞生。作为国际上三大生物数据库中心,之后的1988年三方达成一项协议,采用共同的数据库记录格式收集直接提交的数据。1986年,出现蛋白质数据库SWISS-PROT。 20世纪90年代后,由美国、英国、法国、德国、日本和我国共同参加的国际人类基因组(humangenomeproject,HGP)计划正式启动,这一计划旨在对人类基因精确测序,发现人类所有基因并搞清其在染色体上的位置,破译全部遗传信息。在人类基因组计划进行中,许多生物的基因组研究也相继进行。1995年,**个细菌全基因组序列——流感嗜血杆菌测定,这是人类拥有的**个全基因组信息。1996年,**个真核生物基因组——面包酵母基因组被完全测序。同年,Affvmetrix推出其**块基因芯片(genechip)。1997年,**个实验模式生物——大肠杆菌的基因组完成测序。1998年,**个多细胞生物——线虫的基因组被完全测序。2000年,**个植物拟南芥基因组和果蝇的基因组被完全测序。2001年,人类基因组草图在Nature和Sc.zence同时发表。2002年,小鼠和水稻基因组草图完成。2003年,历经十余年的人类基因组计划完成。同年中国科学家*先完成非典型性肺炎病毒全基因组测序。2005年,历时6年的国际水稻全基因组测序圆满完成。2006年,国际研究组织的科学家完成了牛基因组的测序。这些基因组计划的进行极大地促进了生物信息学的发展。 近十年来,科学家完成了包括人类基因组在内的几十种生物的全基因组测序,产生了海量的数据,而这些生物数据的量以摩尔定律呈指数增长。同时,计算机的发展速度每隔18个月就翻一倍。但从生物信息学的发展而言,直到20世纪80年代后,随着生物科学技术的飞速发展,特别是计算机科学的进步,才极大地促进了生物信息学进展。在Internet普及的今天,应用计算机科学和网络技术来解决生物学问题,已经使得生物信息学成为生命科学工作者必需的工具之一。生物信息学成为生命科学的必不可少的一部分,它的诞生和发展是科学和历史的必然。 1.1.1生物信息学与生命科学的发展 21世纪是生命科学的世纪,生物科学是自然科学中发展*迅速的学科之一,人类对于生命奥秘的探索从未停止过。生物学作为白然科学中的一个基础学科,经历了从博物学、生物学、生物科学到生命科学的发展历程,从对白然生物的描述进入了结构功能、系统演化现象本质的研究,建立了生命科学的体系。达尔文发表的《物种起源》是生物学史上**部关于生物进化的划时代著作。孟德尔发现的遗传学三大定律被认为是生物遗传的*基本规律,而Watson和Crick发现的DNA双螺旋结构及核酸是生命本质的一系列重大发现,为生物学的发展奠定了坚实的基础,从此生物学正式摆脱了博物学的那种仅依靠观察、比较的方法,发展成为一门实验性学科。生命科学作为实验和理论紧密结合的学科,它的研究手段进入了实验与模拟这一综合的研究方法体系。 在生命科学的研究中,一方面,人们认识到用物理、化学和生物学方法研究生命的物质基础、能量转换、代谢过程等的重要性;另一方面,人们也认识到需要用信息科学的方法来研究生命信息,理解生命的T作机制,揭示生命的奥秘。DNA分子和蛋白质分子携带了遗传信息、功能信息及进化信息,成为生物信息的主要研究物质。 生命科学研究的层面进入了分子水平,DNA是遗传信息的载体。DNA的核苷酸序列包含蛋白质的氨基酸序列编码信息、基因表达调控信息等遗传信息。遗传信息存储在DNA四种碱基字符组成的序列中,包含生物体生长发育的各种遗传信息。因此,DNA序列是包含着*基本的生命信息的载体。蛋白质是一切生命的物质基础,没有蛋白质就没有生命。蛋白质由20多种氨基酸组成,由于氨基酸组成的数量和排列顺序不同,使人体中蛋白质多达10万种以上。它们的结构、功能干差万别,形成了生命的多样性和复杂性。蛋白质功能的多种多样是由蛋白质的空间结构决定的。蛋白质结构作为一种重要的生物大分子信息与蛋白质序列密不可分,因此蛋白质序列可以说是包含结构信息的重要数据。 生物信息学的对象就是生物学数据,更直接地说就是分子生物学数据。随着分子生物学及其实验技术的日趋成熟,生命科学研究进入了前所未有的高速发展时期。以DNA序列为主的生物数据,其增长速度更是爆炸性的。今天在一个大型基因组测序中心,每天测序可产生以千万计的序列数据,每秒产出的碱基可达1000个。以人类基因组计划为开端的测序计划以及酵母、大肠杆菌、线虫、果蝇、小鼠、拟南芥、水稻、玉米等其他一些模式生物的基因组计划的相继完成或全面实施,使有关核酸、蛋白质的序列和结构等的分子生物学数据呈指数增长。由生物数据所产生的库多种多样,生命科学产生的生物数据储存在相关领域的数据库中,包括核酸序列数据库、蛋白质序列数据库、蛋白质结构库、酶学数据库、蛋白质双向电泳数据库、小分子配体化合物数据库,等等。 在海量生物数据产生的同时,计算机处理数据的能力增长也是以摩尔定律指数增长。计算机技术为海量生物数据的处理提供了有力的技术支持。各种数据计算方法的出现和网络的普及为生物信息学的发展拓宽了道路。 对于分析和处理生命科学产生的生物数据的生物信息学概念,有不同的定义。从广义上来说,生物信息学是指运用数学、计算机科学和生物学T具对生物学数据进行储存、检索、分析和处理,以达到揭示生物数据中的生物学内涵的目标。狭义的定义是指利用计算机技术作为研究手段和工具对生物学数据进行管理和分析。简单而言,生物信息学是从生物数据中提取新知识的学问。 生物信息学以基因组DNA序列信息分析作为出发点,辨别隐藏在DNA序列中的基因,找到基因组序列中代表蛋白质和RNA基因的编码区,阐明编码区的信息实质,破译遗传语言,认识遗传信息的组织规律。同时掌握基因调控信息,从而认识发育、进化的规律。 当前核酸分子和蛋白质分子序列的一级结构序列分析和蛋白质三维结构仍是生物信学研究的热点。 生物信息学作为生命科学研究所必需的研究T具,在生命科学实践中越来越显示出它的重要作用,特别是在实验设计、结果分析上,离不开生物信息学的指导。 1.1.2生物信息学的发展历程及方向 生物信息学的发展大致经历了3个阶段。 **个阶段是前基因组时代。这一阶段主要是以各种算法法则的建立、生物数据库的建立以及DNA和蛋白质序列分析为主要T作。在这一阶段,著名的Need1eman-Wunsch和Smith-Waterman序列比对算法先后发表;国际上的三大核酸序列数据库(EMB1、GenBank、DDBJ)相继建立并提供序列服务。 第二个阶段是基因组时代。这一阶段以各种基因组计划测序、网络数据库系统的建立和基因寻找为主要工作。以人类基因组计划和各种模式生物基因组测序为主要T作,大规模测序全面铺开。 第三个阶段是后基因组时代。这一阶段的主要工作是进行大规模基因组分析、蛋白质组分析以及其他各种基因组学研究。随着人类基因组计划和各种基因组计划测序的完成,以及新基因的发现,系统了解基因组内所有基因的生物功能成为后基因组时代的研究重点。生物信息学进入了功能基因组时代。 人类基因组计划的完成标志着后基因组时代的开始。蕴藏着人类生命遗传奥秘的遗传语言由30亿个碱基对组成,破译遗传语言的人类基因组计划被誉为生命科学的“登月”计划,它耗时13年,于2003年完成。各国分别承担T作比例为美国54%,英国33%,日本7%,法国2.8%,德国2.2%,中国1%。许多模式生物基因组计划完成了测序工作,更多的生物基因组正在被列入测序计划中。人类掌握了极大量的遗传数据,期待揭示其中的生命奥秘。这也标志着基因组学进入了揭示基因功能的阶段,即功能基因组时代。功能基因组研究基因组的组成和功能,认识基因与疾病之间的关系,掌握基因的产物及其在生命活动中的作用。功能基因组从基因组整体水平上研究生命活动规律,特别是在研究基因与疾病的关系上,改变了生物学研究的传统方法。传统上研究基因和蛋白质的功能只能通过假设的方法,经过反复实验对候选基因进行逐一验证,才能确定所选基因与其表型相关。这种传统的研究方法周期长、花费大,而且依赖于能观测到的表型,不能全面了解所有相关基因及其功能。而生物信息学新的研究方法从生物基因组这个整体水平上,通过从基因到表型的途径,直接对其生物功能进行研究。这种新的实验设计思路缩小了研究对象的范围,实现了功能预测、实验证实,极大地推进了研究速度。 生物信息学步人后基因组时代,其发展方向主要有以下这些方面。 1)各种生物基因组测序及新基因的发现 人类基因组和许多模式生物的基因组测序已经完成,接下来的工作是对更多生物基因组的测序,获取更多物种的全部基因。这是基因组研究的*要工作。大规模测序T业化,白动基因测序技术日趋成熟,使得基因组的测序速度得到极大提高。目前以这样的设备和技术完成一个细菌基因组的测序只需一周时间,完成一个平均大小的高等真核生物基因组也缩短至2年内。测序基因组过程是这样的:将基因组DNA切断成小片段,分别测序,再将它们拼接起来。这一看
- >
人文阅读与收藏·良友文学丛书:一天的工作
人文阅读与收藏·良友文学丛书:一天的工作
¥14.7¥45.8 - >
回忆爱玛侬
回忆爱玛侬
¥9.8¥32.8 - >
山海经
山海经
¥20.4¥68.0 - >
龙榆生:词曲概论/大家小书
龙榆生:词曲概论/大家小书
¥7.7¥24.0 - >
姑妈的宝刀
姑妈的宝刀
¥9.0¥30.0 - >
苦雨斋序跋文-周作人自编集
苦雨斋序跋文-周作人自编集
¥6.9¥16.0 - >
【精装绘本】画给孩子的中国神话
【精装绘本】画给孩子的中国神话
¥17.6¥55.0 - >
朝闻道
朝闻道
¥15.0¥23.8
-
昆虫的生存之道
¥14.2¥38 -
130种美鸟彩图馆
¥17.1¥39.8 -
常见药用植物快速识别
¥26.6¥80 -
喜马拉雅山珍稀鸟类图鉴
¥26.8¥68 -
万物由什么组成:化学元素的奇妙世界
¥20.1¥42 -
昆虫记彩图馆
¥17.1¥39.8