-
>
宇宙、量子和人类心灵
-
>
考研数学专题练1200题
-
>
希格斯:“上帝粒子”的发明与发现
-
>
神农架叠层石:10多亿年前远古海洋微生物建造的大堡礁
-
>
二十四史天文志校注(上中下)
-
>
声音简史
-
>
浪漫地理学:追寻崇高景观
生物信息学:序列与基因组分析(第二版) 版权信息
- ISBN:9787030176400
- 条形码:9787030176400 ; 978-7-03-017640-0
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 所属分类:>
生物信息学:序列与基因组分析(第二版) 内容简介
随着越来越多物种的基因组被测序,这些数据的计算分析变得越来越重要。本书应用数学方法分析DNA和蛋白质序列。Mount认为利用计算机程序进行运算的工作者应该理解这些程序是如何运行的。所以,他强调对运算法及这些法则与策略局限性的理解。每章都有计算的流程图,网站上还提供了与书中一致的表格和一些运算程序。第二版对本书进行了全面知识更新,本版的读者群更加广泛,包括本科生、研究生。新版书中加入了导读、信息提示和词汇,利于初学者学习。新加入一章内容,包括序列的统计分析、生物信息学程序、数据管理与挖掘。每章后的问题实例分析更增加了本书的实用性。
生物信息学:序列与基因组分析(第二版) 目录
CHAPTER 1
历史简介和概论 1
CHAPTER 2
Collecting and Storing Sequences in the Laboratory, 19
CHAPTER 3
Alignment of Pairs of Sequences, 51
CHAPTER 4
Introduction to Probability and Statistical Analysis of Sequence Alignments, 99
CHAPTER 5
Multiple Sequence Alignment, 137
CHAPTER 6
Sequence Database Searching for Similar Sequences, 193
CHAPTER 7
Phylogenetic Prediction, 241
CHAPTER 8
Prediction of RNA Secondary Structure, 283
CHAPTER 9
Gene Prediction and Regulation, 313
CHAPTER 10
Protein Classification and Structure Prediction, 353
CHAPTER 11
Genome Analysis, 431
CHAPTER 12
Bioinformatics Programming Using Perl and Perl Modules, 481
CHAPTER 13
Analysis of Microarrays, 535
Index, 667
生物信息学:序列与基因组分析(第二版) 节选
1 历史简介和概论 目录 简介 2 本书各章节结构 2 生物学家指南 2 计算科学家指南 3 生物信息学专业学生的基本要求 4 术语表 4 什么是生物信息学? 6 *先被收集的蛋白质序列 6 始于20世纪80年代早期的DNA序列数据库 7 从公众数据库中方便的获取序列 8 序列联配程序的发展 8 序列比较的点阵法或图示法 9 动态规划方法在序列联配中的运用 9 搜索序列间的局部联配 10 多序列联配 11 预测RNA二级结构的几种方法 11 从序列中发现进化关系 12 通过搜索数据库中的相似序列发现基因功能 13 FASTA和BLAST加快了数据库搜索 13 通过翻译的DNA序列预测蛋白质序列 14 预测蛋白结构 14 **个全基因组序列——嗜血杆菌(Hemophilus influenzae) 15 **个基因组数据库——AceDB 16 基因组分析方法的开发 16 通过基因芯片分析基因表达 17 大量生物数据中的数据存储和挖掘技术 18 通过BioPerl和互联网资源实现自动序列分析 18 网络上的资源 18 简介 本章介绍了生物信息学是如何演变为科学研究的一个新领域,描述了生物学和计算科学研究在该领域所扮演的角色,并简要记述了发展历史。同时还提供第二版各章节的概述。早期和现在的参考书籍、文章、综述以及杂志也为该领域提供了更广阔的视角。 本书各章节结构 每一章节以介绍段落开篇,简要地阐明了该章节的目的,接着是分别给生物和计算科学家的指南,介绍了在他们各自的研究领域中可能并不熟悉的概念,同时也提供该章节主题的介绍性指导。“本章学习内容”列出章节中重要的概念和实际的主题。术语表包括各章节中介绍部分以外的主要术语的定义。在各个章节*后的“本章检索词”是术语列表,通过它们能够对本章引用的网址进行引擎搜索。各个章节还总结了习题集,用于探究该章节中介绍的一些概念和步骤。因为是介绍和概述,**章的内容比其他各章更总括,也没有习题集。 生物学家指南 在这章中,我们描述了实验室中获得的DNA序列在计算机文件中通常如何保存,这些文件和普通的文本文件非常相似。序列文件包括序列的信息,如生物体、实验室来源、文献引用、序列名(如果是已知基因),一个或多个唯一数字,这是特定序列的主记录号或其他标识号。由于序列的数量非常大,序列文件就能够组成数据库,如GenBank数据库,经过索引,它可以基于文件序列信息非常容易地获取特定的序列;比如获取特定生物体的所有序列。数据库的格式,称为关系数据库,由相互索引的或主键表格组成。我们使用数据管理系统构建数据库,可以将数据存储在里面,也可以从中提取数据。虽然序列是文本格式保存,常用的商业文本编辑器却不能检查或处理这些文档,因为这些编辑器在文本中引入了一些控制符反而破坏了序列文件。在网络和本地计算机系统上有许多计算机程序可用于数据存取的工作。在本书中,这些程序能够从数据库中显示或获取部分或所有的序列,并以适当的格式保存,通常是有一个新的数据的库。 本章的其余部分介绍了比较和分析序列的方法,同时也为本书其他各章的做了简要的概述。主要介绍的概念是序列联配,这一方法是设法比较不同句子之间的每个字母或词,确定它们是否有相同的顺序,以表明它们是否有相关的主题。能够以这一方式联配的DNA和蛋白序列有相同生物学功能和共同的进化起源。序列联配是非常困难的计算问题,因为要进行非常多的比对,并且在包括词间空位的情况下有很多可能的不同的联配方式。动态规划是解决这一问题的一种计算方法,它将问题分解成很水的单元,只对序列开始部分做比对分析。一旦在序列开始部分搜索到*好的匹配,比对就逐步延伸到整条序列。相同的方法也被用于搜索RNA序列中可形成碱基对的互补区域,或是比较蛋白质的三维结构。 在基因组时代,一个主要的研究目的是为了分析基因的功能,阐述他们在特定生物体中的相互作用。在实验室中,模式生物的遗传学操作,测量基因表达的基因芯片,以及用于蛋白分析的蛋白质组都被用于收集新的生物学数据。来源于这些实验的信息需要组织成合适的数据格式,并且需要开发计算机程序,*好能通过网络来存取相关信息并进行数据分析。生物信息学家已经编写了不少这类程序用于序列的处理和分析。 目前,编写程序已经被简化成编写一些小的,被称为“对象”的模块程序用于处理各类简单的任务。许多对象组成的程序库能够处理几乎所有的任务,这样的库被大程序所使用就能够处理更具体的序列分析任务。比如,一个模块可用于从GenBank数据库中提取序列,而另一个模块可以将序列转化成为特定的序列格式。BioPerl对象库就是这类对象编程的一个例子。BioPerl的对象可用Perl语言编写。使用这些已经开发的模块,只要接受一些训练或是在学生或专业程序员的帮助下就能够很容易开发任何序列处理或分析的应用程序。但是,要真正的精通这些知识,有生物学背景的学生需要通过一些课程加强自己的生物学基础,如分子生物学和生物化学的实验方法课程、种群和进化遗传学的进化分析课程。他们还必须学习数学、概率和统计、数据处理、数据挖掘和建模工具、计算机算法设计和编程,以及在可能的情况下学习基因组分析和生物信息学专题的高等课程。 计算科学家指南 生命的基本单元是细胞,细胞外侧是保护性的细胞膜,它包围着一些细胞器(亚细胞结构)以及能够支持细胞结构、提供细胞能量和进行自我复制的大而复杂的生物分子。在植物和动物中,独立的细胞相互合作形成多细胞组织和器官系统,实现生物体的生物学功能。本书主要涉及在细胞和生物体中调控生物学过程的生物序列的分析,以及指导生物体发育过程中细胞组织的指令信息的分析。 序列存贮在长化学链中,称为DNA,由A、G、C、T(分别代表腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶)四种不同的信息字符或碱基以及糖和磷酸骨架组成。DNA紧密地缠绕成染色体,在显微镜下就能够看见这样的亚细胞结构。除了如单细胞细菌这样简单的生物体外,染色体位于可见的细胞核中,细胞核周围包裹着细胞质。组织细胞有两套染色体,这是被称为二倍体的一种遗传结构,两条染色体分别来自于母本和父本。在有性发育过程中,形成称为配偶子的性细胞(精于细胞或卵细胞),它拥有一套染色体(单体型)。单体型细胞中的染色体组成了生物体的基因组。在有性复制过程中,来自于两个亲本的染色体重新分类配对。接着,拥有一套新配对染色体的配偶子重新生成,并*终传递到子代中去。 染色体的DNA序列编码了制造细胞蛋白质的指令。蛋白质是有化学活性的20个氨基酸组成的线性链。每个蛋白质特定的氨基酸序列由染色体上的DNA序列确定。蛋白质的形成使生物体能够形成结构以及行使生物学功能。在转录的生物学过程中,细胞通过搜索特定的序列模式(如启动子)“阅读”DNA序列,这些特定的序列模式标志着遗传信息单位——基因的起始位置。从该点开始,在生物分子上沿着一定的化学方向读序列,直到遇到标志着基因结束的序列模式才停止。转录生成的化学长链称为信使RNA或mRAN,对应于将要生成的蛋白质的氨基酸序列。mRNA分子在结构和化学上和DNA分子非常相似,但是他们通常是单链,并且以新的碱基尿嘧啶(U)代替了胸腺嘧啶(T),在主链上也连接着不同的糖。mRNA分子也有特定的序列模式,标记了蛋白质编码开始的位置。细胞质中称为核糖体的大细胞器能够结合在蛋白质编码开始的位置,按定义的化学方向移动,每次读三个碱基位置(一个密码子)确定一个氨基酸。接着,该密码子对应的氨基酸就添加到形成蛋白质的氨基酸链上。就这样,氨基酸逐个添加,直至碰到几个终止密码子之一。每个蛋白质的序列就这样基本与染色体上的原始编码序列线性一致。 蛋白质一旦形成,将迅速由线性字串折叠成简单的螺旋和折叠单元(即二级结构),随后这些单元将形成特异的三级结构。产生的蛋白质分子作为组成构成单元形成组织或者参与特定的化学活动。一个生物体的结构及其生物学功能取决于蛋白质组,及一个生物体产成的所有蛋白。并非所有的基因都被翻译成为蛋白质——某些在RNA水平上仍保持着4个字母序列的基因,调控着许多重要的细胞进程。简单的生物体拥有数以千量的基因,而较为复杂的生物体则拥有12000~35000左右的基因。在一些生物体中,尤其是植物类生物体,可能会存在巨大数量的重复基因或重复染色体,这些多余的基因逐代复制下去,有时生成包含100000甚至更多基因的基因组。 有个概念对了解生物学家如何看待基因非常重要,就是所有生物体看起来都通过进化过程相互关联。即使是完全不同的生物体,譬如单细胞细菌和多细胞动植物,他们之间也可能有一些共同基因。这些基因通常并不是每次由新的生物起点产生,而是从先前的基因复制得来,在复制中DNA序列在有限程度上随机地产生突变。生物体可以通过二元树划分成组,在外面的分支代表联系更加紧密、进化时代较近的生物体,在内部的分支则代表更加原始,通常比较简单的生物体。这些树的构建可以基于生命信息(生物体的结构和行为),但是*近随着模式生物基因组的测序,基因组上基因的互补信息可以用来构建二元树。因此,很多的生物信息学研究关注对比基因和被翻译的蛋白质,将他们视为由4个字母(DNA)或20个字母(蛋白质)组成的线性字串。当某个生物体编码的一个蛋白质与另一生物体编码的一个蛋白质很容易比对上的话,这就告诉生物学家们这些基因来自共同祖先并且会有相同的功能。 学习基因和蛋白质还有一个重要概念。为产生一项新的生物学功能生物体似乎运用三个策略而不是构造一个全新的基因。**个策略是,复制已有的基因,其中的某个基因通过随机突变逐渐改变而发展出一个新的生物功能。在极少数情况下,这个新功能对生物体本身有利,自然选择就在这个生物中扮演了基因催生的角色。这个过程可以建立起一个相互关联的、功能重要的、可以通过进化传递的基因家族。第二个策略是,生物体将现有的基因部件(功能域)结合在一起从而形成新的基因,这些部件本身代表蛋白质三维结构或者生物功能的基本单位。生物信息通过序列比对,运用统计方法寻找序列的共有模式,做了大量的基因、蛋白质家族和序列功能域发现的下作。生物体内已有基因功能分化的第三个策略是非常少见的从不同、不相关的生物体内转移基因。通常情况下基因都是由父系向子系传递,生物学家把这个过程称作垂直传递,因为遗传沿着树状家谱的分支传递。另一种遗传方式是一段外源DNA随机地转入细胞并掺人已有染色体从而增加了基因。因为贡献基因的生物来自通常并不发生基因交换的不同种群,所以这种遗传被称作横向转移。在远古生命中,甚至认为整个细胞都能融合来创造新的物种。横向转移仍在单细胞细菌的进化中起主要的作用,尤其是在发展对特殊抗生素的抵抗力方面。所以,所有生物体都共有许多基因或基因的组成部分,现在这些都能在生物体基因组中被识别。 目前生物学家面临的两大挑战是如何发现基因的生物功能以及理解基因相互之间的作用是如何调节生命活动的。如果得不到其他物种的同源基因的信息,可以使用以下实验方法:①破坏基因序列(对序列进行改变,或插入,或删除)。②引入改变形式的基因的mRNA拷贝,它能导致细胞mRNA拷贝的降解,以一种半持久的、可遗传的方式(外成性改变)改变基因的结构,使得基因不能转录,从而关闭基因的表达。通过一整套生物学实验,可从这些遗传性或表观性改变的影响来推断基因的功能。除了遗传分析以外,生物学家还通过DNA微阵列技术和蛋白质分析实验(蛋白质组学)来跟踪许多细胞基因和蛋白质的表达。这些技术帮助发现与生物功能相关的基因表达和蛋白质发生的模式,比如癌细胞中的非正常模式。 生物信息学专业学生的基本要求 知道
- >
名家带你读鲁迅:朝花夕拾
名家带你读鲁迅:朝花夕拾
¥10.5¥21.0 - >
二体千字文
二体千字文
¥14.0¥40.0 - >
企鹅口袋书系列·伟大的思想20:论自然选择(英汉双语)
企鹅口袋书系列·伟大的思想20:论自然选择(英汉双语)
¥6.3¥14.0 - >
朝闻道
朝闻道
¥8.8¥23.8 - >
史学评论
史学评论
¥23.5¥42.0 - >
莉莉和章鱼
莉莉和章鱼
¥13.4¥42.0 - >
中国人在乌苏里边疆区:历史与人类学概述
中国人在乌苏里边疆区:历史与人类学概述
¥35.5¥48.0 - >
罗曼·罗兰读书随笔-精装
罗曼·罗兰读书随笔-精装
¥20.3¥58.0
-
昆虫的生存之道
¥14.2¥38 -
130种美鸟彩图馆
¥17.1¥39.8 -
常见药用植物快速识别
¥26.6¥80 -
喜马拉雅山珍稀鸟类图鉴
¥26.8¥68 -
万物由什么组成:化学元素的奇妙世界
¥20.1¥42 -
昆虫记彩图馆
¥17.1¥39.8