基因组学整理试题
填空题:
1.位置效应的两种类型:稳定型,花斑型
2.细胞器基因组:线粒体基因组,叶绿体基因组
3、基因组进化的分子基础:突变,重组,转座
4.RNA聚合酶的三种类型:pol1(RNA聚合酶1),po12(RNA聚合酶2),po13(RNA聚合酶3)
5、转座子分类:DNA转座子,逆转录转座子
6、克隆载体的几种类型:YAC,BAC,HAC,MAC
7、重叠群组建的方法:步移法,指纹法
8、真核生物负责DNA先行链复制的聚合酶Polδ,后随链复制和修补合成的聚合酶Polε
9.DNA聚合酶Ⅰ主修复有5`一3`聚合酶活性,3`一5`外切酶活性,5`一3`外切酶活性;DNA聚合酶Ⅱ有5`一3`聚合酶活性,3`一5`外切酶活性;DNA聚合酶Ⅲ主复制有5`一3`聚合酶活性,3`一5`外切酶活性
10、mRNA的定位依赖于mRNA分子的ZIPcode
11、人类X染色体的失活由lncRNA分子促发
12、重叠群有连续的和非连续的序列以及草图序列和精细序列
13、同源基因可分为直系同源基因(不同物种)、共生同源基因(同一物种基因倍增)和倍增基因(同一物种全基因组加倍)
14、协同进化基因功能的方法:机械的或物理的连锁,功能的或互作的连锁
15、研究功能基因可以使其失活或过量表达
16、蛋白质互作可以通过噬菌体展示和酵母双杂交技术进行研究
17、病*基因组除逆转录病*外均为单倍体
18、高GC比例区总分布在基因密集区或常染色质区,高AT比例区大多数分布在贫基因区或异染色质区
19、表观遗传修饰大致分为DNA的特定碱基结构修饰和染色质构型重塑
20、分子进化具有速率恒定性和保守性的特点
21、古人类可以看一看,就是基因组交流
22、人类基因组计划有四张图:遗传图、物理图、序列图、转录图
名词解释:
1.C值:是指一个单倍体基因组中DNA的总量,一个特定的种属具有特征的C值。
2.C值悖理:生物种属所具有的基因数目与其生物结构的复杂性不成比例的现象。
3.N值悖理:基因数目与进化程度或生物复杂性的不对应性,称之为N值悖理(N所表示的是基因数目)。
4.基因家族:来自一个共同的祖先,因基因加倍和趋异进化产生许多在DNA序列上基本一致,功能相近而略有不同的成员。
1)大部分担负类似的生物学功能.
2)比较各个成员间的序列差异,可追踪基因的演变轨迹。
5.假基因:来源于功能基因但已失去原来功能的DNA序列,可视为基因组中与编码基因序列非常相似的非功能性基因组DNA拷贝,一般情况都不被转录,且没有明确生理意义,包括重复假基因、加工假基因、残缺假基因,常用ψ表示。
6.DNA标记
一代:限制性片段长度多态性(RFLP)——同一物种的亚种、品系或个体间基因组DNA
受到同一种限制性内切酶作用而形成不同的酶切图谱的现象
二代:简单序列长度多态性(SSLP)——可变排列的简单重复序列,即重复次数不一,在染色体的同一座位重复序列拷贝数不同:包括小卫星序列(VNTR)、微卫星序列(SSR)
三代:单核苷酸多态性(SNP)——SNP是指同一物种不同个体基因组DNA的等位序列上单个核苷酸存在差异的现象。其中最少一种在群体中的频率不小于1%;如果出现频率低于1%,则视作点突变。
7,分子进化速率:指蛋白质和核酸等生物大分子在进化过程中核苷酸或氨基酸残基发生替换的频率
8.表达序列标签(EST):*从一个随机选择基因转录产物的cDNA克隆进行5`端和3`端单一次测序获得的短的cDNA部分序列,代表一个完整基因的一小部分,来源于一定环境下一个组织总mRNA所构建的cDNA文库,能说明该组织中各基因的表达水平。
9.转座因子:原核生物与真核生物基因组中广泛存在的一类可以移动位置的遗传因子。10.CpG岛:基因组中富含GC碱基的DNA区段。
满足CpG岛的条件为:1)连续bp的DNA顺序:2)CG含量大于55%;3)观测到的CpG双碱基数目与预期的数目之比大于0.65.
11,位置效应:由于基因变换了在染色体上的位置而引起表现型改变的现象。
12,顺式作用元件:转录上游区与转录相关的具有调控作用DNA序列。
反式作用因子:能够直接或间接辨认、结合转录上游的调控区段DNA的蛋白质。
13,协同进化:指同一家族重复基因成员在进化的过程中始终保持序列和功能的一致性,如rRNA基因。
趋异进化:指重复基因拷贝中,有些成员在进化的过程中仍然保留原有的功能,但表达模式发生了变化。另一些成员因编码序列变异产生了新的功能,还有一些成员在自然选择过程中被淘汰,如植物的MADS基因。
14,RNA编辑:某些RNA,特别是mRNA的一种加工方式,它导致了DNA所编码的遗传信息的改变,因为经过编辑的mRNA序列发生了不同于模板DNA的变化,包括:单碱基突变和尿嘧啶的缺失和添加
15,大分子DNA克隆载体构建:
酵母人工染色体(YAC):是利用酿酒酵母的染色体的复制元件构建的载体,其工作环境在酿酒酵母中,它可以克隆和分析大片段的染色体DNA,并且可以外离那些在大肠杆菌中不可能得到的序列。将来自其他物种的较大片段DNA连接到酵母INA上,在宿主细胞中外来DNA能随着酵母细胞中的其他染色体一起复制。
细菌人工染色体(BAC):以细菌F因子为基础,人工构建的环状的DNA分子,可以携带大于—Kb的外源MNA片段。
16,表观遗传:DNA序列不发生改变但基因表达却发生了可遗传的变化,并最终导致了表型的变化的一种有别于传统遗传学的遗传方式。
17,绝缘子(insulator):可以阻止邻近位置激活或失活效应的顺序。
18,单倍型:不发生重组与交换的一段多态性DNA顺序。
19,基因组编辑(genomeediting)或基因组工程(genomeengineering):一种新兴的比较精确的能对生物体基因组特定目标基因进行修饰(插入、代换与切除)的一种基因工程技术,包括巨型核酸酶、ZFN锌指核酸酶、TALE转录激活样效应因子核酸酶、CRISPER/Cas系统。
20,遗传杂交性:不同类型分子标记的利用价值与特定的分子标记在一个群体中的多态性有关,这种多态性指一个群体中等位基因杂合个体占总样本的比例。
21,重组框遗传图:重组分析检测到的最小独立重组区域,根据分子标记将这些最小重组区域按其排序构建的图谱。
22,锚定标记:衔接不同基因组图的分子标记。
23,蛋白质指纹(蛋白质结构域):特指蛋白质成员中结构域的组合形式以及排列次序。
24,反求遗传学:从基因出发,通过有目的的改变靶基因来观测表型。(诱导突变)
正向遗传学:从表型出发最终到达基因。(定位克隆)
25,功能基因组(后基因组)学:探明基因组的功能在不同组织和细胞中,以及不同时期(发育阶段)的表达模式和调控方式,其延伸的很多分支又统称为组学。
26,宏基因组(元基因组、环境基因组、生态基因组)学:通过直接从环境样品中提取全部微生物的DNA,构建宏基因组文库,利用基因组学的研究策略研究环境样品所包含的全部微生物的遗传组成及其群落功能。它是在微生物基因组学的基础上发展起来的一种研究微生物多样性、开发新的生理活性物质(或获得新基因)的新理念和新方法。人类第二基因组就是人类体内的微生物组。
27,DNA甲基化:指在DNA甲基转移酶的作用下,以s-腺苷甲硫氨酸(sAM)为甲基供体,将甲基基团转移到胞嘧啶第5位碳原子上。
28,2R假说:假说认为,在脊椎动物进化中,曾经发生过2次全基因组水平的加倍(无脊椎动物基因成员出现前后),比较基因组顺序表明,在哺乳动物30个基因中平均有两个同源基因(文昌鱼证实)
29,物理图谱:利用限制性内切酶将染色体切成片段,再根据重叠序列确定片段间连接顺序,以及遗传标志间物理距离(以碱基对、千或兆碱基为单位)的图谱。描绘DNA上可以被识别的标记位置以及相互之间的距离(以碱基对的数目为衡量单位),这些可以识别的标记包括限制性内切酶的酶切位点.特定基因等
遗传图谱:遗传连锁图谱,是基因组研究中的一个重要组成部分,它是指基因组中基因以及专一的多态性标记之间相对位置的图谱
30,全基因组关联分析:应用基因组中数以百万计的单核苷酸多态性(singlenucleotidepolymorphism,SNP)为分子遗传标记,进行全基因组水平上的对照分析或相关性分析,通过比较发现影响复杂性状的基因变异的一种新策略
31,副突变:一个等位基因可以使其同源基因的转录产生稳定可遗传变化的途径
32,增强子(enhancer):又可译为强化子,是DNA上一小段可与蛋白质(反式作用因子;trans-actingfactor)结合的区域,与蛋白质结合之后,基因的转录作用将会加强。增强子可能位于基因上游,也可能位于下游。
33,反义基因:又称反义链,在20世纪60年代的文献上常把作为转录模板的那条链称为有义链或称有义DNA,而另一条单链就称为反义DNA或称反义链,而较近期的文献则相反,把不作模板转录的链称为有义DNA或称编码链,作为模板转录的链称为反义链或反义DNA,或模板链。
简答题:
一、简述原核生物基因组和真核生物基因组的特点和差异。
真核生物基因组特点:
1)结构松弛;
2)大量重复序列;
3)由线性DNA与蛋白质组成染色体结构;
4)含有细胞器基因组;
5)多个染色体(酵母除外),基因数相对较多,在染色体上分布不均匀;
6)功能相关的基因大多分散在不同的染色体上,即使成族排列也不存在操纵子结构,转录产物为单顺反子;
7)相关的基因构成各种基因家族,多拷贝;
8)非编码序列远远多于编码序列;
9)真核基因是断裂基因,含内含子。
原核生物基因组特点:
1)结构紧凑;
2)大小在5Mb以下;
3)缺少重复序列;
4)含质粒基因组;
5)单一染色体、单一DNA复制起点,基因数量较少;
6)功能相似的基因往往定位在同一区域,操纵子是原核生物基因组的特征,转录产物为多顺反子mRNA;
7)多为单拷贝基因(单一序列基因);
8)非编码序列很少,编码序列一般不重叠;
9)基因序列是连续的,无内含子。
二、第一、二、三代测序技术的代表及其基本原理
第一代测序技术
1,链终止法:合成与单链DNA互补的多核苷酸链,由于合成的互补链可在不同位置随机终止反应,产生只差一个核苷酸的DNA分子,从而来读取待测DNA分子的序列
2.化学降解法:将一个DNA片段的一端作放射性标记,再分别采用不同的化学方法修饰和裂解特定碱基,从而产生一系列长度不一的片段,这片段群通过凝胶电泳分离,确定各片段末端碱基
第二代测序技术
1.自动化测序:(1)荧光染料标记,由于每种ddNTP带有各自特定的荧光颜色,而简化为由1个泳道同时判读4种碱基。
(2)毛细管电泳:毛细管装置有96个泳道,每次可同时进行96次测序
2.循环阵列合成测序
3.芯片测序:杂交测序方法,即通过与一组已知序列的核酸探针杂交进行核酸序列测定的方法。在一块基片表面固定了已知序列的八核苷酸的探针,当溶液中带有荧光标记的核酸序列TATGCAATCTAG,与基因芯片上对应位置的核酸探针产生互补匹配时,通过确定荧光强度最强的探针位置,获得一组序列完全互补的探针序列。据此可重组出靶核酸的序列。
4.焦磷酸测序:脱氧三磷酸核苷酸连接到DNA,3`末端时会释放1个焦磷酸(PPi),焦磷酸在磷酸化酶的作用下转化为化学能,并发出光亮。
第三代测序技术(单分子测序,直接测序)
单分子测序仪、SMRT技术和纳米孔单分子技术。
三、作图法测序与鸟枪法测序的区别
序列组装原理:直接从已测序的小片段中寻找彼此重叠的测序克隆,然后依次向两侧邻接的序列延伸。
1.全基因组鸟枪法(霰弹枪法)是一种快速获得真核基因组的方法,属于“由下而上”测序。此测序方法绕过分离基因的难关,在基因组DNA文库中筛选出目的基因。测序不需背景信息,时间短,费用低,但需要大型计算机(以全基因组为单位),得到的是草图(框架图,Draft),但最终排序结果的拼接组装不容易。
过程:
首先进行全基因组鸟枪法测序,序列重叠片段制成重叠群,以大分子克隆法归并重叠群。再以基因组图的分子标记为起点,将鸟枪法DNA片段进行组装。根据高密度的基因组图分子标记,检测组装片段是否处在正确的位置,校正因重复顺序的干扰产生的序列误排。
2.克隆重叠群法,又称作图法测序,限制测序,逐步克隆法,属于“由上而下”测序。这种逐步测序的方法需要构建精确的物理图谱,花时间多,费用高,但是对计算机性能要求低(以BAC为单位),且可以得到精确图谱。
过程:相互间存在重叠顺序的一组克隆,根据重叠顺序的相对位置将各个克隆首尾连接,覆盖的物理长度可达百万级碱基对。在单个的重叠群中,采用鸟枪法测序,然后在重叠群内进行组装。
四、物理图的作图方法
1)限制性作图(Restrictionmapping),它是将限制性酶切位点标定在DNA分子的相对位置。
2)依靠克隆的基因组作图(Clone-basedmapping),根据克隆的DNA片段之间的重叠顺序构建重叠群(Contig),绘制物理连锁图。
3)荧光标记原位杂交(Fluorescentinsituhybridization,FISH),将荧光标记的探针与染色体杂交确定分子标记的所在位置。
4)顺序标签位点(Sequencetaggedsite,STS)作图,通过PCR或分子杂交将小段单拷贝DNA顺序定位在基因组的DNA区段中。
五、焦磷酸测序法的原理
将PCR扩增的单链与引物杂交,并与DNA聚合酶、ATP硫酸化酶、荧光素酶、三磷酸腺苷双磷酸酶、底物荧光素酶和5`磷酸硫腺苷共同孵育,然后脱氧核糖核苷三磷酸即按照碱基配对的原则依次连接到引物上。在每一轮测序反应中,只加入一种dNTP,若该dNTP与待测模板配对,DNA聚合酶可以将其掺入到合成链中并释放出等摩尔数的焦磷酸基团(PPi)。ATP硫酸化酶在APS存在的情况下催化焦磷酸形成ATP,ATP驱动荧光素酶介导的荧光素向氧化荧光素(oxyluciferin)的转化,氧化荧光素发出与ATP量成正比的可见光信号。ATP和未掺入的dNTP由三磷酸腺苷双磷酸酶降解,淬灭光信号,并再生反应体系,然后加入下一种dNTP,如此循环。
六、遗传作图
理论基础:采用一组分子标记构建遗传图的方法主要依赖于连锁分析。
基本方法:两点测验法和三点测验法。
由于较远的两基因之间发生偶数次交换,但没有出现重组类型,所以交换值要大于重组率。绘制连锁遗传图时,需根据重组率进行图距的校正。
系谱分析法,家系分析法(pedigreemethod)
人不能进行有计划的遗传实验,只能收集家系成员的相关资料进行连锁分析,即对某家庭性状相关成员进行统计,分析性状之间的连锁关系,通过重组率进行相关基因定位,主要涉及人类和多年生树木优势对数值(LODscore)分析:LOD值是基因连锁可能性的对数,用于判定所研究的两个标记是否在同一染色体上,换句话说就是基因是否连锁。如果优势对数分析确定了连锁,然后可以提供最可能的重组频率程度。理想的情况是资料来自不同系谱。
七、基因功能检测的方法
1.基因失活是基因功能分析的主要手段方法:基因剔除
2.基因的过量表达用于基因功能预测技术:增加拷贝数,提供强启动子
3.高通量基因功能的研究方法:
1)突变库构建;2)RNA干扰与基因功能检测;3)蛋白质互作
八、mRNA如何进行加工与修饰
1)mRNA的5`端加帽
帽子结构:7-甲基鸟苷三磷酸。
功能:在翻译过程中起识别作用,以及对mRNA起稳定作用。
2)mRNA的3`端多聚腺昔酸化(加尾)
尾部结构:3`端的polyA。
功能:对mRNA的成熟是必要的,防止核酸外切酶对mRNA信息序列的降解。
3)修饰(对某些碱基进行甲基化)
甲基化:m6A(N6_甲基腺嘌吟)功能:可能对mRNA前体加工起识别作用。
4)mRNA的剪接,即剔除内含子,连接外显子形成成熟的mRNA
5)RNA编辑
mRNA由于碱基的插入,缺失或置换而改变DNA模板来源的遗传信息,引起编码信息的改变,翻译出多种氨基酸序列不同的蛋白质,是基因调控的重要方式。
九、序列间隙与物理间隙
序列间隙:因覆盖率的原因而留下的未能测序的序列,仍存在于克隆文库中,这类间隙称为序列间隙。解决方法:通过相邻已知序列作为探针筛选已有的基因组文库。
物理间隙:因克隆载体自身的限制或DNA顺序特殊的组成等原因造成某些序列丢失或未能克隆,这类间隙称为物理间隙。解决方法:利用其它宿主菌与载体重新构建文库。
十、序列标记
简单序列重复标记(Simplesequencerepeat,SSR标记)或
简单序列长度多态性(Simplesequencelengthpolymorphism,SSLP标记)
主要特点:1)数量丰富,广泛分布于整个基因组;2)具有较多的等位性变异;3)共显性标记,可鉴别出杂合子和纯合子;4)实验重复性好,结果可靠;5)由于创建新的标记时需知道重复序列两端的序列信息,因此其开发有一定困难,费用也较高。
STS标记(Sequencetaggedsites)
STS是指基因组中长度为-bp,且核苷酸顺序已知的单拷贝序列,通过PCR可将其专一扩增出来。
主要特点:1)标记来源广,数量多;2)共显性遗传,可区分纯合子和杂合子;3)技术简便,检测方便;4)与SSR标记一样,开发依赖于序列分析及引物合成,成本较高;5)多态性常常低于相应的RFLP标记,这是因为STS仅仅检测该引物所分布区域的片段差异或酶切位置差异,而RFLP标记的多态性往往可能是探针以外区域的差异,这一部分差异无法转化成STS标记的多态性。
限制性片段长度多态性标记(Restrictionfragmentlengthpolymorphism,RFLP标记)
特定生物类型的基因组DNA经某一种限制性内切酶完全酶解后,会产生分子量不同的同源等位片段,或称限制性等位片段。RFLP标记技术的基本原理就是通过电泳的方法分离和检测这些片段。
该技术包括以下基本步骤:DNA提取;用DNA限制性内切酶消化;凝胶电泳分离限制性片段;将这些片段按原来的顺序和位置转移到易操作的滤膜上;用放射性同位素或非放射性物质标记的DNA作探针与膜上的DNA杂交(称Southern杂交);放射性自显影或酶学检测显示出不同材料对该探针的限制性酶切片段多态性。
主要特点:1)遍布于整个基因组,数量几乎是无限的;2)无表型效应,不受发育阶段及器官特异性限制;3)共显性,可区分纯合子和杂合子;4)结果稳定、可靠;5)DNA需要量大,检测技术繁杂,难以用于大规模的育种实践中。
十一、去甲基化方法
主动途径:去甲基酶作用下将甲基基团移去的过程。在DNA甲基化阻遏基因表达的过程中,甲基化CpG粘附蛋白起着重要作用。虽然甲基化DNA可直接作用于甲基化敏感转录因子E2F、CREB、AP2、CMycMyn、NF2KB、Cmyb、Ets,使它们失去结合DNA的功能从而阻断转录,但是,甲基化CpG粘附分子可作用于甲基化非敏感转录因子(SP1、CTF、YY1),使它们失活,从而阻断转录。
被动途径:由于核因子NF粘附甲基化的DNA,使粘附点附近的DNA不能被完全甲基化,从而阻断DNMT1的作用。
十二、mRNA降解
正常转录物是指细胞产生的有正常功能的mRNA,其降解主要有3种不同的方式:依赖于脱腺苷酸化的mRNA降解、不依赖于脱腺苷酸化的mRNA降解和核酸内切酶介导的mRNA降解,是细胞内大部分mRNA降解的途径。
异常转录物是细胞在功能紊乱情况下产生的一些非正常转录物,其降解是细胞保持其正常的生理状态所必需的,也有3种方式:无义介导的mRNA降解(nonsense-mediatedmRNAdecay,NMD)、NSD降解(non-stopdecay)和NGD降解(no-godecay)。
十三、细胞内蛋白质降解的主要途径有哪些?
真核细胞内蛋白质的降解途径主要有三种,溶酶体途径、泛素化途径和胱天蛋白酶(caspase)途径。
1、溶酶体途径:蛋白质在溶酶体酸性环境中被相应的酶降解,然后通过溶酶体膜的载体蛋白运送至细胞液,补充胞液代谢库。
胞内蛋白:胞液中有些蛋白质的N端含有KFERQ信号,可以被HSC70识别结合,HSC70帮助这些蛋白质进入溶酶体,被蛋白水解酶降解。
胞外蛋白:通过胞吞作用或胞饮作用进入细胞,在溶酶体中降解。
2、泛素-蛋白水解酶途径:特异性降解蛋白的重要途径,参与机体多种代谢活动,该通路依赖ATP,有两步构成:
①靶蛋白的多聚泛素化:泛素激活酶E1利用ATP在泛素分子C端Gly残基与其自身的半胱氨酸的SH间形成高能硫脂键,活化的泛素再被转移到泛素结合酶E2上,在泛素连接酶E3的作用下,泛素分子从E2转移到靶蛋白,与靶蛋白的Lys的ε-NH2形成异肽键,接着下一个泛素分子的C-末端连接到前一个泛素的lys48上,完成多聚泛素化(一般多于4个)。
②多聚泛素化的蛋白质被26S蛋白水解酶复合体水解:经泛素化的底物蛋白可以被26S蛋白酶体的盖状调节颗粒识别,并被运送到20S的圆柱状核心内,在多种酶的作用下水解为寡肽,最后从蛋白酶体中释放出来。泛素则在去泛素化酶的作用下与底物解离后回到胞质重新利用。
3、胱天蛋白酶(caspase)途径:细胞凋亡的蛋白质降解途径。
Caspase的含义指该类蛋白酶的活性部位为极为保守的半胱氨酸(cysteine)及特异性切割底物的天冬氨酸(aspase),简称caspase。根据其具体功能分为调控caspase(caspase1,2,4,5,8,9,10)和效应caspase(caspase3,6,7,11)。
Caspase以酶原形式存在于正常细胞中,细胞凋亡启动后被激活。一条途径是由死亡信号分子和受体结合后的死亡结构域介导,使caspase-8自身催化成为具水解酶活性的蛋白酶,水解下游的caspase-3,6,7等,caspase-3,6,7作用于底物使其降解,导致细胞凋亡;另一条途径由位于线粒体上的细胞色素C介导,激活caspase-9,活化的caspase-9进而激活caspase-3。细胞凋亡中被降解的蛋白有:DNA损伤修复酶、U1小核核糖核蛋白组分、核纤层蛋白、肌动蛋白和胞衬蛋白等,这些酶及蛋白的降解导致细胞形成凋亡小体,最终被吞噬细胞吞噬消化。
4、其他:有些细胞器具有特有的蛋白水解酶,确保细胞内各项代谢活动有条不紊地进行。如线粒体的La蛋白酶、高尔基体内Kex2水解酶、细胞膜表面的水解酶系统等。
十四、基因组学在遗传检测/基因诊断、微生态等方面的应用(原理)
(1)基因组表达及调控的研究。在全细胞的水平,识别所有基因组表达产物mRNA和蛋白质,以及两者的相互作用,阐明基因组表达在发育过程和不同环境压力下的时、空的整体调控网络。
(2)人类基因信息的识别和鉴定。要提取基因组功能信息,识别和鉴定基因序列是必不可少的基础工作。基因识别需采用生物信息学、计算生物学技术和生物学实验手段,并将理论方法和实验结合起来。基于理论的方法主要从已经掌握的大量核酸序列数据入手,发展序列比较、基因组比较及基因预测理论方法。识别基因的生物学手段主要基于以下的原理和思路:根据可表达序列标签(STS);对染色体特异性cosmid进行直接的DNA选择;根据CpG岛;差异显示及相关原理;外显子捕获及相关原理;基因芯片技术;基因组扫描;突变检测体系,等等。
(3)基因功能信息的提取和鉴定。包括:人类基因突变体的系统鉴定;基因表达谱的绘制;“基因改变功能改变”的鉴定;蛋白质水平、修饰状态和相互作用的检测。
(4)测序和基因多样性分析。人类基因组计划得到的基因组序列虽然具有代表性,但是每个人的基因组并非完全一样,基因组序列存在着差异。
(5)比较基因组学。将人类基因组与模式生物基因组进行比较,这一方面有助于根据同源性方法分析人类基因的功能
十五、基因本体
是一个在生物信息学领域中广泛使用的本体,是对生物信息学序列注释等信息表达统一化的工具(树形结构词汇表),涉及的基因和基因产物词汇(GO词条)分为三大类,涵盖生物学的三个方面:
细胞组分(cellular