C值悖论的C值结构
基因组大小、基因数目与生物复杂度的关系也是科学家们关注的一个重要问题。基因组大小也称为C值,是指生物体的单倍体基因组所含DNA总量。从原核生物到真核生物,C值变化很大。但是基因组及其生物的复杂度与C值之间并不一定线性相关,如变形虫的C值是人的200倍。这就是所谓的C值悖论。这种差异主要来源于非编码序列的多少。有人怀疑非编码序列与基因组的可塑性有关。与此相关的一个问题是基因数目与生物体的复杂性是否有关?这个问题引起了对G(gene)值的讨论。已经发现,一些生活史相似的近缘物种基因数不同。例如,支原体病菌中的Mycoplasmapneumonia的基因组中包括的基因数比M.genitalium的多50%。此外,基因数与生物体的复杂性也没有明显的相关性。例如,拟南芥和果蝇各自的基因数是25,000和14,000,前者编码的基因数是后者的近两倍,但从生物体的复杂性上看,并不能说拟南芥的复杂度是果蝇的两倍。这种现象就称为G值悖论。对植物和动物基因的研究提示,动物可能多用选择性剪切来增加复杂度,而植物则似乎是以基因数目来增加复杂度。但C值和G值悖论还远未解开,还有待于更多基因组进化的数据。
在基因组结构进化的探讨中,基因,特别是基因组重复也是人们关注的一个重要话题。认为,基因和基因组重复是生物进化和复杂性增加的重要原材料。Ohno提出脊椎动物的基因组可能经历了两轮重复。有许多研究者在进行基因组是否重复、重复以后如何进化等问题的研究,未来一些年中也将会是一个热门的研究课题。
基因组时代的到来,也极大地改变了许多传统进化生物学研究领域的面貌。例如人们将有机会彻底检验关于生物进化的中性进化论和选择论的激烈争论。中性进化论认为,大多数的变异是中性的。一项对果蝇基因组变异模式的研究表明,基因组中绝大部分的变异只能用选择理论解释。更多的研究提示,达尔文意义上的正选择是普遍存在的。相信未来几年中针对各种进化力量对基因和基因组的作用的分析仍然会是一个热门的进化生物学研究方向,并有望结束中性进化论在分子水平的统治地位。
构建生物系统发育的进化树也是进化生物学中的一个传统课题。但离重建整个生命之树的目标还很遥远。人们提出了雄心勃勃的计划,利用整个基因组的数据来重构生物的系统发育,并提出了系统发育基因组学(Phvlogenom七s)这一概念。随着基因组测序技术的不断改进和成本的不断降低,相信人们将有希望彻底解决生物界的系统发育问题。 基因序列:以起始密码子开始,终止密码子结束的一段DNA序列,称为开放阅读框(openreadingframe,ORF)
非基因序列:基因序列以外的DNA序列。
编码序列和非编码序
编码序列:编码RNA和蛋白质的DNA序列。
非编码序:内含子和基因的间隔序列。
单一序列和重复序列
单一序列:基因组中只有一份的DNA序列。
重复序列:基因组中重复出现的序列。例如,STR,SNP,微卫星DNA等。 功能克隆:克隆(致病)基因的一种策略。收集所要克隆的基因的蛋白质产物及其功能的信息,用以分离基因,并对基因进行定位。
定位克隆:利用遗传连锁或细胞学定位技术将致病基因定位于染色体的特定区带
主要方法:家系调查法、体细胞杂交法、核酸杂交技术
用遗传标记进行基因定位
形态标记morphologicalmarkers,细胞标记cytologicalmarkers,生化标记biochemicalmarkers,分子标记molecularmarkers分子遗传标记。
在核酸分子水平,对具有相对差异的等位基因DNA多态性的标记,广泛存在于高等生物编码区和非编码区,又称为DNA分子标记,是DNA水平上遗传变异的直接反映。特点:
1、直接以DNA形式表现,在生物体各发育阶段,各组织均可检测到。
2、数量多,遍及整个基因组。
3、多态性高,自然界存在许多等位突变,无需专门创造特殊的遗传材料
4、中性,不影响目标性状的表达,与不良性状无必然连锁
5、许多分子标记表现为共显性(codominance),能够鉴别出纯合基因型与杂合基因型,提供完整的遗传信息,其C值变化很大。 RFLPrestrictfragmentlengthpolymorphism限制性片段长度多态性。以DNA酶切片段的长度的不同,形成的多态性。
SSLPsimplesequencelengthpolymorphism简单序列长度多态性,又称为VNTRvariablenumbertandemrepeat数目可变的串联重复多态性,指重复单位相对较小,由重复单位的序列差异和数目变化,可形成丰富的多态性。包括:小卫星序列minisatellite和微卫星序列microsatellite。
小卫星DNA标记minisatellite,核心序列为11-60bp,主要存在于染色体靠近端粒处,由于其拷贝数变化,在不同个体间中存在串联数目的差异,若在重复序列两侧有限制性内切酶酶切位点,则切下来的片段会呈现出多态性。可用于DNA指纹,DNAFinger。
微卫星DNA标记microsatellite,指以2-7个碱基为核心串联重复而成的一类序列(微卫星DNAmicrosatelliteDNA,又称为STRshorttandemrepeat短串联重复序列),由于核心序列重复数目的变化而在群体中呈现出遗传多态性,但在同一家系内具有高度的遗传保守性,以孟德尔方式遗传,散布于整个基因组中。
SNPsinglenucleotidepolymorphism单核苷酸多态性,是指在基因组内特定核苷酸位置上存在两种不同碱基,其中最少一种在群体中的频率不小于1%。SNP分为两种形式:基因编码区的SNP,称为cSNP遍布于基因组内的大量单碱基变异。可见C值的大小并不能完全说明生物进化的程度和遗传复杂性的高低。 (1)SNP数量大,分步密集,平均每1000bp就有一个SNP
(2)SNP比STR扩增更有效,不会产生假带
(3)由于SNP是二态的,易于自动化批量检测,易于用计算机分析结果SNP与RFLP和STR等DNA标记的主要不同在于:
不再以“长度”的差异作为检测手段而是直接以序列的差异作为标记。但SNP单个基因座的多态性很差,只有二态,为此采用多个SNP基因座进行“单倍型”分析十分重要。
AFLPamplifiedfragmentlengthpolymorphism扩增片段长度多态性通过DNAPCR扩增基因组DNA的模板,随后用电泳将扩增片段分离,通过DNA谱带鉴别多态性。
随机扩增多态性用于扩增多态性DNA的引物是随机的。在做多态性分析时,用一组引物(20-40个)在基因组全序列上扫描可获得基因组多态性的丰富信息。
SSCPsinglestrandconformationpolymorphism单链构象多态性是基于PCR扩增而新发展起来的DNA多态性分析,利用PCR特异的扩增出基因组的目的DNA片段,变性后形成的单链DNA在自然条件下能形成一定的空间构象,C值变化很大,并且这种空间构象由DNA链的碱基序列决定,若碱基发生变化,将在电泳图谱上表现出不同生物个体的特异性,即多态性。 该方法是定位克隆的进一步发展,将疾病相关基因定位于染色体相关区域,该染色体区域得到若干候选基因
进一步分析得到目的cDNA。 原理:比较不同个体或不同细胞来源,即通常所指的样本(tester,T)和参照(driver,D)的蛋白质或mRNA两者之间的差异,如缺失或特异表达部分,从而发现新基因消减杂交(subtractivehybrization)。
利用目的基因在两种组织或细胞中表达的差异,或者在不同发育阶段、不同状态下表达差异,通过其mRNA或单链cDNA进行杂交,除去两者之间相同的基因成分,使表达有差异的基因得到充分富集。它的实质是对两组基因转录本全面比较,去同存异,分离差异表达基因Subtractivecloning。 生物信息学分析,ORF预测,同源性比较,功能预测生物信息学网页,NCBI界面,ORF预测软件:ORFFinder
读框预测实例,通过EST拼接。例如:已知小鼠某基因在人当中有高度同源序列,用该小鼠cDNA比对人的EST数据库,得到一簇EST后,将相邻的EST通过相互重叠部分进行拼接。得到人对应的完整cDNA的序列。
多重随机标签