生物学

新的RNA基因是如何产生的

基因生成与进化的研究重点是鉴定祖先的遗传序列,这些序列在进化过程中高度保守,可以作为基因发育的基础。纽约石溪大学(Stony Brook University)文艺复兴医学院(Renaissance School of Medicine)名誉教授尼古拉斯·德利亚斯(Nicholas Delihas)已经识别出了一个这样的祖先元素,并提供了数据和模型,以展示新的RNA基因是如何以祖先序列为基础创造出来的。在进化上,这个小序列也构成了两个古老基因的重要组成部分,-谷氨酰基转移酶(GGT5)和泛素特异性肽酶18 (USP18),但这些蛋白质基因是如何产生的尚未确定。

基因复制,即从现有基因的精确复制中形成新的基因,长期以来一直被认为是基因形成背后的主要过程。然而,已有研究表明,基因可能来自非编码DNA,即具有开放阅读框并显示翻译活性但不编码蛋白质的DNA区域。这一过程被称为基于原基因序列或不代表现有基因的序列的新生蛋白基因形成。这一概念是由匹兹堡大学的Anne-Ruxandra Carvunis博士及其同事以及其他机构的研究人员提出的。它构成了一个模型来解释在进化过程中,新的和不同的蛋白质基因是如何通过从头生成机制而不是现有的基因序列复制产生的。

ustas7777777 / Shutterstock.com

纽约石溪大学文艺复兴医学院的Nicholas Delihas博士最初试图了解RNA基因家族中的重复DNA序列,即在人类第22号染色体中发现的FAM230长基因间非编码RNA (lincRNA)家族。这种重复序列和RNA基因家族可能与人类遗传疾病的发病有关,包括异常的染色体重组和随后的染色体缺失。然而,这些研究导致一个意想不到的发现的祖先DNA重复序列,称为FAM247,这可以作为一个gene-forming元素:成新的RNA基因开发相似的概念设想新创蛋白质Carvunis博士出生的同事和其他机构的科学家们。

一种进化的保守序列形成了各种基因的一部分,并且似乎是在进化期间开发新基因的成核位点。

进化科学家经常调查人类和灵长类以及其他物种的遗传结构,以发现不同基因在不同种群适应环境的方式中发挥的具体作用,并绘制出在进化过程中基因组发生的任何变化。最近,人们主要关注长非编码RNA (lncrna)基因的基因组测定和测序,这些基因现在被认为是许多生化途径的关键角色。这就引出了一个问题:基因组中有多少lncRNA基因,它们在进化过程中的年龄以及它们是如何出生的。

图1. FAM247序列在进化时间形成各种基因。伪原,GGT5和USP18仅含有FAM247序列的段,而FAM247 LINCRNA基因含有全序列。USP18蛋白质羧基末端序列对于免疫系统的调节至关重要。

随着对De Novo基因的研究的兴趣增加,即由划痕而不是来自模板的基因,这也导致了关于事实构成基因的问题。通常同意遗传序列是导致形成功能性产品的遗传序列,其可能是RNA或蛋白质。存在不同的方法,以确认基因是功能实体。一种方法是通过生物化学技术确认RNA和蛋白质水平的基因表达。另一种方法是破坏特定的遗传序列并观察表型中发生任何变化。然而,这可能在分析整个基因组时是有问题的。进化方法看起来有特定的遗传'签名',其提供选择的证据,试图确认基因的存在。另一方面,尽管与基因的鉴定相关的挑战,但现在有足够的证据表明在整个进化历史上发生了De Novo基因形成的现象。

图2所示。POM121L9P基因的诞生可以通过将推定的POM121L-1和BCR基因的部分序列添加到FAM247序列中来观察。FAM247序列位于人类染色体的一个位点,该位点与在黑猩猩中发现的类似染色体位点具有序列同源性,并代表基因形成的成核位点。POM121L1是pom121样蛋白1基因。POM121是脊椎动物核孔复合体的膜成分。POM121L1序列附着在FAM247序列的左侧(5 ')。在FAM247的右侧(3 ')有一段BCR基因,称为BCR RhoGEF和GTPase激活子。

发现进化保守的成核位点
最近在人类中形成了5个FAM247 lincRNA家族基因,该基因家族似乎起源于FAM247序列的基因序列复制,该序列长度为11231 bp。这与通过基因复制建立的基因家族起源模型一致。然而,其他基因、假基因和蛋白基因也发现含有FAM247 lincRNA家族序列片段(见图1).这些伪基因特别有趣,因为它们是独特的,包含与FAM247或起源的亲本基因无关的外源染色体序列;因此,它们与真正的伪基因有很大的不同。伪基因是指具有蛋白质基因序列的副本,但由于序列中的关键突变而不能形成蛋白质产物的基因。

FAM247序列或部分序列存在于斑马鱼USP18基因中。这可能暗示泛素特异性肽酶USP18的某些功能起源于数亿年前的脊椎动物。Kazakov马克西姆/ Shutterstock.com

Delihas博士提出了一个包含这些所谓伪基因的基因形成模型,其中FAM247片段作为成核元素或基础位点。来自基因组其他部分的其他序列块被添加到FAM247序列中,形成成熟基因(见图2).这些FAM247片段在基因组区域中,显示出进化保守的序列签名。FAM247序列似乎携带这些无关序列附着的信息,并且它代表了该和其他伪原的DE Novo Genesis的焦点。这些假生素显示RNA转录物表达,在各种组织中以非常宽且稳健的方式显示几种。这些基因的功能尚不清楚。然而,基因函数的测定是评估这些伪原与细胞分子过程的相关程度。

图片来源,左图:维基共享
图片来源,右图:Lefteris Papaulakis/Shutterstock.com
Phrasikleia Kore的大理石雕像(左,C.550-540 BC)和Anavysos(Kroisos)Kouros(右,C.530 BC)。从人体中的FAM247成核序列形成的长非编码RNA基因。

令人惊讶的是,两个古老的蛋白质基因,γ -谷氨酰基转移酶(GGT5)和泛素特异性肽酶18 USP18也发现了FAM247序列片段(见图1).这两种基因都可以追溯到一亿到几亿年前的进化史。因此,在脊椎动物的进化过程中,FAM247序列形成了多种基因的一部分。不同于从头形成的修饰伪基因和由基因复制形成的5个人类FAM247 lincRNA家族基因,导致脊椎动物祖先中蛋白质基因形成的机制尚不清楚。

该小型基因组DNA序列似乎携带用于附着其他基因组区段的信息,这导致新基因的形成。它还在其开放阅读框架中携带蛋白质外显子的信息。

FAM247提供的进化高度保守序列对于免疫系统的调节至关重要
这些研究的一个主要亮点是FAM247在提供USP18基因在免疫系统调节中所必需的氨基酸序列方面的重要作用。USP18是泛素特异性肽酶基因,是去泛素化蛋白酶家族的成员。许多蛋白质通过泛素的加入而被修饰。当它附着在蛋白质上时,它就像一个信号分子,控制细胞的分化,并在免疫系统的调节中发挥作用。去泛素化蛋白酶,如USP18,通过关闭泛素化后获得的信号,从蛋白质中去除泛素,调节其功能。

科学家经常调查人类和灵长类动物的遗传建筑,了解不同基因在演变中发挥的特定作用。靠近d krasaesom / shutterstock.com

FAM247核苷酸序列与USP18的人类/灵长类的羧基末端外显子核苷酸序列具有很高的同源性,大多数情况下同源性为100%。在斑马鱼中,氨基酸序列对比显示,与人类USP18末端外显子和FAM247翻译序列相比,末端外显子的少量氨基酸发生了变化,但大部分氨基酸未发生变化。首先,在斑马鱼USP18基因的末端外显子中存在大量的系统保守氨基酸位置,表明FAM247序列或其部分序列存在于斑马鱼USP18基因中。无论对蛋白质功能多么重要,最后一个外显子的大部分氨基酸序列在进化上是保守的,这可能意味着泛素特异性肽酶USP18的某些功能起源于数亿年前的脊椎动物。在一系列的论文中,加州大学圣地亚哥分校的Dong-Er Zhang博士和其他机构的同事报道了USP18蛋白羧基端功能的阐明。这些功能具有重要意义,因为它们对干扰素的调节有影响。干扰素是在应对病毒感染时释放的,并负责炎症级联反应,增强抗病毒防御。USP18是干扰素信号的负调控因子,作为一种抗炎蛋白。此外,USP18在病原控制和自身免疫性疾病的发展中具有重要作用。因此,该蛋白可以作为与炎症相关的各种疾病的重要药理学靶点。

hywards / Shutterstock.com

个人反应

你目前是在关注22号染色体的重复序列还是有其他的计划?

我目前正专注于在22号染色体上寻找可能作为原基因元件的额外重复序列

本文是在研究团队的批准下创建的。这是一个合作制作,由那些特色的支持,免费援助,全球分发。

想读更多这样的文章吗?

注册到我们的邮件列表,阅读对你最重要的话题。
报名!

留下一个回复

您的电子邮件地址不会被公开。必填字段已标记

感谢您对加入我们的邮件列表和社区的兴趣。在下面,您可以选择您希望我们如何与您互动,我们会随时了解我们的最新内容。

您可以更改您的偏好或取消订阅,请点击任何您收到的电子邮件页脚的取消订阅链接,或通过以下方式与我们联系audience@www.graceymay.com.在任何时候,如果您对我们如何处理您的数据有任何问题,请查看我们的隐私协议。

您想了解更多关于我们服务的信息吗?

我们使用MailChimp作为我们的营销自动化平台。通过点击下面提交此表格,您确认您提供的信息将被转移到MailChimp进行处理隐私政策条款。

订阅我们的免费刊物