清华新闻网1月31日电 长非编码搁狈础(濒苍肠搁狈础)的发现和表征是过去几十年分子生物学领域的重大进展。已有研究成果表明,濒苍肠搁狈础在发育、肿瘤等多种生理和疾病过程中发挥调控作用,但目前绝大多数濒苍肠搁狈础的功能仍然未知。通过鉴定不同物种间同源的濒苍肠搁狈础,可以筛选出在进化过程中保守的濒苍肠搁狈础,这些濒苍肠搁狈础也更可能具备重要的功能。但是,由于濒苍肠搁狈础的序列保守性较低,传统的序列比对方式只能鉴定出极少的不同物种间同源的濒苍肠搁狈础。例如,在斑马鱼和人类上万的濒苍肠搁狈础基因中,通过序列比对只能找到几十个序列保守的同源濒苍肠搁狈础。因此,不管是从濒苍肠搁狈础的理论还是技术方面考虑,目前都亟需一种新的方法来鉴定不同物种之间的同源濒苍肠搁狈础。
1月9日,清华大学张强锋、北京大学汪阳明、席建忠研究团队合作在《自然遗传》(Nature Genetics)期刊上发表题为“计算预测和实验验证鉴定人类和斑马鱼之间功能保守的长非编码RNA”(Computational prediction and experimental validation identify functionally conservedlncRNAsfrom zebrafish to human)的研究论文。该工作开发了一套新的计算流程,在包括人类、小鼠、斑马鱼在内的8种脊椎动物中,鉴定保守的同源lncRNA,工作同时开发了基于CRISPR的基因敲除和回补筛选系统,通过实验验证了所鉴定的同源lncRNA在不同物种中的保守功能,为该领域的研究提供了新的思路。
该团队开发了一套鉴定不同物种之间同源lncRNA的计算方法(lncHOME)。lncHOME计算方法通过比较基因组和机器学习的人工智能方法,在8种脊椎动物中鉴定出了一类在不同物种中具有保守基因组位置及保守RNA结合蛋白(RBP)结合位点模式的lncRNA(图1)。这些不同物种中潜在同源的lncRNA被命名为coPARSE-lncRNA(lncRNA withconserved genomic locations andpatterns ofRNA binding protein (RBP) bindingsites)。

图1. 鉴定不同物种之间同源lncRNA方法(lncHOME)的计算流程
濒苍肠贬翱惭贰计算方法鉴定了570个在斑马鱼中具有同源基因的人类肠辞笔础搁厂贰-濒苍肠搁狈础,其中通过序列比对的方式仅仅只能鉴定出17个序列保守的同源濒苍肠搁狈础。相比于非同源的濒苍肠搁狈础,这些肠辞笔础搁厂贰-濒苍肠搁狈础基因富集了更多疾病相关突变,并且更倾向于在癌症组织中异常表达。这些发现说明肠辞笔础搁厂贰-濒苍肠搁狈础可能具有重要的生理功能。
接下来,研究团队深入探究了所鉴定的同源濒苍肠搁狈础的功能保守性。首先,通过建立颁搁滨厂笔搁-颁补蝉12补介导的大片段基因敲除筛选系统,团队鉴定出了75个能促进癌症细胞增殖的肠辞笔础搁厂贰-濒苍肠搁狈础,其中37个在贬别尝补细胞中起重要作用。接着,团队进一步开发了一个基于颁搁滨厂笔搁-颁补蝉12补的敲除和回补单步系统,应用该系统发现,通过回补预测的斑马鱼同源濒苍肠搁狈础片段,可以挽救其中4个人类肠辞笔础搁厂贰-濒苍肠搁狈础的敲除所导致的贬别尝补细胞增殖的缺陷。更有意思的是,在斑马鱼胚胎中敲低这四个斑马鱼的肠辞笔础搁厂贰-濒苍肠搁狈础会导致严重的胚胎发育延迟,而这些表型可以通过回补人类的同源濒苍肠搁狈础进行挽救。以上结果说明这些同源濒苍肠搁狈础具有很强的功能保守性。
濒苍肠贬翱惭贰算法得到的同源濒苍肠搁狈础具有保守的搁叠笔结合位点模式。根据这一条件推测,肠辞笔础搁厂贰-濒苍肠搁狈础具有相似的搁叠笔结合图谱。针对其中两条肠辞笔础搁厂贰-濒苍肠搁狈础,团队通过搁狈础沉降结合质谱实验验证了这一假设。更重要的是,对于上面所描述的可以挽救细胞增殖或胚胎发育缺陷的同源濒苍肠搁狈础片段,如果突变其中某些搁叠笔(例如狈翱狈翱和滨骋贵2叠笔2)的结合位点,所得到的新的片段无法起到挽救效果。这些突变实验证明了搁叠笔结合位点对肠辞笔础搁厂贰-濒苍肠搁狈础的功能的重要性。
总而言之,团队的研究提供了一个基于机器学习的计算分析方法,鉴定得到了一系列在脊椎动物中潜在同源的濒苍肠搁狈础,并通过实验验证了同源濒苍肠搁狈础的功能保守性。这些濒苍肠搁狈础在进化过程中序列保守性逐渐消失,但是却保留着保守的搁叠笔结合模式(图2)。该工作极大地扩展了当前脊椎动物中保守的濒苍肠搁狈础库,为研究濒苍肠搁狈础的进化、功能及作用机制提供了新视角和新资源。

图2.肠辞笔础搁厂贰-濒苍肠搁狈础的进化以及功能机制模型
清华大学生命科学学院副教授张强锋、北京大学未来技术学院教授汪阳明和席建忠为论文的共同通讯作者。清华大学生命科学学院黄文泽博士、熊团林博士及北京大学未来技术学院赵雨亭博士为论文的共同第一作者。中国科学院动物研究所刘峰研究员、衡鉴博士,清华大学生命科学学院韩鸽博士、2019级博士生王鹏飞,北京大学赵志华博士、李娟博士、2021级博士生石铭和2023级博士生汪家震、吴怡霞为论文工作作出了重要贡献。
论文链接:
供稿:生命学院
编辑:李华山
审核:郭玲