新语言模型学会读取“另类文本”
最新发表在《自然·机器智能》上的一篇论文中,美国普林斯顿大学研究人员详细介绍了一种语言模型,该模型可追踪部分基因组序列并优化这些序列,利用其语义表示能力来设计更有效的信使RNA(mRNA)疫苗。
新模型的代码包含所有生命功能的指令。基因组中每个序列都遵循复杂的语法和句法,这些结构产生了意义。正如改变几个单词可从根本上改变句子含义,生物序列的微小变化也可使序列编码产生巨大差异。
科学家将遗传信息的流动总结为“生物学中心法则”:信息从DNA转移到RNA再到蛋白质,蛋白质创造活细胞的结构和功能。mRNA在最后一步将信息转化为蛋白质。mRNA只有一部分包含蛋白质代码,其余部分不进行翻译,但控制翻译过程的重要方面。
控制蛋白质生产效率是mRNA疫苗发挥作用的关键机制。在对少数物种进行模型训练后,研究人员生成了数百个新的优化序列,并通过实验验证了这些结果。最佳序列的性能优于疫苗开发的多个领先基准,其中蛋白质生产的整体效率提高了33%。
研究团队使用经过训练的模型创建了包含211个新序列的库,每个都针对所需功能进行了优化,提高了翻译效率。这些蛋白质,如新冠疫苗靶向的刺突蛋白,可驱动针对传染病的免疫反应。
新模型是第一个专注于mRNA非翻译区域的语言模型。研究人员表示,即使是少量提高蛋白质生产效率,也会对新兴疗法产生重大推动作用。经过对来自少数物种的mRNA的训练,它能解码核苷酸序列并揭示有关基因调控的新知识。而基因调控是生命最基本的功能之一,是找到疾病和紊乱根源的关键。
我们喜欢问语言模型一大堆奇奇怪怪问题,把它当成生活和工作的助手。然而,语言模型还能在制造疫苗中大显身手。因为,在生物世界,同样有信息流动,同样有语言和语法。mRNA被称为信使RNA,指导蛋白质合成。不过,它只有一部分包含蛋白质代码,还有一部分则不翻译。语言模型就瞄准了这些未翻译的部分,经过训练,提高了蛋白质生产的效率,有助于研发更好的mRNA疫苗。机器智能与生物智能结合,创造出了更有意思的产品。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
为您推荐
上市实际募资32亿元,萤石网络缩减募投项目金额
上市实际募资32亿元,萤石网络缩减募投项目金额
客厅25平米空调买挂机还是柜机
慕斯绒四件套有味正常吗
慕斯绒和牛奶绒哪个好
今日要闻
- 比亚迪推出纯电轿车海豚荣耀版,起售价9.98万元
- 沃尔沃2月销量“大跳水”,巨大优惠面前消费者更理性了?
- 商用车市场谷底回弹:多家上市车企2023年营利双增
- ID.7进行436项电池试验,提高电池安全性
- 卷疯了!零跑C10售价公布:不到13万元的中型SUV!
- 零跑C10上市,LEAP3.0架构打造,售12.88万起
- 国泰集团603977.SH:将持续关注长赣高铁项目建设进展情况,积极与有
- 比亚迪海鸥也出荣耀版了!售6.98万-8.58万
- 上汽通用五菱天舆架构将于4月12日正式发布
- 家国永念|只要我们铭记,他们就不曾离开
- 打开混动皮卡新领域,长安猎手正式上市售13.99万元起
- 特斯拉降价!
- 大湾区早报|日均超10万人次!港珠澳大桥“人车两旺”;超4000款应用加
- 安全不是偶然,领克09EM-P用事实说话
- 五菱缤果PLUS上市售价8.98万元起