首个基因挖掘大模型问世 为mRNA疫苗规模化生产提供关键酶资源库
【瞧!我们的前沿科技】
光明日报北京4月12日电(记者晋浩天)近日,北京大学定量生物学中心钱珑团队研发、构建了全球首个针对功能基因挖掘任务的大语言模型SYMPLEX。该模型能够自动高效地从海量生物文献中发现具有目标功能的关键基因,并进行精准筛选和功能验证,为后续的蛋白质功能设计、生物制剂开发以及生物制造的应用提供科学依据。团队与中科院深圳先进技术研究院娄春波研究员合作,将SYMPLEX应用于mRNA加帽酶基因的挖掘,获得的新加帽酶活性显著优于mRNA疫苗生产中采用的商业化酶,展示了大语言模型赋能生物制造的巨大潜力。相关研究成果日前发表于国际学术期刊《科学·进展》。
“自然界生物体内蕴含着数量庞大的有用基因,这些基因经过亿万年自然选择,形成了丰富多样的序列组成和基因组合,演化出各种精妙的功能,帮助生物在各种不同环境中更好地生存繁衍。随着测序获得的生物序列累计达数十亿量级,这些天然基因也为生物制造与合成生物技术提供了基因元件的‘宝库’。”钱珑告诉记者,尽管天然基因具备极为丰富的功能和潜力,但目前只有一小部分热门基因被高质量注释并构建了序列或结构模型。“原因在于,基于序列、结构或深度学习的基因挖掘与蛋白质设计方法由于技术瓶颈无法拓展至复杂基因,进而制约了对高价值基因元件的挖掘与开发利用。”
针对上述问题,团队创造性地将大型语言模型与结构化生物知识库深度融合,开发出SYMPLEX智能基因挖掘平台。这一平台是强大的功能基因搜索引擎,可通过自动化阅读与理解千万级体量的生物学文献,在基因、功能和知识水平上对文献内容进行提取分析,并与专家数据库进行概念对齐、交互和统计模式生成,从而产生高质量候选基因集合。对比结果表明,SYMPLEX大模型相比传统方法具有显著优势。
研究团队还通过大模型挖掘了mRNA加帽酶,并进行了实验验证。“以前,mRNA疫苗背后的一项关键工艺——mRNA 5’端加帽,一直是效率较低、成本高昂的‘卡脖子’环节。SYMPLEX发现了近2万个新型加帽酶,并对其中十余个序列进行了验证。我们从中找到了新酶,其活性超过当前mRNA疫苗制备使用的加帽酶的2倍。SYMPLEX挖掘的加帽酶数据库,有望为mRNA疫苗和基于mRNA的基因疗法研究提供关键技术。”钱珑介绍。
“本项研究开创了功能基因挖掘的新范式,为mRNA疫苗规模化生产提供了关键酶资源库。”钱珑表示,研究团队正在利用这一大模型进行更多可用于合成生物学的关键酶元件挖掘,并将该平台拓展至合成通路设计等领域,有望推动生物制造进入“人工智能驱动的科学研究”的新阶段。
《光明日报》(2025年04月13日 04版)
来源: 光明网-《光明日报》
相关内容:
-
第三届链博会观察丨健康生活链上的河北守护
链接健康生活,让生命更加精彩健康生活链上的河北守护7月18日,在第三届中国国际供应链促进博览会健康生活链展区,石家庄以岭药业股份有限公司工作人员(右)向外国客商介绍产品。河北日报记者米彦泽摄以医用纱布为原料的婴童衣物、将人工智能运用于骨科手术中、具有抗氧化等功效的保健食品……作为第三届中国国际供应链
2025-07-22 00:08:00 -
蚂蚁健康管家AQ登顶苹果App Store医疗榜
中国财富网讯(壹川 实习生赵欣)7月21日,蚂蚁集团近日推出的旗下AI健康应用AQ iOS版上线不到24小时,已火速攀升至苹果应用商店医疗榜榜首,超越小荷AI医生、京东健康等应用。AQ是蚂蚁在医疗健康领域的战略级应用,通过自研医疗大模型能力,向用户提供寻医、问诊、读报告、测健康等上百项AI服务,同时
2025-07-21 12:05:00 -
康方生物午前上涨10%,依沃西疗法一线治疗结直肠癌III期临床首例患者入组
康方生物(09926)午前股价上涨10%,现报138.60港元,成交额15.30亿港元。7月16日,据康方生物官微消息,康方生物自主研发的全球首创PD-1/VEGF双特异性抗体新药依达方®(通用名:依沃西单抗注射液)用于一线治疗晚期转移性结直肠癌(pMMR/MSS型 mCRC)的注册性III期临床研
2025-07-17 12:08:00 -
别跟LLM太交心,斯坦福新研究:AI不能完全取代人类心理治疗师
小心!AI的“贴心回应”可能致命。最新研究表明包括ChatGPT和Llama在内的流行AI模型在处理抑郁、妄想等复杂心理问题时,竟然频频输出危险建议。这项研究涉及来自斯坦福大学、卡内基梅隆大学、明尼苏达大学和德克萨斯大学奥斯汀分校的研究人员。当研究人员向ChatGPT提出这样一个问题:一位用户在失业
2025-07-14 12:05:00 -
四环医药执着分拆轩竹生物上市
早在2022年,四环医药(00460.HK)就开始筹划分拆轩竹生物科技股份有限公司(以下简称“轩竹生物”)独立上市。四环医药最初为轩竹生物选择的板块为科创板,轩竹生物科创板上市折戟后,四环医药并未就此死心,而是启动了“H拆H”的计划。目前,轩竹生物已二度递表港交所。与科创板IPO时有所不同的是,此次
2025-07-11 00:29:00 -
国网山西省电力公司全力打造全链条智能应用体系
数字化需求查重为数字化项目前期论证关键环节,日前,国网山西省电力公司基于光明电力大模型,结合提示词工程、RAG等技术构建了需求查重智能体,实现了一键式查重、可视化标注重复文本内容等功能,高效支撑数字化项目前期论证工作。 光明电力大模型是国家电网公司打造的国内首个千亿级多模态电力行业大模型,具备
2025-07-10 06:44:00