生物医学研究迎来通用AI智能体:斯坦福发布Biomni系统
2025年6月2日,斯坦福大学黄柯鑫、Serena Zhang、王瀚宸、屈元昊、陆荧洲等研究人员领衔的团队,联合Genentech, Arc Institute, 加州大学旧金山分校, 普林斯顿等多个顶尖研究机构,发表了突破性研究论文“Biomni: A General-Purpose Biomedical AI Agent”,不同于以往局限于单一任务的专用工具,Biomni实现了跨遗传学、微生物
2025年6月2日,斯坦福大学黄柯鑫、Serena Zhang、王瀚宸、屈元昊、陆荧洲等研究人员领衔的团队,联合Genentech, Arc Institute, 加州大学旧金山分校, 普林斯顿等多个顶尖研究机构,发表了突破性研究论文“Biomni: A General-Purpose Biomedical AI Agent”,首次报道了通用生物医学AI智能体Biomni, 并在http://biomni.stanford.edu 开放免费注册和使用(信息来源动脉网)。
不同于以往局限于单一任务的专用工具,Biomni实现了跨遗传学、微生物学、药理学及临床医学等多领域的自主研究能力,为生物医学研究提供了一种全新的工作范式。
技术架构:双核驱动与专业集成
Biomni由两个关键组件构成:
Biomni-E1:整合了150个专业生物医学工具、105个软件包及59个数据库(如PDB、OpenTarget),构建统一的数据与工具环境。
Biomni-A1:采用三大创新机制——基于LLM的动态工具选择、代码化行动接口支持复杂逻辑(循环/并行),以及自适应规划策略,实现从目标到执行的全流程自主化。
这一架构解决了传统AI工具在生物医学领域泛化能力不足的痛点,尤其是将高度专业化的工具操作与高级推理能力有效结合。
性能表现:全面超越现有基准
在权威测试中,Biomni展现出显著优势:
人类最后考试(HLE):在14个生物医学子领域的52个问题上取得17.3%准确率,显著高于基础LLM模型(6.0%)和文献智能体(12.2%)。
LAB-Bench数据库问答(DbQA):74.4%准确率,与人类专家(74.7%)基本持平。
真实研究任务测试:相较基础LLM模型性能提升402.3%,较编码智能体提升43.0%。
实际应用:从数据分析到实验设计
Biomni已在多个场景验证其价值:
可穿戴数据分析:自主解析458份连续葡萄糖监测数据,识别出餐后平均体温升高2.19°C的群体规律及个体代谢差异。
骨骼发育研究:分析33万个单核RNA测序和ATAC测序数据点,重现RUNX2等已知转录因子调控关系,并发现AUTS2、PBX1等新因子。
Biomni的诞生,标志着生物医学研究从碎片化工具迈向通用智能体的关键转折。通过无缝融合专业工具与自主决策能力,该系统让研究人员得以摆脱重复性操作,专注于科学发现的创造性环节。随着药物重定位、罕见病诊断等场景的深入应用,AI与人类专家协作的科研新范式正加速形成——不是替代科学家,而是赋予他们探索未知的新坐标。
更多推荐
所有评论(0)