【最新开源】美研究机构发布全球最大生物学AI模型Evo 2！阶跃星辰首次开源Step系列多模态大模型!

2月19日，美国 Arc Institute 与英伟达合作，联合斯坦福大学、加州大学伯克利分校和加州大学旧金山分校的研究人员，共同推出了——。该模型以超过 128，000 个基因组的数据为基础，训练了 9.3 万亿个核苷酸，使其规模与最强大的生成性 AI 语言模型相媲美。是一种先进的 DNA 语言模型，专注于长上下文的建模和设计。它能够在单核苷酸分辨率下对 DNA 序列进行建模，支持长达 100

快乐小码农

965人浏览 · 2025-02-25 15:48:56

快乐小码农 · 2025-02-25 15:48:56 发布

01 NVIDIA和Arc研究所联合发布全球最大生物学 AI 模型 —— Evo 2

2月19日，美国 Arc Institute 与英伟达合作，联合斯坦福大学、加州大学伯克利分校和加州大学旧金山分校的研究人员，共同推出了全球最大的生物学人工智能模型 —— Evo 2。

该模型以超过 128，000 个基因组的数据为基础，训练了 9.3 万亿个核苷酸，使其规模与最强大的生成性 AI 语言模型相媲美。

Evo 2 是一种先进的 DNA 语言模型，专注于长上下文的建模和设计。它能够在单核苷酸分辨率下对 DNA 序列进行建模，支持长达 100 万碱基对的上下文长度。

Evo 2 使用 StripedHyena 2 架构进行预训练，并在 OpenGenome2 数据集上进行自回归训练，该数据集包含来自所有生命领域的 8.8 万亿个token。

开发者表示，Evo 1 和 Evo 2 模型的开发代表了新兴的生成式生物学领域的关键时刻，因为这些模型使机器能够“用核苷酸语言来读、写和思考”。

Evo 2 具备多种功能，包括识别影响蛋白质功能和生物体适应性的基因变化。例如，在乳腺癌相关基因 BRCA1 变体的测试中，Evo 2 预测基因突变良性或致病性的准确率超过 90%，这将有助于加速新药研发，节省实验时间和成本。此外，Evo 2 还能用于设计新的生物工具和疗法。

目前，Evo 2 的开发团队已发布该模型的详细信息，并推出名为 Evo Designer 的用户友好界面。Evo 2 的代码已在 Arc 的 GitHub 上公开，并已集成至 NVIDIA 的 BioNeMo 框架，以促进科学研究的进展。

02 阶跃星辰首次宣布开源Step系列多模态大模型

2月18日，阶跃星辰和吉利汽车集团联合开源了两款阶跃 Step 系列多模态大模型—— Step-Video-T2V 视频生成模型和 Step-Audio 语音模型。

目前全球范围内参数量最大、性能最好的开源视频生成模型——阶跃 Step-Video-T2V：参数量达到300亿，可以直接生成204帧、540P分辨率的高质量视频。
行业内首款产品级开源语音交互大模型——阶跃 Step-Audio：能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达，能和用户自然地高质量对话。

从官方公布的技术报告来看，这次开源的两款模型在Benchmark中表现优秀，性能超过国内外同类开源模型。