Ai2发布开源大模型Olmo 3，性能直追Meta与DeepSeek-美西在线

首页>西雅图

Ai2发布开源大模型Olmo 3，性能直追Meta与DeepSeek

时间: 1763679679642

【侨报讯】艾伦人工智能研究所（Allen Institute for AI，简称Ai2）11月20日正式推出其新一代旗舰大型语言模型Olmo 3，宣称在性能与效率方面全面对标Meta、DeepSeek等领先的最新产品，在开放模型领域树立新的竞争标杆。

作为非营利研究机构，Ai2一直致力于推动人工智能领域的开放科研和透明实践。此次发布的Olmo 3不仅延续了这一传统，更明确瞄准商业级应用场景，试图以开源模式撼动由大型科技公司主导的高端模型市场。

Ai2首席执行官阿里·法哈迪（Ali Farhadi）在新闻稿中表示：“Olmo 3证明了开放性和性能可以齐头并进。”

Ai2发布的研究数据显示，Olmo 3的性能已超越多个主流开源大模型。（图片来源：Ai2）

Ai2表示，Olmo 3的整体性能已超越斯坦福大学的Marin等全开源模型，同时能与Meta最新的Llama 3.1等“商业开放权重”模型相媲美。本次发布的系列模型包括：

Olmo 3 Base：核心基础模型

Olmo 3 Instruct：优化后的指令遵循模型

Olmo 3 Think：强调推理链条展示的“思考模型”

Olmo 3 RL Zero：基于强化学习训练的实验模型

目前，“思考模型”已成为人工智能领域的重要趋势，越来越多的开放模型加入推理可解释性功能。Olmo 3的设计也顺应了这一发展方向。而在能源与成本效率方面，Ai2宣称Olmo 3的训练效率比Meta的Llama 3.1高2.5倍。这一效率优势主要来自更精简的训练数据规模——在某些情况下，Olmo 3所需的训练令牌甚至比同类竞争模型少六倍。

与此同时，Olmo 3能够一次处理最长达65,000个标记的输入文本，相当于阅读一个短篇书籍章节，为长文档分析类任务提供了更强能力。

据GeekWire报道，比性能更能体现Ai2理念的是透明度。Ai2此次破天荒发布了Olmo 3的完整“模型流程”（model flow）——即展示模型在各个训练阶段的快照，帮助研究人员理解模型的形成过程。此外，Ai2还更新了OlmoTrace工具，使学者能够进一步追踪模型推理过程中与特定训练数据的关联，这在当前对AI可信度和可解释性需求急剧上升的背景下格外重要。

由微软联合创始人保罗·艾伦于2014年创立的Ai2，一直在开源与研究领域扮演重要角色。今年以来，Ai2在美国科研体系中地位明显提升：8月，Ai2被美国国家科学基金会（NSF）和英伟达共同选中，参与1.52亿美元国家级开放多模态模型计划，成为AI国家骨干网的重要贡献者。Ai2还加入“癌症人工智能联盟”，与弗雷德·哈钦森癌症研究中心等顶级机构合作，在不泄露病患隐私的前提下利用临床数据训练医学AI。

随着Olmo 3的发布，Ai2表示希望进一步推动真正可验证、可解释、可复现的人工智能发展路线。

目前，Olmo 3已在Hugging Face与Ai2 Model Playground全面开放下载与试用。

网友评论

10 条评论

所有评论

显示更多评论