【侨报讯】艾伦人工智能研究所(Allen Institute for AI,简称Ai2)11月20日正式推出其新一代旗舰大型语言模型Olmo 3,宣称在性能与效率方面全面对标Meta、DeepSeek等领先的最新产品,在开放模型领域树立新的竞争标杆。
作为非营利研究机构,Ai2一直致力于推动人工智能领域的开放科研和透明实践。此次发布的Olmo 3不仅延续了这一传统,更明确瞄准商业级应用场景,试图以开源模式撼动由大型科技公司主导的高端模型市场。
Ai2首席执行官阿里·法哈迪(Ali Farhadi)在新闻稿中表示:“Olmo 3证明了开放性和性能可以齐头并进。”
Ai2表示,Olmo 3的整体性能已超越斯坦福大学的Marin等全开源模型,同时能与Meta最新的Llama 3.1等“商业开放权重”模型相媲美。本次发布的系列模型包括:
Olmo 3 Base:核心基础模型
Olmo 3 Instruct:优化后的指令遵循模型
Olmo 3 Think:强调推理链条展示的“思考模型”
Olmo 3 RL Zero:基于强化学习训练的实验模型
目前,“思考模型”已成为人工智能领域的重要趋势,越来越多的开放模型加入推理可解释性功能。Olmo 3的设计也顺应了这一发展方向。而在能源与成本效率方面,Ai2宣称Olmo 3的训练效率比Meta的Llama 3.1高2.5倍。这一效率优势主要来自更精简的训练数据规模——在某些情况下,Olmo 3所需的训练令牌甚至比同类竞争模型少六倍。
与此同时,Olmo 3能够一次处理最长达65,000个标记的输入文本,相当于阅读一个短篇书籍章节,为长文档分析类任务提供了更强能力。
据GeekWire报道,比性能更能体现Ai2理念的是透明度。Ai2此次破天荒发布了Olmo 3的完整“模型流程”(model flow)——即展示模型在各个训练阶段的快照,帮助研究人员理解模型的形成过程。此外,Ai2还更新了OlmoTrace工具,使学者能够进一步追踪模型推理过程中与特定训练数据的关联,这在当前对AI可信度和可解释性需求急剧上升的背景下格外重要。
由微软联合创始人保罗·艾伦于2014年创立的Ai2,一直在开源与研究领域扮演重要角色。今年以来,Ai2在美国科研体系中地位明显提升:8月,Ai2被美国国家科学基金会(NSF)和英伟达共同选中,参与1.52亿美元国家级开放多模态模型计划,成为AI国家骨干网的重要贡献者。Ai2还加入“癌症人工智能联盟”,与弗雷德·哈钦森癌症研究中心等顶级机构合作,在不泄露病患隐私的前提下利用临床数据训练医学AI。
随着Olmo 3的发布,Ai2表示希望进一步推动真正可验证、可解释、可复现的人工智能发展路线。
目前,Olmo 3已在Hugging Face与Ai2 Model Playground全面开放下载与试用。