Meta发布了最大的羊驼3人工智能模型,吹嘘语言和数学方面的进步
2025-03-14 13:56

Meta发布了最大的羊驼3人工智能模型,吹嘘语言和数学方面的进步

  

  

  纽约:周二,meta平台发布了其最大版本的免费人工智能模型Llama 3,拥有多语言技能和一般性能指标,紧随OpenAI等竞争对手的付费模型之后。Facebook母公司在宣布发布的博客文章和研究论文中说,新的美洲驼3可以用八种语言交谈,编写更高质量的计算机代码,并解决比以前版本更复杂的数学问题。

  它有4050亿个参数,或者说是算法考虑的变量来生成对用户查询的响应,使去年发布的上一个版本相形见绌,但仍然小于竞争对手提供的领先模型。

  相比之下,据报道,OpenAI的GPT-4模型有1万亿个参数,亚马逊正在准备一个有2万亿个参数的模型。

  首席执行官马克·扎克伯格(Mark Zuckerberg)通过多个渠道宣传Llama 3,他预计未来的Llama车型将在明年超过专利竞争对手。他说,由这些模型驱动的元人工智能聊天机器人有望在今年年底成为最受欢迎的人工智能助手,已经有数亿人在使用它。

  该报告发布之际,科技公司正竞相证明,它们不断增长的资源密集型大型语言模型组合,能够在高级推理等已知问题领域带来足够显著的收益,以证明它们投入的巨额资金是合理的。

  meta自己的顶级人工智能科学家表示,他认为这种模型将触及推理的极限,需要其他类型的人工智能系统才能取得突破。

  除了4050亿参数的旗舰车型外,meta还将发布其重量更轻的80亿和700亿参数的Llama 3车型的更新版本,该车型最初于今年春天推出。

  这三种新模型都是多语言的,可以通过扩展的“上下文窗口”处理更大的用户请求,meta的生成人工智能主管艾哈迈德·达勒(Ahmad Al-Dahle)表示,这将改善生成计算机代码的体验。

  “这是我们从社区得到的第一反馈,”Al-Dahle在接受路透社采访时表示,并指出更大的上下文窗口给模型提供了类似于更长的记忆,有助于处理多步骤请求。

  另外,Al-Dahle表示,他的团队已经能够通过使用人工智能生成一些训练数据来提高羊驼3模型在解决数学问题等任务上的表现。

  meta发布的Llama模型基本上是免费的,供开发者使用。扎克伯格表示,这一战略将带来创新产品的回报,减少对潜在竞争对手的依赖,提高公司核心社交网络的参与度。然而,一些投资者对所涉及的成本表示惊讶。

  如果开发商选择使用其免费模式而非付费模式,该公司也将从中受益,因为这将削弱其竞争对手的商业模式。在声明中,meta吹捧了在关键数学和知识测试中的优势,这可能会让这一前景更具吸引力。

  尽管衡量人工智能发展的进展是出了名的困难,但meta提供的测试结果似乎表明,其最大的Llama 3模型几乎可以匹配,在某些情况下甚至超过了Anthropic的Claude 3.5 Sonnet和OpenAI的gpt - 40,这两个模型被广泛认为是市场上最强大的两个前沿模型。

  例如,在数学竞赛水平的数学单词问题的数学基准上,meta的模型得分为73.8,而gpt - 40的得分为76.6,克劳德3.5的得分为71.1。

  该模型的MMLU得分为88.6,而gpt - 40得分为88.7,克劳德3.5十四行诗得分为88.3。MMLU是一项涵盖数学、科学和人文等数十门学科的基准。

  在他们的论文中,元研究人员还调侃了即将于今年晚些时候推出的“多模态”模型,该模型将在核心的Llama 3文本模型之上叠加图像、视频和语音功能。

  他们说,早期的实验表明,这些模型可以与其他多模态模型(如谷歌的Gemini 1.5和Anthropic的Claude 3.5 Sonnet)“竞争”。

本内容为作者翻译自英文材料或转自网络,不代表本站立场,未经允许不得转载
如对本稿件有异议或投诉,请联系本站
想要了解世界的人,都在 世腾网

相关推荐