Meta将推迟发布旗舰AI模型Behemoth,股价盘中跌超3%
周四,据媒体报道,扎克伯格旗下 Meta Platforms 推迟发布旗舰 AI 模型 Behemoth。Meta 的工程师们在显著提升其大型语言模型 Behemoth 的能力方面遇到困难,员工们质疑其相较前代模型的进步是否足以支撑公开发布。
在还处于早期开发时,Meta 内部计划于 4 月发布 Behemoth,以配合 Meta 首次为开发者举办的 AI 大会。Meta 在该活动前发布了 Llama AI 模型系列中的两个小型模型,但更大的 Behemoth 版本发布被推迟至 6 月。现在,该模型发布时间又被推迟到秋季甚至更晚。
需要注意的是,扎克伯格及其他 Meta 高管并未公开承诺 Behemoth 的发布时间。公司最终可能决定提前发布 Behemoth,包括推出一个功能受限的版本。但 Meta 的工程师和研究人员担心其表现不符合此前对外宣称的能力。
Meta 曾公开 " 吹捧 "Behemoth 的能力,声称其在某些测试中已经超过 OpenAI、Google 和 Anthropic 的同类技术。但内部人士表示,该模型的性能受制于训练过程中的困难。
Meta 发言人拒绝对此置评。
Meta 将推迟发布旗舰 AI 模型 Behemoth,引发了内部对于其数十亿美元 AI 投资方向的担忧。Meta 计划今年资本支出最高可达 720 亿美元,其中大部分将用于实现 CEO 扎克伯格在 AI 方面的宏伟目标。
周四的消息出炉后,Meta 股价盘中跌超 3%,英伟达盘中也出现明显回落。
Meta 不满 AI 产品组表现
Meta 的第一代 Llama 模型由其基础 AI 研究团队开发,该团队主要由博士研究人员组成,并于 2023 年初对外发布模型及研究论文。然而此后,参与该论文的 14 名研究者中已有 11 人离开 Meta 公司。后续 Llama 模型则由另一团队开发。媒体报道称,Meta 近期的一些 Llama 模型也存在问题。
4 月发布的两个 Llama 模型起初在一个受欢迎的 AI 聊天机器人排行榜上表现良好,但后来被发现,提交至排行榜的并非公开发布的同一模型。
排行榜的代表称,Meta 应更明确地说明他们提交的是一个针对测试进行过优化的定制模型。扎克伯格承认,Meta 提交给排行榜的 AI 模型是专门优化过以便在第三方测试中取得好成绩的版本。
据知情人士称,Meta 公司高层对开发 Llama 4 模型的团队表现感到失望,并将 Behemoth 进展缓慢归咎于该团队。因此,Meta 正在考虑对其 AI 产品组进行重大管理调整。
未来 AI 模型的进步可能会比以往慢得多
Meta 此前因快速追赶全球 AI 竞赛对手而受到赞誉,并在此过程中投入巨资,开发在 WhatsApp、Instagram 和 Facebook 上的聊天机器人技术。
Meta 当前的困境也反映出其他顶尖公司在发布下一代 AI 先进模型过程中遇到的挫折或延误。一些研究人员认为,这种趋势表明未来 AI 模型的进步可能会比以往慢得多,且成本极高。" 目前来看,各个实验室、各种模型的进展都非常小。"
OpenAI 的下一代重磅模型 GPT-5 原本预计在 2024 年中期发布。去年 12 月,报道称该模型的开发进度落后于计划。今年 2 月,OpenAI 首席执行官 Sam Altman 表示,将发布的是 GPT-4.5,而 GPT-5 这一寄望于实现更大技术突破的模型还需数月时间。ChatGPT 目前运行的是 GPT-4o 版本。OpenAI 拒绝就 GPT-5 的发布时间发表评论。
Anthropic 去年宣布正在研发名为 Claude 3.5 Opus 的新模型,是其去年发布并持续更新的 AI 模型的更大型版本。该模型仍未发布,一位发言人表示 " 即将推出 "。