首页/📰 每日速递/2026-05-05 每日速递:Anthropic与OpenAI同时杀入企业AI合资、xAI发布Grok 4.3、Sierra融资9.5亿
📰 每日速递📰 每日速递

2026-05-05 每日速递:Anthropic与OpenAI同时杀入企业AI合资、xAI发布Grok 4.3、Sierra融资9.5亿

今日 AI 圈重点:Anthropic与OpenAI同日宣布成立企业AI合资公司、xAI发布Grok 4.3模型及语音克隆功能并以超低价API竞争、Sierra融资9.5亿美元估值超150亿、Musk v Altman庭审第二周Brockman出庭、图像AI模型取代聊天模型成为App增长主引擎。

📰 每日速递 · 2026年5月5日

1️⃣ Anthropic与OpenAI同日宣布成立企业AI合资公司

AI两大实验室在周一几乎同时宣布成立企业AI服务合资公司,标志着AI商业化进入新阶段。

Anthropic的合资公司估值15亿美元,Blackstone、Hellman & Friedman和Goldman Sachs为创始合伙人,三方各出资3亿美元。Apollo、General Atlantic、GIC、红杉等参投。合资公司将采用Palantir式的"前置部署工程师"(FDE)模式,工程师直接进驻客户现场,与临床医生、IT人员一起搭建定制化AI工具。

OpenAI的合资公司规模更大——The Development Company估值100亿美元,从19位投资者筹集40亿美元,TPG、Brookfield、Advent、Bain Capital等参投。与Anthropic的投资者阵容几乎零重叠。

两家合资公司的商业逻辑一致:从资产管理公司募资→获得投资方旗下企业客户的优先销售权→投资方从AI合同中捕获更多价值。

背景:OpenAI刚在3月底完成1220亿美元融资(估值8520亿),Anthropic也在进行500亿美元融资(估值9000亿),两家都在为IPO铺路。

意义:AI实验室不再只卖API,而是组建"AI咨询+部署"军团。这是从"卖铲子"到"帮你挖金矿"的商业模式转变——且两个最大竞争对手在同一周选择了完全相同的路径。

2️⃣ xAI发布Grok 4.3:推理常驻+百万Token上下文+超低价API+语音克隆

在Musk忙着出庭的同时,xAI发布了Grok 4.3,带来几项重要变化:

模型本身:推理(reasoning)成为Grok的永久状态——每个查询都会先"思考"再回答,而非可选配置。上下文窗口扩展到100万Token,支持文本和图像输入。

定价极低:API价格$1.25/M输入Token、$2.50/M输出Token,比前代Grok 4.2分别降低40%和60%。在主流模型中,价格仅高于中国开源模型(小米MiMo、MiniMax等),远低于GPT-5.5($5/$30)和Claude Opus 4.7($5/$25)。Abacus AI CEO评价:"和Sonnet 4.6一样聪明,但便宜5倍、快5倍。"

语音克隆:xAI推出Custom Voices,120秒音频即可克隆声音,支持风格迁移(如客服语气)。仅限美国使用(伊利诺伊州除外),Voice Agent API定价$3/小时。

性能评价两极化:在法律推理(CaseLaw v2 #1)和金融分析上大幅领先,但在通用编码和数学上表现不佳——ProofBench仅11%,有用户报告其在自动化任务中存在"嗜睡"问题(多天不采取行动)。

意义:xAI的定价策略明显是在走"薄利多销"路线——模型性能不及GPT-5.5和Opus 4.7,但用价格碾压。语音克隆功能的推出则让xAI在语音AI赛道直接与ElevenLabs竞争。

3️⃣ Sierra融资9.5亿美元,估值超150亿

Bret Taylor的AI初创公司Sierra完成9.5亿美元融资,由Tiger Global和GV领投,投后估值超150亿美元。公司总资金突破10亿。

关键数据:

  • 两年内从4个设计伙伴增长到**Fortune 50的40%+**为客户
  • ARR从2025年11月的1亿美元增长到2026年2月的1.5亿美元
  • 平台上的AI智能体每月处理数十亿次交互——从房贷再融资到保险理赔到退货管理
  • 4月推出Ghostwriter——"智能体即服务"工具,用自然语言描述需求即可自动生成和部署专用智能体

Uber CTO在StrictlyVC活动上分享了实际落地数据:开放AI智能体工具后很快"花光了预算",但8000名工程师和技术人员中,10%的代码已由AI自主生成。一个使用纯智能体工作流的酒店预订集成项目,原本需要1年的工作在6个月内完成。

意义:企业AI不只是聊天——Sierra在证明AI智能体可以端到端处理真实业务流程。而Bret Taylor"按钮点击时代结束"的论断正在被真金白银的营收验证。

4️⃣ Musk v Altman庭审第二周:Brockman出庭,日记让他陷入困境

庭审进入第二周,焦点从Musk转向OpenAI联合创始人Greg Brockman。

关键披露

  • Brockman的日记让他看起来极不可靠:在告诉Musk"我们更想在非营利方向筹款"仅6天后,他写道"也许我们应该转为营利。赚钱对我们来说也不错"——被Musk律师称为"不诚实"
  • 另一条日记:"不告诉他就把非营利转走,那太缺德了"——这可能是Musk团队目前最有力的一击
  • Brockman的Cerebras股权与OpenAI的100亿美元芯片交易存在利益冲突——交易使Cerebras估值升至230亿
  • Altman通过家族办公室向Brockman提供补偿,Musk顾问Birchall写道:"Greg因此会对Sam有更大的忠诚"
  • Musk曾在被拒后威胁Brockman要在Tesla内部秘密创建AGI竞争对手

AI安全专家Stuart Russell出庭作证:认为需要政府限制前沿AI实验室,但证词对Musk的具体案件帮助有限。Russell关于开源AI风险的证词("开源可能让安全护栏更容易被移除")与Musk"OpenAI应该开源"的主张相矛盾。

意义:庭审正在暴露OpenAI早期治理的混乱——财务利益冲突、内部通信矛盾、从非营利到营利的模糊转型。但Musk团队也难以证明这构成了法律意义上的欺诈。

5️⃣ 图像AI模型取代聊天模型成为App增长主引擎

Appfigures最新报告揭示了一个趋势转变:图像模型发布带来的下载量是文本模型更新的6.5倍

关键数据:

  • Gemini:图像模型Nano Banana发布后28天内新增2200万+下载,下载量增长4倍以上——但同期仅带来18.1万美元消费
  • ChatGPT:GPT-4o图像模型发布后28天新增1200万下载,比GPT-4o/GPT-4.5/GPT-5的文本模型发布多4.5倍——并带来7000万美元消费
  • Meta AI:Vibes视频功能带来260万增量下载,但没有产生有意义的收入

结论:图像模型能带来大量下载,但只有ChatGPT成功把流量转化为收入。Gemini和Meta AI都面临着"有人气没收入"的困境。

DeepSeek R1是个特例——2800万下载来自"一夜爆红"效应,与图像模型无关。

意义:AI应用的增长逻辑正在从"更聪明的对话"转向"更酷的视觉内容"。但下载≠收入,AI应用的变现难题依然存在。

6️⃣ Roomba之父推出陪伴机器人"Familiar"

iRobot创始人Colin Angle发布新公司Familiar Machines & Magic的首款产品——一款狗大小的机器人宠物"Familiar"。

设计理念:不是做家务的机器人,而是家庭陪伴。外观像熊、猫头鹰和金毛寻回犬的混合体,拥有可动的眉毛、耳朵和眼睛,面部表情丰富。Angle此前帮助5000万台Roomba进入家庭,这次他想让机器人从"工具"变为"伙伴"。

产品在WSJ Future of Everything大会上亮相。

意义:消费级机器人正从"功能型"(扫地、割草)向"情感型"转变。当AI赋予了机器人理解人类情绪的能力,"陪伴"可能比"干活"更有市场。

7️⃣ 阿里巴巴HDPO框架:AI智能体工具滥用从98%降至2%

阿里巴巴研究团队发布HDPO(分层解耦策略优化)框架,解决AI智能体的"元认知缺陷"——模型不知道什么时候该用工具、什么时候该用自己的知识。

核心问题:当前智能体模型盲目调用工具(搜索、代码执行等),即使问题本身已经包含所有必要信息。98%的工具调用是冗余的,不仅浪费钱和时间,还引入噪音干扰推理。

HDPO的解决方案:将准确性效率分为两个独立优化通道——准确性通道专注任务正确性,效率通道优化执行经济性。效率信号以准确性为前提,错误答案永远不会因为"快"而获得奖励。这创造了一个隐含的认知课程:模型先学会正确,然后才学会高效。

基于Qwen3-VL-8B训练的Metis智能体在视觉感知和推理任务上达到SOTA,超越了300亿参数的Skywork-R1V4,同时将冗余工具调用从98%降至2%。代码和模型已Apache 2.0开源。

意义:"教模型什么时候不用工具"比"教模型怎么用工具"更重要。这可能是智能体AI从"暴力调用"走向"理性决策"的关键突破。

8️⃣ Google Gemini iOS版界面大改版

Google Gemini iOS应用开始推送新版界面,与已上线的macOS版保持一致。新设计采用渐变色背景、药丸形输入框,所有额外选项(添加图片、切换Canvas等)收纳到单个"+"按钮下,整体UI更加简洁。

意义:Google在统一Gemini跨平台体验,简化界面降低使用门槛。在图像模型驱动增长的背景下,更简洁的入口可能有助于转化新用户。


以上为今日 AI 圈最重要的八件事,点击各条标题可查看详情。