首页/📰 每日速递/2026-05-13 每日速递:Altman出庭作证被连环质问诚信、OpenAI安全委员会证实两次延迟模型发布、B2B Signals揭示前沿企业AI使用强度3.5倍、Anthropic Institute发布四大研究议程、Claude法律行业20+MCP连接器上线、ChatGPT推Trusted Contact安全功能、Parameter Golf竞赛2000+提交AI Agent改变竞赛
📰 每日速递📰 每日速递

2026-05-13 每日速递:Altman出庭作证被连环质问诚信、OpenAI安全委员会证实两次延迟模型发布、B2B Signals揭示前沿企业AI使用强度3.5倍、Anthropic Institute发布四大研究议程、Claude法律行业20+MCP连接器上线、ChatGPT推Trusted Contact安全功能、Parameter Golf竞赛2000+提交AI Agent改变竞赛

今日AI圈重点:Musk诉Altman庭审Altman出庭被连环质问诚信问题、OpenAI安全委员会主席Kolter证实已两次正式延迟模型发布约200人从事安全工作、OpenAI发布B2B Signals报告前沿企业AI使用强度达普通企业3.5倍、Anthropic Institute发布四大研究议程探索AI社会影响、Claude法律行业工具包上线20+MCP连接器+12插件、ChatGPT推出Trusted Contact自伤害安全联系人功能、OpenAI回顾Parameter Golf竞赛AI编码Agent深刻改变竞赛形态。

📰 每日速递 · 2026年5月13日

1️⃣ Musk诉Altman庭审:Altman出庭作证,被连环质问诚信

Musk诉Altman案庭审继续,Sam Altman本人出庭作证。先是主询问,随后是Musk律师Alex Spiro团队成员Molo的激烈交叉质询。

Altman主询问要点:

  • OpenAI已累计融资约1750亿美元
  • Musk离开OpenAI后不再投资任何他不控制的公司,Musk曾给OpenAI"零分"评价
  • 2023年被解雇时"完全震惊",称"这是最糟糕的执行方式"
  • 被解雇后曾考虑去微软做纯研究,但最终选择回来:"我在乎的是使命和人"
  • "如果我事先知道这有多困难、多痛苦,我绝不会尝试"——但称这是他生命中除家庭外最有意义的事
  • "Musk先生确实至少两次试图扼杀它(OpenAI非营利实体)"

交叉质询火药味十足:

  • Molo开场直接问:"你是否总是说真话?"Altman回应:"我相信自己是一个诚实可信的商业人士"
  • 连续引用Ilya Sutskever、Mira Murati等人曾称Altman"不诚实"的证词,Altman"看起来困惑且受伤,说话声音很轻"
  • 引用《纽约客》Ronan Farrow文章"基本上称你不诚实",法官要求move on
  • 引用Anthropic联合创始人Dario和Daniela Amodei对Altman的批评,Altman"似乎困惑"
  • 被问是否曾因OpenAI商业决策解雇自己:"我目前没有这样的计划"

Musk"诱饵替换"短信被再度展示: Musk 2022年10月短信称"这是诱饵替换",Altman回复"我同意这感觉不好——我们在设立cap profit时向你提供过股权,你当时不想要,但我们随时乐意这样做"

庭审观察: 与Musk出庭时"随时准备吵架"形成鲜明对比,Altman"相当温和地回答了每一个侮辱性问题"。法官YGR多次对Musk律师团队表达不满,一度警告"你不想被控藐视法庭"。


2️⃣ OpenAI安全委员会主席Kolter证词:已两次正式延迟模型发布

Altman作证后,OpenAI安全与安全委员会主席、卡内基梅隆大学教授Jeremy "Zico" Kolter出庭。

核心披露:

  • 两次正式延迟:Kolter证实安全委员会已有两次"正式请求延迟模型发布"
  • 约200人从事安全工作:Kolter列出了OpenAI的多个安全团队——安全系统团队(防护栏和评估)、准备团队(准备框架)、对齐团队(训练模型对齐人类价值观)、模型政策团队(制定模型规范)等
  • 关于备受争议的超级对齐团队和AGI准备团队解散问题,Kolter表示部分研究已由其他团队继续
  • Kolter是OpenAI基金会非营利董事会成员,但不在营利性实体董事会

意义: 这是OpenAI安全委员会首次公开承认曾正式延迟模型发布,为安全治理机制的有效性提供了直接证据。


3️⃣ OpenAI发布B2B Signals:前沿企业AI使用强度3.5倍于普通企业

OpenAI发布B2B Signals报告,这是OpenAI Signals的商业扩展,基于隐私保护的企业使用数据,提供AI在企业中扩散情况的周期性度量。

核心发现:

  • 前沿企业使用3.5倍AI强度:95分位企业每员工使用的"智能"(以生成token为代理指标)是普通企业的3.5倍,一年前仅为2倍,差距正在复合扩大
  • 深度胜于频率:消息量仅解释前沿优势的36%,大部分差距来自更深、更复杂的使用——前沿企业让AI执行更复杂的任务
  • Agentic工作流成为前沿标志:Codex差距最大——前沿企业每员工Codex消息量是普通企业的16倍;ChatGPT Agent、Apps、Deep Research、GPTs也呈现类似方向
  • AI使用从通用走向专业:IT/安全团队偏重操作指引,软件开发团队偏重编码,财务团队偏重分析和计算

案例分析:

  • Cisco:Codex帮助减少约20%构建时间,每月节省1500+工程小时,缺陷解决吞吐量提升10-15倍
  • Travelers Insurance:AI理赔助手预计首年处理约10万次首次损失通知通话

关键洞察: "普通企业用AI回答问题;前沿企业用AI执行复杂工作。"AI采用的差异化已从"谁有访问权"转向"谁用得深"。


4️⃣ Anthropic Institute发布四大研究议程

Anthropic旗下研究机构**The Anthropic Institute (TAI)**发布详细研究议程,聚焦四大领域:

四大研究支柱:

  1. 经济扩散(Economic Diffusion):AI如何改变经济——谁采用AI、企业级采用的影响、AI是否为通用目的技术、生产力增长、就业市场冲击、AI扩散是否可调节
  2. 威胁与韧性(Threats and Resilience):AI的双用途能力、攻防平衡、危机应对基础设施、防御机制如何跟上AI能力发展速度
  3. AI系统在真实世界(AI Systems in the Wild):人机交互模式、AI系统在真实部署中的行为
  4. AI驱动的研发(AI-Driven R&D):AI如何加速自身研发、递归自我改进的意涵

承诺共享:

  • 更高频、更细粒度的Anthropic Economic Index数据
  • AI安全威胁韧性研究
  • Anthropic内部AI工具加速研发的详细数据
  • 开放Anthropic Fellow申请(4个月资助研究机会)

影响力: TAI的研究将直接影响Anthropic的决策——包括共享原本不会公开的数据(如Economic Index),以及调整技术发布方式(如Project Glasswing)。研究成果将作为Anthropic长期利益信托(LTBT)的重要输入。


5️⃣ Claude法律行业工具包:20+MCP连接器+12插件

Anthropic发布Claude法律行业专用工具包,法律专业人士已成为Claude Cowork使用最活跃的知识工作者群体。

20+新增MCP连接器覆盖法律技术栈:

  • 合同生命周期:Definely(合同结构实时访问)、DocuSign(协议数据和工作流)、Ironclad(合同库和查询)
  • 交易室:Box(内容搜索和访问)、Datasite(M&A虚拟数据室)
  • 文档管理:iManage(权限管控的受管内容访问)、NetDocuments(文档检索和先例起草)
  • 专家网络:Lawve AI(法律AI技能库)、The L Suite(内部法务社区连接器Lloyd + 外部律师推荐TopCounsel)
  • 电子发现:Consilio、Everlaw、Relativity
  • 信托级工作流:Thomson Reuters(CoCounsel Legal,基于Westlaw/Practical Law/KeyCite)
  • 法律研究:Legal Data Hunter(31M+文档,160+司法管辖区)、Midpage(判例法数据库)、Trellis(美国最大州级初审法院数据集)
  • 法律AI助手:Harvey

12个法律专用插件覆盖具体业务领域和任务。

微软Office集成: Claude在Word中处理起草、红线标注和条款比对;在Outlook中分类邮件和起草回复;在Excel/PowerPoint中延续上下文——一份Word中的红线标注无需重新解释即可成为Outlook封面备忘录。

公益合作: 与Free Law Project、Justice Technology Association合作,推动法律援助可及性。


6️⃣ ChatGPT推出Trusted Contact安全功能

OpenAI开始在ChatGPT中推出Trusted Contact功能——一项可选安全功能,允许成年人指定一位信任的联系人,当系统检测到用户可能涉及自伤害时通知该联系人。

工作机制:

  • 用户在设置中添加一位成年人(全球18+,韩国19+)为信任联系人
  • 信任联系人需在7天内接受邀请,拒绝后可更换
  • 自动监控系统检测到自伤害相关对话→ChatGPT告知用户可能通知信任联系人→受训人工审核员复核→确认后发送通知
  • 通知内容有限:仅告知"自伤害以令人担忧的方式出现",不包含聊天详情或记录,保护隐私
  • 用户可随时移除信任联系人,联系人也可自行退出
  • 审核目标:1小时内完成

设计理念: 基于CDC研究,社会连接是减少自杀风险最重要的保护因素之一。Trusted Contact不替代专业护理或危机服务,而是鼓励与已有信任的人建立连接。

专业背书: 美国心理学会CEO Dr. Arthur Evans、佐治亚理工Dr. Munmun De Choudhury等专家支持。与260+医师全球网络和AI福祉专家委员会共同开发。


7️⃣ Parameter Golf竞赛回顾:AI编码Agent深刻改变竞赛形态

OpenAI发布Parameter Golf竞赛回顾。该竞赛要求参与者在16MB模型+代码包限制、8×H100十分钟训练预算下,最小化FineWeb数据集的held-out loss。

竞赛数据:

  • 8周内收到2000+提交,来自1000+参与者
  • RunRun赞助100万美元算力

技术亮点:

  • 优化器调优:Muon权重衰减+谱嵌入�化+残差混合调度
  • 量化突破:GPTQ-lite首次成功用于排行榜提交,全Hessian GPTQ进一步扩展
  • 测试时训练:score-first per-document LoRA、自生成GPTQ校准
  • 新建模思路:CaseOps分词器(无损大小写算子)、XSA部分排他自注意力、SmearGate+BigramHash特征机制、mini深度递归
  • 非纪录赛道中,替代架构(非自回归、动态token化)有时能与强Transformer基线抗衡

AI Agent影响:

  • 绝大多数提交者使用AI编码Agent
  • Agent降低了参与门槛——更快搭建实验、检查陌生代码、减少试错摩擦
  • Agent也带来了新的挑战:提交审查、归属判定、评分公平性
  • 竞赛同时成为人才发现渠道

"One of the most exciting parts of the challenge was seeing how widely participants used AI coding agents. Agents helped lower the cost of experimentation, made it easier for more people to participate, and changed the pace of the competition."


📊 速递汇总

| # | 事件 | 影响方 | 重要性 | |---|------|--------|--------| | 1 | Altman出庭作证被质问诚信 | OpenAI/行业治理 | ⭐⭐⭐⭐ | | 2 | 安全委员会证实两次延迟模型发布 | AI安全治理 | ⭐⭐⭐⭐ | | 3 | B2B Signals:前沿企业AI强度3.5倍 | 企业AI采用 | ⭐⭐⭐⭐ | | 4 | Anthropic Institute四大研究议程 | AI社会影响研究 | ⭐⭐⭐ | | 5 | Claude法律行业20+MCP连接器 | 法律AI/垂直行业 | ⭐⭐⭐⭐ | | 6 | ChatGPT Trusted Contact安全功能 | AI安全/用户保护 | ⭐⭐⭐ | | 7 | Parameter Golf竞赛回顾 | ML研究/AI Agent | ⭐⭐⭐ |

今日关键词: 诚信、安全、深度、落地

💡 编者注:今天的主题是"信任与深度"。庭审上Altman的诚信被反复追问,OpenAI安全委员会首次承认延迟模型发布——都在追问同一个问题:AI行业的治理机制是否值得信任?而B2B Signals的数据则揭示了另一个维度:AI的价值不在于"有没有",而在于"用得深不深"。从ChatGPT的Trusted Contact到Claude的法律行业工具包,行业正在从通用能力转向深度嵌入专业场景。2026年AI竞争的关键词,已经从"谁的模型更强"变成了"谁更被信任、用得更深"。