2026年05月01日 AI 资讯速递

腾讯混元 Hy3-Preview在 Arena 文本竞技场中排名开源模型第七,总榜第80。该模型为 MoE 架构,总参数量295B,激活参数21B,定价为每百万 tokens $0.29/$1.17。 ...

今日概览

  • 腾讯混元 Hy3-Preview 跻身文本竞技场开源模型前七
  • OpenAI 密集展示 Codex 实际工作流程与进度可视化
  • DeepSeek-V4 API 罕见踩坑:必须原样回传空字符串 reasoning_content
  • UC Berkeley 学生参加 Codex Creator 挑战赛,用 AI 学习编程
  • Anthropic 研究闭环:将 Claude 实际使用中的不足用于训练新模型

大模型与产品发布

腾讯混元 Hy3-Preview 跻身文本竞技场开源模型前七

腾讯混元 Hy3-Preview在 Arena 文本竞技场中排名开源模型第七,总榜第80。该模型为 MoE 架构,总参数量295B,激活参数21B,定价为每百万 tokens $0.29/$1.17。 [5] 来源: [5] https://x.com/arena/status/2049905966188249230

来源:大黑AI·模型动态

OpenAI 密集展示 Codex 实际工作流程与进度可视化

OpenAI 官方连续发布演示,展示Codex在生成演示文稿时能实时查看任务进度、使用的文件和工具,并支持在同一对话线程中持续修改和迭代。 [2] [3] 来源: [2] https://x.com/OpenAI/status/2049928782019256561, [3] https://x.com/OpenAI/status/2049928780588966270

来源:大黑AI·产品工具

DeepSeek-V4 API 罕见踩坑:必须原样回传空字符串 reasoning_content

开发者发现调用DeepSeek-V4 API时,若模型返回空字符串的 reasoning_content 字段,必须原样回传该字段(值为空字符串),否则会报错。现有 IDE 和 Agent 默认会过滤此字段,导致任务崩溃,复现概率高达 59%。 [1] 来源: [1] https://x.com/karminski3/status/2049926904120267144

来源:大黑AI·技巧教程

UC Berkeley 学生参加 Codex Creator 挑战赛,用 AI 学习编程

OpenAI 官方透露,加州大学伯克利分校的学生在Codex Creator Challenge中一边构建应用一边学习编程,展示了 Codex 在教育场景的潜力。 [4] 来源: [4] https://x.com/OpenAIDevs/status/2049888218464870670

来源:大黑AI·行业资讯

Anthropic 研究闭环:将 Claude 实际使用中的不足用于训练新模型

Anthropic 宣布正在构建一个闭环流程,通过分析人们如何使用Claude,找出模型与原则的差距,并将这些发现直接用于训练新模型。 [6] 来源: [6] https://x.com/AnthropicAI/status/2049927628161999317

来源:大黑AI·行业资讯