2026年05月08日 AI 资讯速递

OpenAI推出三款实时语音模型:GPT-Realtime-2具备GPT-5级推理与工具调用能力;GPT-Realtime-Translate支持70多种语言实时互译,每分钟成本仅约0.25元,较人类同传降低百倍;GPT-Realtime-Whisper实现低延迟语音转录。三模型均通过Realtime API开放,端到端处理保留语调情感。来源:openAI...

今日概览

  • OpenAI 推出三款实时语音模型
  • OpenAI推出Codex Chrome扩展插件

大模型与产品发布

OpenAI 推出三款实时语音模型

OpenAI推出三款实时语音模型:GPT-Realtime-2具备GPT-5级推理与工具调用能力;GPT-Realtime-Translate支持70多种语言实时互译,每分钟成本仅约0.25元,较人类同传降低百倍;GPT-Realtime-Whisper实现低延迟语音转录。三模型均通过Realtime API开放,端到端处理保留语调情感。来源:openAI

来源:AI工具集

OpenAI推出Codex Chrome扩展插件

OpenAI 正式推出Codex Chrome扩展插件,支持 Codex 直接操作用户已登录的 Chrome 浏览器,包括读取打开标签页、页面内容及已登录网站信息,支持导航、点击、输入和截图等交互操作。用户可随时停止任务并在设置中管理访问权限,与新网站交互前需经确认。来源:AI工具集

来源:AI工具集