2026年04月27日 AI 资讯速递

DeepSeek官方宣布全系API服务输入缓存命中价格降至原有价格的1/10。DeepSeek-V4-Pro缓存命中输入降至0.025元,DeepSeek-V4-Flash降至0.02元。Pro模型在5月5日前可叠加2.5折限时优惠。本次大幅降价为降低开发者调用成本,提升长上下文场景下的API使用性价比。来源:IT之家...

今日概览

  • DeepSeek API输入缓存降价90%
  • 小米开源 VLA 大模型 Xiaomi-Robotics-0 后训练全流程
  • Browser Use Cloud 推出全天候自主代理服务 Box
  • budi:追踪AI编码助手按任务维度的token成本
  • 用三个文件解决AI代理的身份漂移问题

大模型与产品发布

DeepSeek API输入缓存降价90%

DeepSeek官方宣布全系API服务输入缓存命中价格降至原有价格的1/10。DeepSeek-V4-Pro缓存命中输入降至0.025元,DeepSeek-V4-Flash降至0.02元。Pro模型在5月5日前可叠加2.5折限时优惠。本次大幅降价为降低开发者调用成本,提升长上下文场景下的API使用性价比。来源:IT之家

来源:AI工具集

小米开源 VLA 大模型 Xiaomi-Robotics-0 后训练全流程

小米机器人事业部开源 Xiaomi-Robotics-0 真机后训练全流程。基于预训练基座,用20小时任务数据可完成耳机收纳等高精度操作。团队通过异步推理、动作前缀及自适应加权、Λ型掩码、随机遮蔽三重策略,破解模型”偷懒效应”,实现动作连贯与视觉灵敏的平衡。来源:小米技术

来源:AI工具集

用OpenVino后端大幅提升Intel GPU上的Llama.cpp性能

开发者测试发现,在Intel B70 GPU上,Llama.cpp的OpenVino后端相比SYCL后端,提示处理速度提升约4.5倍(从844 t/s到3845 t/s)。但Intel官方优化的LLM-Scaler(VLLM分支)速度更快,可达7875 t/s。 [7] 来源: [7] https://www.reddit.com/r/LocalLLaMA/comments/1swk3wh/intel_b70_llamaccp_sycl_vs_llamacpp_openvino_vs/

来源:大黑AI·技巧教程

OpenAI正推进代理化转型,或收购Windsurf

消息称OpenAI正在推进代理化转型,并探索收购代理编排公司Windsurf。同时,Google计划向Anthropic投资高达400亿美元,以应对Claude商业和编码产品的旺盛需求。 [6] 来源: [6] https://www.reddit.com/r/OpenAI/comments/1swnmso/openais_agentic_shift/

来源:大黑AI·行业资讯

AI 应用与落地

Browser Use Cloud 推出全天候自主代理服务 Box

Browser Use Cloud 推出Browser Use Box,可提供24/7运行的个人代理服务。该服务使用真实Chrome浏览器,支持持久化登录和Telegram集成,能自动完成订票、回复领英消息等任务。项目地址:cloud.browser-use.com/bux [1] 来源: [1] https://x.com/browser_use/status/2048510003506713076

来源:大黑AI·产品工具

budi:追踪AI编码助手按任务维度的token成本

开发者推出budi工具,可本地解析Claude Code、Cursor等工具的JSONL日志,按任务ID统计token成本和消耗。提供CLI、本地SQLite存储和可选的云仪表盘,帮助开发者了解具体功能的开发成本。项目地址:https://getbudi.dev/ [4] 来源: [4] https://www.reddit.com/r/ClaudeAI/comments/1swkih7/frontend_dev_a_month_of_building_a_rust_cost/

来源:大黑AI·产品工具

用三个文件解决AI代理的身份漂移问题

开发者分享运行11个本地代理的经验,指出身份漂移比记忆问题更棘手。解决方案为分离身份与记忆,使用passport.json(身份)、local.json(会话历史)和observations.json(观察记录)三个文件,并按顺序加载。 [2] 来源: [2] https://www.reddit.com/r/singularity/comments/1swlj4m/i_ran_11_ai_agents_for_2_months_memory_wasnt_the/

来源:大黑AI·技巧教程

用Galactic解决并行Claude Code代理的端口冲突

开发者分享工具Galactic,通过为每个分支工作区分配独立端口和路由URL,并配合zsh钩子自动设置环境变量,解决了多个Claude Code代理在同一项目上运行时争夺localhost端口的问题。项目地址:https://www.github.com/idolaman/galactic [3] 来源: [3] https://www.reddit.com/r/ClaudeAI/comments/1swlxqb/running_parallel_claude_code_agents_on_the_same/

来源:大黑AI·技巧教程

AMD与Intel未来APU内存带宽对比出炉

社区汇总了未来x86统一内存系统的内存带宽信息:AMDMedusa Halo(2027年)约460-690 GB/s,IntelNova Lake AX(2027年初)约341 GB/s,AMDGorgon Halo(2026年夏)约273 GB/s,AMDStrix Halo约256 GB/s。 [5] 来源: [5] https://www.reddit.com/r/LocalLLaMA/comments/1swiylm/comparison_of_upcoming_x86_unified_memory_systems/

来源:大黑AI·硬件动态