2026年04月27日 AI 资讯速递

Apr 27, 2026

DeepSeek官方宣布全系API服务输入缓存命中价格降至原有价格的1/10。DeepSeek-V4-Pro缓存命中输入降至0.025元，DeepSeek-V4-Flash降至0.02元。Pro模型在5月5日前可叠加2.5折限时优惠。本次大幅降价为降低开发者调用成本，提升长上下文场景下的API使用性价比。来源：IT之家...

今日概览

DeepSeek API输入缓存降价90%
小米开源 VLA 大模型 Xiaomi-Robotics-0 后训练全流程
Browser Use Cloud 推出全天候自主代理服务 Box
budi：追踪AI编码助手按任务维度的token成本
用三个文件解决AI代理的身份漂移问题

大模型与产品发布

DeepSeek API输入缓存降价90%

来源：AI工具集

小米开源 VLA 大模型 Xiaomi-Robotics-0 后训练全流程

小米机器人事业部开源 Xiaomi-Robotics-0 真机后训练全流程。基于预训练基座，用20小时任务数据可完成耳机收纳等高精度操作。团队通过异步推理、动作前缀及自适应加权、Λ型掩码、随机遮蔽三重策略，破解模型”偷懒效应”，实现动作连贯与视觉灵敏的平衡。来源：小米技术

来源：AI工具集

用OpenVino后端大幅提升Intel GPU上的Llama.cpp性能

开发者测试发现，在Intel B70 GPU上，Llama.cpp的OpenVino后端相比SYCL后端，提示处理速度提升约4.5倍（从844 t/s到3845 t/s）。但Intel官方优化的LLM-Scaler（VLLM分支）速度更快，可达7875 t/s。 [7] 来源: [7] https://www.reddit.com/r/LocalLLaMA/comments/1swk3wh/intel_b70_llamaccp_sycl_vs_llamacpp_openvino_vs/

来源：大黑AI·技巧教程

OpenAI正推进代理化转型，或收购Windsurf

消息称OpenAI正在推进代理化转型，并探索收购代理编排公司Windsurf。同时，Google计划向Anthropic投资高达400亿美元，以应对Claude商业和编码产品的旺盛需求。 [6] 来源: [6] https://www.reddit.com/r/OpenAI/comments/1swnmso/openais_agentic_shift/

来源：大黑AI·行业资讯

AI 应用与落地

Browser Use Cloud 推出全天候自主代理服务 Box

Browser Use Cloud 推出Browser Use Box，可提供24/7运行的个人代理服务。该服务使用真实Chrome浏览器，支持持久化登录和Telegram集成，能自动完成订票、回复领英消息等任务。项目地址：cloud.browser-use.com/bux [1] 来源: [1] https://x.com/browser_use/status/2048510003506713076

来源：大黑AI·产品工具

budi：追踪AI编码助手按任务维度的token成本

开发者推出budi工具，可本地解析Claude Code、Cursor等工具的JSONL日志，按任务ID统计token成本和消耗。提供CLI、本地SQLite存储和可选的云仪表盘，帮助开发者了解具体功能的开发成本。项目地址：https://getbudi.dev/ [4] 来源: [4] https://www.reddit.com/r/ClaudeAI/comments/1swkih7/frontend_dev_a_month_of_building_a_rust_cost/

来源：大黑AI·产品工具

用三个文件解决AI代理的身份漂移问题

开发者分享运行11个本地代理的经验，指出身份漂移比记忆问题更棘手。解决方案为分离身份与记忆，使用passport.json（身份）、local.json（会话历史）和observations.json（观察记录）三个文件，并按顺序加载。 [2] 来源: [2] https://www.reddit.com/r/singularity/comments/1swlj4m/i_ran_11_ai_agents_for_2_months_memory_wasnt_the/

来源：大黑AI·技巧教程

用Galactic解决并行Claude Code代理的端口冲突

开发者分享工具Galactic，通过为每个分支工作区分配独立端口和路由URL，并配合zsh钩子自动设置环境变量，解决了多个Claude Code代理在同一项目上运行时争夺localhost端口的问题。项目地址：https://www.github.com/idolaman/galactic [3] 来源: [3] https://www.reddit.com/r/ClaudeAI/comments/1swlxqb/running_parallel_claude_code_agents_on_the_same/

来源：大黑AI·技巧教程

AMD与Intel未来APU内存带宽对比出炉

社区汇总了未来x86统一内存系统的内存带宽信息：AMDMedusa Halo（2027年）约460-690 GB/s，IntelNova Lake AX（2027年初）约341 GB/s，AMDGorgon Halo（2026年夏）约273 GB/s，AMDStrix Halo约256 GB/s。 [5] 来源: [5] https://www.reddit.com/r/LocalLLaMA/comments/1swiylm/comparison_of_upcoming_x86_unified_memory_systems/

来源：大黑AI·硬件动态