- 2026年2月28日 三模态从零训练,Agent RL稳定性破局 日报
- 2026年2月26日 Agent红队11种失败模式,step级路由降本700倍 日报
- 2026年2月24日 74%的agent协调可能是白费的 日报
- 2026年2月23日 模型压缩的几何直觉:折叠比剪枝更优 日报
- 2026年2月21日 Agent从80分涨到90分,失败模式没变 日报
- 2026年2月19日 频谱衰减让W4A4量化回升7%精度 日报
- 2026年2月18日 二进制token让图像生成快30倍,RL训练也在学会反思 日报
- 2026年2月17日 Web Agent在线RL突破70%,奖励模型换个方向思考就行 日报
- 2026年2月16日 医疗AI、科学Agent、机器人VLA:垂直领域正在成为AI的主战场 日报
- 2026年2月11日 Agent跑久了上下文会「腐烂」,但好的上下文管理策略能大幅挽回性能 日报
- 2026年2月10日 LinkedIn把LLM搜索排序做到了上线水平 日报
- 2026年2月8日 用扩散模型做投机解码,推理加速6倍 日报
- 2026年2月5日 Kimi K2.5开源,Agent Swarm框架让多Agent并行延迟降4.5倍 日报