- 2026年3月1日 Latent推理靠的不是推理 日报
- 2026年2月25日 token概率直接当reward,零样本达0.95相关性 日报
- 2026年2月21日 Agent从80分涨到90分,失败模式没变 日报
- 2026年2月20日 示例图对替代prompt,Agent筛信息暗藏偏心 日报
- 2026年2月12日 文本扩散模型不再只是概念验证 日报
- 2026年2月10日 LinkedIn把LLM搜索排序做到了上线水平 日报
- 2026年2月5日 Kimi K2.5开源,Agent Swarm框架让多Agent并行延迟降4.5倍 日报
- 2026年2月4日 SFT越强,RL反而越弱? 日报
- 2026年2月3日 预训练数据配比不用训练就能搜到最优解 日报
- 2026年2月1日 多模态深度研究不再是闭源大模型的专利 日报