- 2026年4月11日 微调即加速1.7倍,token崩的不是channel 日报
- 2026年4月9日 单GPU训120B·视频评测四成靠猜 日报
- 2026年4月3日 极简Agent打平MCP,代码推理边写边想 日报
- 2026年3月19日 开源搜索Agent逆袭,Agent Skills神话破灭 日报
- 2026年3月18日 70万对论文蒸馏品味,零空间暴露盲区 日报
- 2026年3月16日 1/4预算Agent反超4倍暴力采样 日报
- 2026年3月12日 先写代码再画图,排版提升68% 日报
- 2026年3月11日 4步超100步基线,跳层省18%算力 日报
- 2026年3月6日 code agent跨仓库不到45% 日报
- 2026年3月4日 9K样本逼近R1,RL提升大半归SFT 日报
- 2026年3月1日 Latent推理靠的不是推理 日报
- 2026年2月25日 token概率直接当reward,零样本达0.95相关性 日报
- 2026年2月21日 Agent从80分涨到90分,失败模式没变 日报
- 2026年2月20日 示例图对替代prompt,Agent筛信息暗藏偏心 日报
- 2026年2月12日 文本扩散模型不再只是概念验证 日报
- 2026年2月10日 LinkedIn把LLM搜索排序做到了上线水平 日报
- 2026年2月5日 Kimi K2.5开源,Agent Swarm框架让多Agent并行延迟降4.5倍 日报
- 2026年2月4日 SFT越强,RL反而越弱? 日报
- 2026年2月3日 预训练数据配比不用训练就能搜到最优解 日报
- 2026年2月1日 多模态深度研究不再是闭源大模型的专利 日报