- 2026年4月14日 SFT收敛≠全学会,注意力劫持破防94% 日报
- 2026年4月12日 打乱音视频练推理,6B模型超GPT-4o 日报
- 2026年4月5日 400万游戏帧练渲染,技能内化胜过检索 日报
- 2026年3月25日 PDE替掉attention误差低2倍,局部RL省3/4算力 日报
- 2026年3月21日 3D仅需0.1%token,视频微调反伤空间理解 日报
- 2026年3月19日 开源搜索Agent逆袭,Agent Skills神话破灭 日报
- 2026年3月18日 70万对论文蒸馏品味,零空间暴露盲区 日报
- 2026年3月14日 编码答案而非问题,embedding涨9% 日报
- 2026年3月10日 12k样本赢金融SOTA,CUDA优化快35% 日报
- 2026年3月7日 14B视频模型单卡19.5FPS 日报
- 2026年3月6日 code agent跨仓库不到45% 日报
- 2026年3月5日 Lottie动画直接生成,DPO自带防遗忘 日报
- 2026年3月4日 9K样本逼近R1,RL提升大半归SFT 日报
- 2026年2月24日 74%的agent协调可能是白费的 日报
- 2026年2月19日 频谱衰减让W4A4量化回升7%精度 日报
- 2026年2月18日 二进制token让图像生成快30倍,RL训练也在学会反思 日报
- 2026年2月17日 Web Agent在线RL突破70%,奖励模型换个方向思考就行 日报
- 2026年2月16日 医疗AI、科学Agent、机器人VLA:垂直领域正在成为AI的主战场 日报
- 2026年2月15日 RL训练数据不够用?把简单题拼成难题就行 日报
- 2026年2月14日 11B参数跑出frontier级Agent智能,Coding Agent评测该换赛道了 日报
- 2026年2月13日 AI数学研究agent解开真实开放问题,世界模型扎堆涌现 日报
- 2026年2月12日 文本扩散模型不再只是概念验证 日报
- 2026年2月9日 医疗LLM不该只答题,应该像医生一样主动问诊 日报
- 2026年2月5日 Kimi K2.5开源,Agent Swarm框架让多Agent并行延迟降4.5倍 日报
- 2026年2月3日 预训练数据配比不用训练就能搜到最优解 日报
- 2026年2月2日 RLVR训练数据不够用?从互联网文本里无限合成就行 日报