- 2026年4月14日 SFT收敛≠全学会,注意力劫持破防94% 日报
- 2026年4月11日 微调即加速1.7倍,token崩的不是channel 日报
- 2026年4月10日 Entropy在骗你,隐式推理止于7步 日报
- 2026年4月8日 视频问答跑到2FPS,RLVR自带噪声过滤 日报
- 2026年4月6日 32B硬件代码开源进第一梯队,Agent难题仅23% 日报
- 2026年4月3日 极简Agent打平MCP,代码推理边写边想 日报
- 2026年4月2日 配比成本降35倍,显眼词劫持推理38倍 日报
- 2026年3月29日 Mistral自研TTS、扩散LLM加速4.7倍 日报
- 2026年3月27日 投机执行快3倍,不丢token反更快 日报
- 2026年3月25日 PDE替掉attention误差低2倍,局部RL省3/4算力 日报
- 2026年3月24日 Seed1.8把Agent做进基座,语言训练让视觉退化 日报
- 2026年3月21日 3D仅需0.1%token,视频微调反伤空间理解 日报
- 2026年3月20日 32B工业代码模型首发,战争验证推理真伪 日报
- 2026年3月19日 开源搜索Agent逆袭,Agent Skills神话破灭 日报
- 2026年3月17日 专家推理结构做CoT,新类发现+13% 日报
- 2026年3月12日 先写代码再画图,排版提升68% 日报
- 2026年3月11日 4步超100步基线,跳层省18%算力 日报
- 2026年3月8日 「请简洁」砍半token,准确率反涨16分 日报
- 2026年3月6日 code agent跨仓库不到45% 日报
- 2026年3月5日 Lottie动画直接生成,DPO自带防遗忘 日报
- 2026年3月4日 9K样本逼近R1,RL提升大半归SFT 日报
- 2026年3月3日 谱条件统一μP缩放,数据筛选也泄露隐私 日报
- 2026年2月28日 三模态从零训练,Agent RL稳定性破局 日报
- 2026年2月18日 二进制token让图像生成快30倍,RL训练也在学会反思 日报
- 2026年2月16日 医疗AI、科学Agent、机器人VLA:垂直领域正在成为AI的主战场 日报
- 2026年2月15日 RL训练数据不够用?把简单题拼成难题就行 日报
- 2026年2月14日 11B参数跑出frontier级Agent智能,Coding Agent评测该换赛道了 日报
- 2026年2月12日 文本扩散模型不再只是概念验证 日报
- 2026年2月9日 医疗LLM不该只答题,应该像医生一样主动问诊 日报
- 2026年2月4日 SFT越强,RL反而越弱? 日报
- 2026年2月2日 RLVR训练数据不够用?从互联网文本里无限合成就行 日报
- 2026年2月1日 多模态深度研究不再是闭源大模型的专利 日报