- 2026年4月15日 PRM标注成本降两个数量级,dLLM幻觉错法不同 日报
- 2026年4月12日 打乱音视频练推理,6B模型超GPT-4o 日报
- 2026年4月11日 微调即加速1.7倍,token崩的不是channel 日报
- 2026年4月9日 单GPU训120B·视频评测四成靠猜 日报
- 2026年4月6日 32B硬件代码开源进第一梯队,Agent难题仅23% 日报
- 2026年4月5日 400万游戏帧练渲染,技能内化胜过检索 日报
- 2026年4月3日 极简Agent打平MCP,代码推理边写边想 日报
- 2026年3月30日 水印实现bit级溯源,扩散VLM进GUI定位 日报
- 2026年3月28日 蒸馏砍掉模型的犹豫,OOD暴跌40% 日报
- 2026年3月26日 扩散OCR解码快3.2倍,单流架构2秒出片 日报
- 2026年3月20日 32B工业代码模型首发,战争验证推理真伪 日报
- 2026年3月19日 开源搜索Agent逆袭,Agent Skills神话破灭 日报
- 2026年3月16日 1/4预算Agent反超4倍暴力采样 日报
- 2026年3月13日 「想一想」能翻模型的记忆库 日报
- 2026年3月12日 先写代码再画图,排版提升68% 日报
- 2026年3月11日 4步超100步基线,跳层省18%算力 日报
- 2026年3月9日 去掉CLIP的VLM更强,prefill加速28倍 日报
- 2026年3月8日 「请简洁」砍半token,准确率反涨16分 日报
- 2026年3月6日 code agent跨仓库不到45% 日报
- 2026年3月4日 9K样本逼近R1,RL提升大半归SFT 日报
- 2026年3月2日 砍掉90%视觉token性能不掉 日报
- 2026年3月1日 Latent推理靠的不是推理 日报
- 2026年2月28日 三模态从零训练,Agent RL稳定性破局 日报
- 2026年2月27日 TTT就是线性注意力,Terminal Agent数据配方开源 日报
- 2026年2月26日 Agent红队11种失败模式,step级路由降本700倍 日报
- 2026年2月25日 token概率直接当reward,零样本达0.95相关性 日报
- 2026年2月24日 74%的agent协调可能是白费的 日报
- 2026年2月22日 DiT动态patch快3倍,Mamba减法逼近softmax 日报
- 2026年2月21日 Agent从80分涨到90分,失败模式没变 日报
- 2026年2月19日 频谱衰减让W4A4量化回升7%精度 日报
- 2026年2月17日 Web Agent在线RL突破70%,奖励模型换个方向思考就行 日报
- 2026年2月16日 医疗AI、科学Agent、机器人VLA:垂直领域正在成为AI的主战场 日报
- 2026年2月15日 RL训练数据不够用?把简单题拼成难题就行 日报
- 2026年2月14日 11B参数跑出frontier级Agent智能,Coding Agent评测该换赛道了 日报
- 2026年2月13日 AI数学研究agent解开真实开放问题,世界模型扎堆涌现 日报
- 2026年2月11日 Agent跑久了上下文会「腐烂」,但好的上下文管理策略能大幅挽回性能 日报
- 2026年2月10日 LinkedIn把LLM搜索排序做到了上线水平 日报
- 2026年2月9日 医疗LLM不该只答题,应该像医生一样主动问诊 日报
- 2026年2月8日 用扩散模型做投机解码,推理加速6倍 日报
- 2026年2月7日 百度发布万亿参数统一多模态模型ERNIE 5.0 日报
- 2026年2月3日 预训练数据配比不用训练就能搜到最优解 日报
- 2026年2月2日 RLVR训练数据不够用?从互联网文本里无限合成就行 日报