检索 | AI论文简报

2026年7月9日部署后学习拟合出R²=0.998 日报
2026年7月5日记忆让agent谄媚，视觉推理93.2% 日报
2026年7月3日 35B agent对标1T，异步滞后被高估日报
2026年6月27日 ImageNet-FID与文生图能力负相关日报
2026年6月21日榜单分预测不了部署，机械臂自迭代99% 日报
2026年6月19日两次循环让SWE-bench从43涨到64 日报
2026年6月3日主动找视角,最强模型仅12% 日报
2026年6月1日 0.5概率即逐字背诵，倒放视频测因果日报
2026年5月29日视觉模型开始重新设计自己的输出方式日报
2026年5月27日我们一直在用错的尺子量模型的『心里话』日报
2026年5月25日 agent轨迹让30B打平235B 日报
2026年5月21日双流MoE统一多模态，换装视频30倍提速日报
2026年5月18日 2.6B开源世界模型撑1分钟720p 日报
2026年5月13日几何冲突让持续微调可预判日报
2026年5月1日递归MAS省35%token，T2I整张重画日报
2026年4月29日去掉情绪词后probe准确率塌到5% 日报
2026年4月27日完整trace让多agent归因准76% 日报
2026年4月25日压agent改分,4轮就开始作弊日报
2026年4月24日校准critic让推理涨18点日报
2026年4月22日答案摆面前agent也视而不见日报
2026年4月18日腾讯开源3D世界生成、VLM偏科探针日报
2026年4月17日大模型更抗谣言却更易被噪声带跑日报
2026年4月16日 VLM换规则就崩·DLM加速4倍日报
2026年4月11日微调即加速1.7倍，token崩的不是channel 日报
2026年4月8日视频问答跑到2FPS，RLVR自带噪声过滤日报
2026年4月7日 Diffusion推理省54%算力不降质日报
2026年4月3日极简Agent打平MCP，代码推理边写边想日报
2026年3月27日投机执行快3倍，不丢token反更快日报
2026年3月13日「想一想」能翻模型的记忆库日报
2026年3月10日 12k样本赢金融SOTA，CUDA优化快35% 日报
2026年3月5日 Lottie动画直接生成，DPO自带防遗忘日报
2026年2月28日三模态从零训练，Agent RL稳定性破局日报
2026年2月26日 Agent红队11种失败模式，step级路由降本700倍日报
2026年2月24日 74%的agent协调可能是白费的日报
2026年2月23日模型压缩的几何直觉：折叠比剪枝更优日报
2026年2月21日 Agent从80分涨到90分，失败模式没变日报
2026年2月19日频谱衰减让W4A4量化回升7%精度日报
2026年2月18日二进制token让图像生成快30倍，RL训练也在学会反思日报
2026年2月17日 Web Agent在线RL突破70%，奖励模型换个方向思考就行日报
2026年2月16日医疗AI、科学Agent、机器人VLA：垂直领域正在成为AI的主战场日报
2026年2月11日 Agent跑久了上下文会「腐烂」，但好的上下文管理策略能大幅挽回性能日报
2026年2月10日 LinkedIn把LLM搜索排序做到了上线水平日报
2026年2月8日用扩散模型做投机解码，推理加速6倍日报
2026年2月5日 Kimi K2.5开源，Agent Swarm框架让多Agent并行延迟降4.5倍日报