可解释性 | AI论文简报

2026年7月10日 RL训到图像生成，Gemma 4开源日报
2026年7月8日数字人分辨率翻倍，延迟守住200ms 日报
2026年7月6日 0.6B追平32B，显存省50倍日报
2026年7月1日 1.6小时长任务agent只做完两成日报
2026年6月28日 ViQ让多模态训练提速20-70% 日报
2026年6月22日有状态embedding让260M压过8B 日报
2026年6月19日两次循环让SWE-bench从43涨到64 日报
2026年6月18日删context省token反被cache吃回日报
2026年6月17日 1.5B模型预测事件赢过Sonnet3.5 日报
2026年6月15日剪枝小模型捷径只在预算紧时成立日报
2026年6月7日流式传递让多agent更准，1/6高斯更清晰日报
2026年6月1日 0.5概率即逐字背诵，倒放视频测因果日报
2026年5月30日 Agent开始学会自己变强，也学会少用工具日报
2026年5月27日我们一直在用错的尺子量模型的『心里话』日报
2026年5月23日 Optimizer让容量缩放差2.3倍日报
2026年5月21日双流MoE统一多模态，换装视频30倍提速日报
2026年5月20日 LRM早停换判据省26%token 日报
2026年5月14日 Flow-OPD把GenEval从63拉到92 日报
2026年5月8日 T²PO稳多轮RL+视频缓存提速6倍日报
2026年5月4日 ViT改用LM目标预训练替代CLIP 日报
2026年5月1日递归MAS省35%token，T2I整张重画日报
2026年4月29日去掉情绪词后probe准确率塌到5% 日报
2026年4月27日完整trace让多agent归因准76% 日报
2026年4月26日 10K数据训出4B agent，MoE扩容省32% 日报
2026年4月22日答案摆面前agent也视而不见日报
2026年4月20日 Qwen3.5-Omni扩到几百亿参数日报
2026年4月18日腾讯开源3D世界生成、VLM偏科探针日报
2026年4月17日大模型更抗谣言却更易被噪声带跑日报
2026年4月11日微调即加速1.7倍，token崩的不是channel 日报
2026年4月9日单GPU训120B·视频评测四成靠猜日报
2026年4月3日极简Agent打平MCP，代码推理边写边想日报
2026年3月19日开源搜索Agent逆袭，Agent Skills神话破灭日报
2026年3月18日 70万对论文蒸馏品味，零空间暴露盲区日报
2026年3月16日 1/4预算Agent反超4倍暴力采样日报
2026年3月12日先写代码再画图，排版提升68% 日报
2026年3月11日 4步超100步基线，跳层省18%算力日报
2026年3月6日 code agent跨仓库不到45% 日报
2026年3月4日 9K样本逼近R1，RL提升大半归SFT 日报
2026年3月1日 Latent推理靠的不是推理日报
2026年2月25日 token概率直接当reward，零样本达0.95相关性日报
2026年2月21日 Agent从80分涨到90分，失败模式没变日报
2026年2月20日示例图对替代prompt，Agent筛信息暗藏偏心日报
2026年2月12日文本扩散模型不再只是概念验证日报
2026年2月10日 LinkedIn把LLM搜索排序做到了上线水平日报
2026年2月5日 Kimi K2.5开源，Agent Swarm框架让多Agent并行延迟降4.5倍日报
2026年2月4日 SFT越强，RL反而越弱？日报
2026年2月3日预训练数据配比不用训练就能搜到最优解日报
2026年2月1日多模态深度研究不再是闭源大模型的专利日报