视频生成 | AI论文简报

2026年7月13日血统推理最强模型仅对27% 日报
2026年7月10日 RL训到图像生成，Gemma 4开源日报
2026年7月9日部署后学习拟合出R²=0.998 日报
2026年7月6日 0.6B追平32B，显存省50倍日报
2026年7月4日自适应解码4.2倍，联合训练快10倍日报
2026年7月3日 35B agent对标1T，异步滞后被高估日报
2026年7月1日 1.6小时长任务agent只做完两成日报
2026年6月29日视频世界模型卡24%，越狱只压几个头日报
2026年6月28日 ViQ让多模态训练提速20-70% 日报
2026年6月23日 8B模型科学推理反超235B 日报
2026年6月21日榜单分预测不了部署，机械臂自迭代99% 日报
2026年6月20日 7B视频agent反超72B模型日报
2026年6月19日两次循环让SWE-bench从43涨到64 日报
2026年6月14日换接口空间推理+11分日报
2026年6月13日 Arbor科研增益2.5倍，50环境抵300个日报
2026年6月12日一条证据压成1个token，生成省3-10倍日报
2026年6月8日 dots.tts首包54ms，SWE自进化破50% 日报
2026年6月6日 NVIDIA五模态压进一套权重日报
2026年6月2日 MoE安全集中在少数专家、独占批提速42% 日报
2026年6月1日 0.5概率即逐字背诵，倒放视频测因果日报
2026年5月28日扩散模型把解码这道工序也吃了下来日报
2026年5月25日 agent轨迹让30B打平235B 日报
2026年5月21日双流MoE统一多模态，换装视频30倍提速日报
2026年5月14日 Flow-OPD把GenEval从63拉到92 日报
2026年5月11日 Lorem Ipsum救回GRPO难题样本日报
2026年5月9日 10.6k轨迹SFT追平RL流水线日报
2026年5月3日 FID当loss一步生成达0.72 日报
2026年5月2日 dLLM跨架构蒸馏到0.6B 日报
2026年5月1日递归MAS省35%token，T2I整张重画日报
2026年4月28日 ProEval省8-65倍评测样本日报
2026年4月24日校准critic让推理涨18点日报
2026年4月20日 Qwen3.5-Omni扩到几百亿参数日报
2026年4月13日 DMax让扩散LM并行效率提升近3倍日报
2026年4月11日微调即加速1.7倍，token崩的不是channel 日报
2026年4月8日视频问答跑到2FPS，RLVR自带噪声过滤日报
2026年4月5日 400万游戏帧练渲染，技能内化胜过检索日报
2026年4月3日极简Agent打平MCP，代码推理边写边想日报
2026年3月29日 Mistral自研TTS、扩散LLM加速4.7倍日报
2026年3月27日投机执行快3倍，不丢token反更快日报
2026年3月25日 PDE替掉attention误差低2倍，局部RL省3/4算力日报
2026年3月23日 12B超GPT-4，蒸馏后学生反超教师日报
2026年3月22日 3B参数奥赛三金，768维离散token生成可行日报
2026年3月21日 3D仅需0.1%token，视频微调反伤空间理解日报
2026年3月20日 32B工业代码模型首发，战争验证推理真伪日报
2026年3月19日开源搜索Agent逆袭，Agent Skills神话破灭日报
2026年3月15日文档Agent导航≈碰运气，预填充加速1.82× 日报
2026年3月13日「想一想」能翻模型的记忆库日报
2026年3月12日先写代码再画图，排版提升68% 日报
2026年3月11日 4步超100步基线，跳层省18%算力日报
2026年3月9日去掉CLIP的VLM更强，prefill加速28倍日报
2026年3月7日 14B视频模型单卡19.5FPS 日报
2026年3月6日 code agent跨仓库不到45% 日报
2026年2月21日 Agent从80分涨到90分，失败模式没变日报
2026年2月20日示例图对替代prompt，Agent筛信息暗藏偏心日报
2026年2月19日频谱衰减让W4A4量化回升7%精度日报
2026年2月12日文本扩散模型不再只是概念验证日报
2026年2月11日 Agent跑久了上下文会「腐烂」，但好的上下文管理策略能大幅挽回性能日报
2026年2月8日用扩散模型做投机解码，推理加速6倍日报
2026年2月6日只保留256个token就能逼近全量注意力性能日报