图像生成 | AI论文简报

2026年7月13日血统推理最强模型仅对27% 日报
2026年7月10日 RL训到图像生成，Gemma 4开源日报
2026年7月9日部署后学习拟合出R²=0.998 日报
2026年7月8日数字人分辨率翻倍，延迟守住200ms 日报
2026年7月7日潜空间打分把视频生成压到1-4步日报
2026年7月4日自适应解码4.2倍，联合训练快10倍日报
2026年7月3日 35B agent对标1T，异步滞后被高估日报
2026年7月1日 1.6小时长任务agent只做完两成日报
2026年6月30日弃权规则让agent停手召回翻倍日报
2026年6月28日 ViQ让多模态训练提速20-70% 日报
2026年6月27日 ImageNet-FID与文生图能力负相关日报
2026年6月25日丢几张参考图就给新物体估姿态日报
2026年6月22日有状态embedding让260M压过8B 日报
2026年6月16日 code agent最强61.1%，VLA推理快6倍日报
2026年6月12日一条证据压成1个token，生成省3-10倍日报
2026年6月11日 V4把KV压到13.5%，视频记忆快10倍日报
2026年6月10日视频模型栽在组合编辑，MoE败在路由日报
2026年6月8日 dots.tts首包54ms，SWE自进化破50% 日报
2026年6月7日流式传递让多agent更准，1/6高斯更清晰日报
2026年6月4日 4B agent几千条轨迹追平闭源CUA 日报
2026年5月30日 Agent开始学会自己变强，也学会少用工具日报
2026年5月29日视觉模型开始重新设计自己的输出方式日报
2026年5月28日扩散模型把解码这道工序也吃了下来日报
2026年5月27日我们一直在用错的尺子量模型的『心里话』日报
2026年5月23日 Optimizer让容量缩放差2.3倍日报
2026年5月18日 2.6B开源世界模型撑1分钟720p 日报
2026年5月15日 δ-mem用8×8矩阵换长上下文日报
2026年5月14日 Flow-OPD把GenEval从63拉到92 日报
2026年5月13日几何冲突让持续微调可预判日报
2026年5月11日 Lorem Ipsum救回GRPO难题样本日报
2026年5月9日 10.6k轨迹SFT追平RL流水线日报
2026年5月8日 T²PO稳多轮RL+视频缓存提速6倍日报
2026年5月4日 ViT改用LM目标预训练替代CLIP 日报
2026年5月3日 FID当loss一步生成达0.72 日报
2026年5月2日 dLLM跨架构蒸馏到0.6B 日报
2026年4月25日压agent改分,4轮就开始作弊日报
2026年4月24日校准critic让推理涨18点日报
2026年4月21日 3B拒答追平R1，B矩阵是LoRA瓶颈日报
2026年4月20日 Qwen3.5-Omni扩到几百亿参数日报
2026年4月19日语料编译成目录，日志训LLM替身日报
2026年4月17日大模型更抗谣言却更易被噪声带跑日报
2026年4月13日 DMax让扩散LM并行效率提升近3倍日报
2026年4月12日打乱音视频练推理，6B模型超GPT-4o 日报
2026年4月11日微调即加速1.7倍，token崩的不是channel 日报
2026年4月10日 Entropy在骗你，隐式推理止于7步日报
2026年4月7日 Diffusion推理省54%算力不降质日报
2026年4月5日 400万游戏帧练渲染，技能内化胜过检索日报
2026年4月3日极简Agent打平MCP，代码推理边写边想日报
2026年4月2日配比成本降35倍，显眼词劫持推理38倍日报
2026年3月30日水印实现bit级溯源，扩散VLM进GUI定位日报
2026年3月29日 Mistral自研TTS、扩散LLM加速4.7倍日报
2026年3月26日扩散OCR解码快3.2倍，单流架构2秒出片日报
2026年3月25日 PDE替掉attention误差低2倍，局部RL省3/4算力日报
2026年3月24日 Seed1.8把Agent做进基座，语言训练让视觉退化日报
2026年3月23日 12B超GPT-4，蒸馏后学生反超教师日报
2026年3月20日 32B工业代码模型首发，战争验证推理真伪日报
2026年3月18日 70万对论文蒸馏品味，零空间暴露盲区日报
2026年3月17日专家推理结构做CoT，新类发现+13% 日报
2026年3月16日 1/4预算Agent反超4倍暴力采样日报
2026年3月15日文档Agent导航≈碰运气，预填充加速1.82× 日报
2026年3月14日编码答案而非问题，embedding涨9% 日报
2026年3月12日先写代码再画图，排版提升68% 日报
2026年3月11日 4步超100步基线，跳层省18%算力日报
2026年3月9日去掉CLIP的VLM更强，prefill加速28倍日报
2026年3月6日 code agent跨仓库不到45% 日报
2026年3月3日谱条件统一μP缩放，数据筛选也泄露隐私日报
2026年3月2日砍掉90%视觉token性能不掉日报
2026年3月1日 Latent推理靠的不是推理日报
2026年2月28日三模态从零训练，Agent RL稳定性破局日报
2026年2月27日 TTT就是线性注意力，Terminal Agent数据配方开源日报
2026年2月25日 token概率直接当reward，零样本达0.95相关性日报
2026年2月24日 74%的agent协调可能是白费的日报
2026年2月23日模型压缩的几何直觉：折叠比剪枝更优日报
2026年2月18日二进制token让图像生成快30倍，RL训练也在学会反思日报
2026年2月15日 RL训练数据不够用？把简单题拼成难题就行日报
2026年2月13日 AI数学研究agent解开真实开放问题，世界模型扎堆涌现日报
2026年2月7日百度发布万亿参数统一多模态模型ERNIE 5.0 日报
2026年2月6日只保留256个token就能逼近全量注意力性能日报
2026年2月5日 Kimi K2.5开源，Agent Swarm框架让多Agent并行延迟降4.5倍日报
2026年2月4日 SFT越强，RL反而越弱？日报
2026年2月3日预训练数据配比不用训练就能搜到最优解日报