模型架构 | AI论文简报

2026年7月13日血统推理最强模型仅对27% 日报
2026年7月7日潜空间打分把视频生成压到1-4步日报
2026年6月30日弃权规则让agent停手召回翻倍日报
2026年6月28日 ViQ让多模态训练提速20-70% 日报
2026年6月26日末层偷改答案，早层解码反更准日报
2026年6月25日丢几张参考图就给新物体估姿态日报
2026年6月21日榜单分预测不了部署，机械臂自迭代99% 日报
2026年6月19日两次循环让SWE-bench从43涨到64 日报
2026年6月13日 Arbor科研增益2.5倍，50环境抵300个日报
2026年6月12日一条证据压成1个token，生成省3-10倍日报
2026年6月10日视频模型栽在组合编辑，MoE败在路由日报
2026年5月30日 Agent开始学会自己变强，也学会少用工具日报
2026年5月25日 agent轨迹让30B打平235B 日报
2026年5月22日 $15跑出一篇论文,医疗agent仅28% 日报
2026年5月20日 LRM早停换判据省26%token 日报
2026年5月19日 8%的token决定reasoning差距日报
2026年5月18日 2.6B开源世界模型撑1分钟720p 日报
2026年5月17日奥赛金牌打包成两步配方日报
2026年5月16日可读规则不该学进LLM权重日报
2026年5月15日 δ-mem用8×8矩阵换长上下文日报
2026年5月13日几何冲突让持续微调可预判日报
2026年5月12日 Soohak让顶级模型只拿到30% 日报
2026年5月11日 Lorem Ipsum救回GRPO难题样本日报
2026年4月25日压agent改分,4轮就开始作弊日报
2026年4月22日答案摆面前agent也视而不见日报
2026年4月19日语料编译成目录，日志训LLM替身日报
2026年4月14日 SFT收敛≠全学会，注意力劫持破防94% 日报
2026年4月11日微调即加速1.7倍，token崩的不是channel 日报
2026年4月10日 Entropy在骗你，隐式推理止于7步日报
2026年4月8日视频问答跑到2FPS，RLVR自带噪声过滤日报
2026年4月6日 32B硬件代码开源进第一梯队，Agent难题仅23% 日报
2026年4月3日极简Agent打平MCP，代码推理边写边想日报
2026年4月2日配比成本降35倍，显眼词劫持推理38倍日报
2026年3月29日 Mistral自研TTS、扩散LLM加速4.7倍日报
2026年3月27日投机执行快3倍，不丢token反更快日报
2026年3月25日 PDE替掉attention误差低2倍，局部RL省3/4算力日报
2026年3月24日 Seed1.8把Agent做进基座，语言训练让视觉退化日报
2026年3月21日 3D仅需0.1%token，视频微调反伤空间理解日报
2026年3月20日 32B工业代码模型首发，战争验证推理真伪日报
2026年3月19日开源搜索Agent逆袭，Agent Skills神话破灭日报
2026年3月17日专家推理结构做CoT，新类发现+13% 日报
2026年3月12日先写代码再画图，排版提升68% 日报
2026年3月11日 4步超100步基线，跳层省18%算力日报
2026年3月8日「请简洁」砍半token，准确率反涨16分日报
2026年3月6日 code agent跨仓库不到45% 日报
2026年3月5日 Lottie动画直接生成，DPO自带防遗忘日报
2026年3月4日 9K样本逼近R1，RL提升大半归SFT 日报
2026年3月3日谱条件统一μP缩放，数据筛选也泄露隐私日报
2026年2月28日三模态从零训练，Agent RL稳定性破局日报
2026年2月18日二进制token让图像生成快30倍，RL训练也在学会反思日报
2026年2月16日医疗AI、科学Agent、机器人VLA：垂直领域正在成为AI的主战场日报
2026年2月15日 RL训练数据不够用？把简单题拼成难题就行日报
2026年2月14日 11B参数跑出frontier级Agent智能，Coding Agent评测该换赛道了日报
2026年2月12日文本扩散模型不再只是概念验证日报
2026年2月9日医疗LLM不该只答题，应该像医生一样主动问诊日报
2026年2月4日 SFT越强，RL反而越弱？日报
2026年2月2日 RLVR训练数据不够用？从互联网文本里无限合成就行日报
2026年2月1日多模态深度研究不再是闭源大模型的专利日报