- 2026年5月30日 Agent开始学会自己变强,也学会少用工具 日报
- 2026年5月29日 视觉模型开始重新设计自己的输出方式 日报
- 2026年5月27日 我们一直在用错的尺子量模型的『心里话』 日报
- 2026年5月24日 DeltaNet拆双门,Maestro压GPT-5 日报
- 2026年5月22日 $15跑出一篇论文,医疗agent仅28% 日报
- 2026年5月19日 8%的token决定reasoning差距 日报
- 2026年5月18日 2.6B开源世界模型撑1分钟720p 日报
- 2026年5月17日 奥赛金牌打包成两步配方 日报
- 2026年5月16日 可读规则不该学进LLM权重 日报
- 2026年5月15日 δ-mem用8×8矩阵换长上下文 日报
- 2026年5月14日 Flow-OPD把GenEval从63拉到92 日报
- 2026年5月12日 Soohak让顶级模型只拿到30% 日报
- 2026年5月9日 10.6k轨迹SFT追平RL流水线 日报
- 2026年5月8日 T²PO稳多轮RL+视频缓存提速6倍 日报
- 2026年5月3日 FID当loss一步生成达0.72 日报
- 2026年5月2日 dLLM跨架构蒸馏到0.6B 日报
- 2026年5月1日 递归MAS省35%token,T2I整张重画 日报
- 2026年4月30日 RL给视频生成补3D一致性 日报
- 2026年4月27日 完整trace让多agent归因准76% 日报
- 2026年4月26日 10K数据训出4B agent,MoE扩容省32% 日报
- 2026年4月24日 校准critic让推理涨18点 日报
- 2026年4月23日 305M检索器指令遵循涨45% 日报
- 2026年4月22日 答案摆面前agent也视而不见 日报
- 2026年4月21日 3B拒答追平R1,B矩阵是LoRA瓶颈 日报
- 2026年4月20日 Qwen3.5-Omni扩到几百亿参数 日报
- 2026年4月19日 语料编译成目录,日志训LLM替身 日报
- 2026年4月18日 腾讯开源3D世界生成、VLM偏科探针 日报
- 2026年4月16日 VLM换规则就崩·DLM加速4倍 日报
- 2026年4月15日 PRM标注成本降两个数量级,dLLM幻觉错法不同 日报
- 2026年4月14日 SFT收敛≠全学会,注意力劫持破防94% 日报
- 2026年4月13日 DMax让扩散LM并行效率提升近3倍 日报
- 2026年4月12日 打乱音视频练推理,6B模型超GPT-4o 日报
- 2026年4月8日 视频问答跑到2FPS,RLVR自带噪声过滤 日报
- 2026年4月7日 Diffusion推理省54%算力不降质 日报
- 2026年4月5日 400万游戏帧练渲染,技能内化胜过检索 日报
- 2026年3月30日 水印实现bit级溯源,扩散VLM进GUI定位 日报
- 2026年3月28日 蒸馏砍掉模型的犹豫,OOD暴跌40% 日报
- 2026年3月26日 扩散OCR解码快3.2倍,单流架构2秒出片 日报
- 2026年3月23日 12B超GPT-4,蒸馏后学生反超教师 日报
- 2026年3月22日 3B参数奥赛三金,768维离散token生成可行 日报
- 2026年3月21日 3D仅需0.1%token,视频微调反伤空间理解 日报
- 2026年3月20日 32B工业代码模型首发,战争验证推理真伪 日报
- 2026年3月18日 70万对论文蒸馏品味,零空间暴露盲区 日报
- 2026年3月17日 专家推理结构做CoT,新类发现+13% 日报
- 2026年3月14日 编码答案而非问题,embedding涨9% 日报
- 2026年3月12日 先写代码再画图,排版提升68% 日报
- 2026年3月11日 4步超100步基线,跳层省18%算力 日报
- 2026年3月10日 12k样本赢金融SOTA,CUDA优化快35% 日报
- 2026年3月8日 「请简洁」砍半token,准确率反涨16分 日报
- 2026年3月7日 14B视频模型单卡19.5FPS 日报
- 2026年3月6日 code agent跨仓库不到45% 日报
- 2026年3月5日 Lottie动画直接生成,DPO自带防遗忘 日报
- 2026年3月3日 谱条件统一μP缩放,数据筛选也泄露隐私 日报
- 2026年3月2日 砍掉90%视觉token性能不掉 日报
- 2026年3月1日 Latent推理靠的不是推理 日报
- 2026年2月27日 TTT就是线性注意力,Terminal Agent数据配方开源 日报
- 2026年2月26日 Agent红队11种失败模式,step级路由降本700倍 日报
- 2026年2月25日 token概率直接当reward,零样本达0.95相关性 日报
- 2026年2月21日 Agent从80分涨到90分,失败模式没变 日报
- 2026年2月17日 Web Agent在线RL突破70%,奖励模型换个方向思考就行 日报
- 2026年2月16日 医疗AI、科学Agent、机器人VLA:垂直领域正在成为AI的主战场 日报
- 2026年2月15日 RL训练数据不够用?把简单题拼成难题就行 日报
- 2026年2月14日 11B参数跑出frontier级Agent智能,Coding Agent评测该换赛道了 日报
- 2026年2月11日 Agent跑久了上下文会「腐烂」,但好的上下文管理策略能大幅挽回性能 日报
- 2026年2月10日 LinkedIn把LLM搜索排序做到了上线水平 日报
- 2026年2月9日 医疗LLM不该只答题,应该像医生一样主动问诊 日报
- 2026年2月8日 用扩散模型做投机解码,推理加速6倍 日报
- 2026年2月7日 百度发布万亿参数统一多模态模型ERNIE 5.0 日报
- 2026年2月6日 只保留256个token就能逼近全量注意力性能 日报
- 2026年2月5日 Kimi K2.5开源,Agent Swarm框架让多Agent并行延迟降4.5倍 日报
- 2026年2月4日 SFT越强,RL反而越弱? 日报
- 2026年2月2日 RLVR训练数据不够用?从互联网文本里无限合成就行 日报
- 2026年2月1日 多模态深度研究不再是闭源大模型的专利 日报