- 2026年5月29日 视觉模型开始重新设计自己的输出方式 日报
- 2026年5月27日 我们一直在用错的尺子量模型的『心里话』 日报
- 2026年5月25日 agent轨迹让30B打平235B 日报
- 2026年5月21日 双流MoE统一多模态,换装视频30倍提速 日报
- 2026年5月18日 2.6B开源世界模型撑1分钟720p 日报
- 2026年5月13日 几何冲突让持续微调可预判 日报
- 2026年5月1日 递归MAS省35%token,T2I整张重画 日报
- 2026年4月29日 去掉情绪词后probe准确率塌到5% 日报
- 2026年4月27日 完整trace让多agent归因准76% 日报
- 2026年4月25日 压agent改分,4轮就开始作弊 日报
- 2026年4月24日 校准critic让推理涨18点 日报
- 2026年4月22日 答案摆面前agent也视而不见 日报
- 2026年4月18日 腾讯开源3D世界生成、VLM偏科探针 日报
- 2026年4月17日 大模型更抗谣言却更易被噪声带跑 日报
- 2026年4月16日 VLM换规则就崩·DLM加速4倍 日报
- 2026年4月11日 微调即加速1.7倍,token崩的不是channel 日报
- 2026年4月8日 视频问答跑到2FPS,RLVR自带噪声过滤 日报
- 2026年4月7日 Diffusion推理省54%算力不降质 日报
- 2026年4月3日 极简Agent打平MCP,代码推理边写边想 日报
- 2026年3月27日 投机执行快3倍,不丢token反更快 日报
- 2026年3月13日 「想一想」能翻模型的记忆库 日报
- 2026年3月10日 12k样本赢金融SOTA,CUDA优化快35% 日报
- 2026年3月5日 Lottie动画直接生成,DPO自带防遗忘 日报
- 2026年2月28日 三模态从零训练,Agent RL稳定性破局 日报
- 2026年2月26日 Agent红队11种失败模式,step级路由降本700倍 日报
- 2026年2月24日 74%的agent协调可能是白费的 日报
- 2026年2月23日 模型压缩的几何直觉:折叠比剪枝更优 日报
- 2026年2月21日 Agent从80分涨到90分,失败模式没变 日报
- 2026年2月19日 频谱衰减让W4A4量化回升7%精度 日报
- 2026年2月18日 二进制token让图像生成快30倍,RL训练也在学会反思 日报
- 2026年2月17日 Web Agent在线RL突破70%,奖励模型换个方向思考就行 日报
- 2026年2月16日 医疗AI、科学Agent、机器人VLA:垂直领域正在成为AI的主战场 日报
- 2026年2月11日 Agent跑久了上下文会「腐烂」,但好的上下文管理策略能大幅挽回性能 日报
- 2026年2月10日 LinkedIn把LLM搜索排序做到了上线水平 日报
- 2026年2月8日 用扩散模型做投机解码,推理加速6倍 日报
- 2026年2月5日 Kimi K2.5开源,Agent Swarm框架让多Agent并行延迟降4.5倍 日报