- 2026年4月13日 DMax让扩散LM并行效率提升近3倍 日报
- 2026年4月11日 微调即加速1.7倍,token崩的不是channel 日报
- 2026年4月8日 视频问答跑到2FPS,RLVR自带噪声过滤 日报
- 2026年4月5日 400万游戏帧练渲染,技能内化胜过检索 日报
- 2026年4月3日 极简Agent打平MCP,代码推理边写边想 日报
- 2026年3月29日 Mistral自研TTS、扩散LLM加速4.7倍 日报
- 2026年3月27日 投机执行快3倍,不丢token反更快 日报
- 2026年3月25日 PDE替掉attention误差低2倍,局部RL省3/4算力 日报
- 2026年3月23日 12B超GPT-4,蒸馏后学生反超教师 日报
- 2026年3月22日 3B参数奥赛三金,768维离散token生成可行 日报
- 2026年3月21日 3D仅需0.1%token,视频微调反伤空间理解 日报
- 2026年3月20日 32B工业代码模型首发,战争验证推理真伪 日报
- 2026年3月19日 开源搜索Agent逆袭,Agent Skills神话破灭 日报
- 2026年3月15日 文档Agent导航≈碰运气,预填充加速1.82× 日报
- 2026年3月13日 「想一想」能翻模型的记忆库 日报
- 2026年3月12日 先写代码再画图,排版提升68% 日报
- 2026年3月11日 4步超100步基线,跳层省18%算力 日报
- 2026年3月9日 去掉CLIP的VLM更强,prefill加速28倍 日报
- 2026年3月7日 14B视频模型单卡19.5FPS 日报
- 2026年3月6日 code agent跨仓库不到45% 日报
- 2026年2月21日 Agent从80分涨到90分,失败模式没变 日报
- 2026年2月20日 示例图对替代prompt,Agent筛信息暗藏偏心 日报
- 2026年2月19日 频谱衰减让W4A4量化回升7%精度 日报
- 2026年2月12日 文本扩散模型不再只是概念验证 日报
- 2026年2月11日 Agent跑久了上下文会「腐烂」,但好的上下文管理策略能大幅挽回性能 日报
- 2026年2月8日 用扩散模型做投机解码,推理加速6倍 日报
- 2026年2月6日 只保留256个token就能逼近全量注意力性能 日报