- 2026年4月15日 PRM标注成本降两个数量级,dLLM幻觉错法不同 日报
- 2026年4月12日 打乱音视频练推理,6B模型超GPT-4o 日报
- 2026年4月10日 Entropy在骗你,隐式推理止于7步 日报
- 2026年4月9日 单GPU训120B·视频评测四成靠猜 日报
- 2026年4月6日 32B硬件代码开源进第一梯队,Agent难题仅23% 日报
- 2026年4月4日 单神经元记住实体,套路复用提效19% 日报
- 2026年4月3日 极简Agent打平MCP,代码推理边写边想 日报
- 2026年4月2日 配比成本降35倍,显眼词劫持推理38倍 日报
- 2026年3月29日 Mistral自研TTS、扩散LLM加速4.7倍 日报
- 2026年3月25日 PDE替掉attention误差低2倍,局部RL省3/4算力 日报
- 2026年3月24日 Seed1.8把Agent做进基座,语言训练让视觉退化 日报
- 2026年3月23日 12B超GPT-4,蒸馏后学生反超教师 日报
- 2026年3月19日 开源搜索Agent逆袭,Agent Skills神话破灭 日报
- 2026年3月18日 70万对论文蒸馏品味,零空间暴露盲区 日报
- 2026年3月17日 专家推理结构做CoT,新类发现+13% 日报
- 2026年3月14日 编码答案而非问题,embedding涨9% 日报
- 2026年3月11日 4步超100步基线,跳层省18%算力 日报
- 2026年3月10日 12k样本赢金融SOTA,CUDA优化快35% 日报
- 2026年3月9日 去掉CLIP的VLM更强,prefill加速28倍 日报
- 2026年3月3日 谱条件统一μP缩放,数据筛选也泄露隐私 日报
- 2026年3月1日 Latent推理靠的不是推理 日报
- 2026年2月28日 三模态从零训练,Agent RL稳定性破局 日报
- 2026年2月27日 TTT就是线性注意力,Terminal Agent数据配方开源 日报
- 2026年2月24日 74%的agent协调可能是白费的 日报
- 2026年2月23日 模型压缩的几何直觉:折叠比剪枝更优 日报
- 2026年2月20日 示例图对替代prompt,Agent筛信息暗藏偏心 日报
- 2026年2月19日 频谱衰减让W4A4量化回升7%精度 日报
- 2026年2月18日 二进制token让图像生成快30倍,RL训练也在学会反思 日报
- 2026年2月13日 AI数学研究agent解开真实开放问题,世界模型扎堆涌现 日报
- 2026年2月8日 用扩散模型做投机解码,推理加速6倍 日报
- 2026年2月7日 百度发布万亿参数统一多模态模型ERNIE 5.0 日报
- 2026年2月6日 只保留256个token就能逼近全量注意力性能 日报