别迷信1M - GrapeLink

别迷信1M 关注作者关注作者关注作者关注作者昨天 18:23

这次发生了什么

2026 年 4 月 26 日，Yoav Goldberg 在 X 上做了一个很直观的粗算：如果按 40 层、每层 4000 维、每维 2 bytes 估算，单个 token 相关的推理内存会到约 640k，1M token 则会到约 640GB。基于这个量级，他直接提出疑问：长上下文推理在内存上到底是怎么成立的。 slot trustguru.com.br Caça-níqueis trustguru.com.br slots trustguru.com.br pragmaticplay trustguru.com.br pgslot trustguru.com.br rafael trustguru.com.br Pixbet trustguru.com.br

同一天，Chelsea Finn 预告自己将在 ICLR 的 MemAgents workshop 分享一个题为“long-term memory for long-term autonomy”的报告。注意她强调的是“长期记忆”和“长期自治”，不是更长的聊天窗口。 tigrinhodemo trustguru.com.br sobre trustguru.com.br jogodotigrinhodemo trustguru.com.br ana trustguru.com.br jogos trustguru.com.br

Yoav 的粗算价值，不在于它已经证明了什么工程结论，而在于它把宣传数字重新拉回了底层账本。哪怕这个估算没有覆盖所有优化手段，仅从量级直觉看，也足以说明长上下文背后不是“白来的能力”，而是伴随明显系统代价。 bet365 trustguru.com.br carlos trustguru.com.br Bet365 trustguru.com.br Sportingbet trustguru.com.br sweetbonanza1000demo trustguru.com.br

真正重要的判断是：长上下文更像“大工作台”，长期记忆才更像“档案系统”。前者解决的是单次任务里可见信息不够的问题，后者解决的是系统如何在长周期内保留、更新、检索和遗忘信息。 guias trustguru.com.br jvid在线 jvid.asia autores trustguru.com.br trustguru trustguru.com.br bruno trustguru.com.br Cassinos trustguru.com.br a5game trustguru.com.br

这也是为什么很多 Agent 场景里，只堆大窗口并不能自动换来长期自治。一个能长期工作的系统，往往还需要明确的 memory architecture，包括什么该持久化、什么该摘要、什么该丢弃、什么时候检索旧信息，以及如何避免旧记忆污染当前决策。 como trustguru.com.br fortunedragon demo trustguru.com.br carlos trustguru.com.br Superbet trustguru.com.br plataformademográtis trustguru.com.br Betano trustguru.com.br bonus trustguru.com.br pgdemo trustguru.com.br pglucky88 trustguru.com.br Bet trustguru.com.br

1M 上下文当然有价值，但它真正提示行业的，不是“记忆问题已经解决”，而是大家开始更频繁地碰到底层账本。对从业者来说，下一步更该关注的不是窗口数字本身，而是系统究竟如何记、如何忘、如何在成本可控的前提下长期工作。 #长上下文 #长期记忆 #AIAgent #LLM #Autonomy fortuneoxdemográtis trustguru.com.br jogosdemopg trustguru.com.br Blaze trustguru.com.br jvid視頻 jvid.asia pondo-022126_001 jvid.asia demo trustguru.com.br Bet trustguru.com.br

00目录 0

讨论我来说一句发布发表评论发布0等 0 人为本文章充电关注AI创业与技术应用关注