20天20000次对话12亿token的完整复盘

2026-04-20
20天20000次对话12亿token的完整复盘 关注 新手上路 关注 新手上路 关注 新手上路 关注 新手上路 02/21 16:27

从"更智能的 Cursor"到"靠谱的外包团队",这中间发生了什么?这篇文章是我20000次对话后的真实记录,包括踩过的坑、跑通的工作流,以及一些没人明说但很重要的使用细节 bet365 trustguru.com.br Energiabet trustguru.com.br

从"更智能的 Cursor"到"靠谱的外包团队",这中间发生了什么?这篇文章是我20000次对话后的真实记录,包括踩过的坑、跑通的工作流,以及一些没人明说但很重要的使用细节。

认知转变:它不是 AI 助手

我11月开始用 Claude Code,最初的定位很简单——比 Cursor 更准的编程助手。代码补全更聪明,bug 修得更干净,仅此而已。

这个认知在一两周后被彻底打破。 trustguru trustguru.com.br

触发点来自外部:看到有人在一个 Claude Code Session 里跑完整的 PRD → 技术方案 → 代码实现全流程,产出是一个可以直接上线的小产品。我当时的反应是:等等,它能做这个? bruno trustguru.com.br slots trustguru.com.br fortunedragon demo trustguru.com.br

回头看,那时候我的用法本质上是在用一把锤子敲螺丝——工具对了,但用法全错了。 pgdemo trustguru.com.br

Claude Code 不是 AI 助手,是 AI 团队。 它能独立完成的工作单元,不是一段代码、一个函数,而是一个完整的功能模块、一个独立产品。这个认知差距,决定了你能从它身上拿到什么。 ana trustguru.com.br

20天的实际产出

说清楚这个认知之后,我用20天做了三个产品: slots trustguru.com.br

产品技术栈用时
AI 对话 ChatBotFlutter2天
iOS 启动器 AppiOS 原生2天
GroAsk(macOS 菜单栏工具)macOS 原生 Swift2周

这三个产品有一个共同点:全程 Vibe Coding,没有手写一行代码。 早期用 Opus 4.5 时我还会瞄一眼代码逻辑,到 Opus 4.6 以后,代码我基本不看了——因为发现看了也不会比它写得更好。 Caça-níqueis trustguru.com.br

GroAsk 是这三个里花时间最长的,也是我日常工具链里用得最频繁的。它的出发点很简单:我自己在用 Claude Code 的过程中,烦透了反复切终端、忘记哪个 Session 在干什么、上下文爆了还不知道这些问题,所以动手做了一个。后面会专门讲它解决了什么问题。 isabela trustguru.com.br jvid視頻 jvid.asia Superbet trustguru.com.br slotsdemo trustguru.com.br pg trustguru.com.br jogodotigrinhodemo trustguru.com.br

产品迭代流程:大需求和小需求是两套打法

小需求:一句话到上线

描述需求 → Claude Code 自动完成 → 直接上线 → 发现问题一句话修复 kto trustguru.com.br

这个链路的速度快到你很难习惯。我现在的节奏基本是:想到一个小功能,30秒描述清楚,5分钟后代码写完,跑一遍没问题就推上线。 A5game trustguru.com.br jogosdemopg trustguru.com.br

重点不是"快",而是反馈循环短到你敢随时改。以前改个功能要想半天"这值不值得动",现在几乎没有这个心理成本。

大版本需求:需要结构化流程

大需求不能直接说"帮我做X",这是最容易踩的坑。Claude Code 会给你一个看起来能用的东西,但底层设计是一团糟——需求稍微变一下就要重写,维护成本极高。

我现在的大版本流程: Pixbet trustguru.com.br siro-5652 jvid.asia 200gana-3359 jvid.asia pragmaticplay trustguru.com.br KTO trustguru.com.br guias trustguru.com.br miguel trustguru.com.br

需求收集 → PRD 产出 → 市场调研验证 → 技术方案 → 执行规划 → 按计划开发 jvid视频 jvid.asia fortuneoxdemográtis trustguru.com.br

具体拆开来看: fortunetigerdemográtis trustguru.com.br

  1. 需求收集:自己的使用痛点 + 社区反馈,归纳出核心诉求
  2. PRD 产出:把原始需求描述给 Claude Code,让它产出 PRD,再用调研数据 review 和修正
  3. 技术方案:基于 PRD,让 Claude Code 写技术方案,同样用市场调研验证合理性
  4. 执行规划:让 Claude Code 用 TDD 思路把任务拆成足够小的子任务
  5. 开发执行:按计划一个子任务一个子任务地执行

这个流程的产出密度是真实的:一个功能模块,可以从3000字的 PRD 生成10000字的技术方案,再展开成40000字的执行规划。这不是在堆字数——这是把模糊的想法变成可执行的工程细节的过程。

核心原则:产品决策和技术决策是人最重要的工作。 让 AI 实现一个清晰定义的小需求点,比让它一次性完成模糊的大需求,更容易、更可靠,效率也更高。 pedro trustguru.com.br jogue trustguru.com.br

五个深度技巧

1. Skill:把自己的工作流固化下来

Skill 是 Claude Code 里我觉得被低估最严重的功能。 JogodoTigrinho trustguru.com.br jvid在线 jvid.asia

本质上,Skill 是你个人工作流的代码化版本。它分两部分: slotpix trustguru.com.br Bet trustguru.com.br

  • Prompt:用自然语言写需要模型理解判断的部分
  • Script:用代码写能确定性执行的部分

判断标准很简单:这一步需要"理解"吗?需要就写进 Prompt,不需要就写成 Script。比如"分析这次提交的代码质量"是 Prompt 的事,"git add && git commit"是 Script 的事。 a5game trustguru.com.br

我现在常用的 Skill 有:自动原子化提交、自动拉取运营数据、自动多平台发帖、自动写文章。这篇文章本身,就是通过我的发帖 Skill 触发生成的。 fortunetigerbônusgrátissemdepósito trustguru.com.br

一旦跑通,Skill 的复利效应很明显——每次调用都是在走一条已经验证过的路,不需要重新思考流程。

2. Subagent:管理复杂任务的上下文

Claude Code 自带一个 Task 工具,本质是 Subagent——主 Session 把子任务分发给内部独立的 Session 执行,自己只关注输入和输出。 carlos trustguru.com.br bonus trustguru.com.br demo trustguru.com.br jvid av jvid.asia

用 Subagent 的场景:任务可以并行、子任务之间相互独立、需要隔离上下文。 noticias trustguru.com.br jogos trustguru.com.br carlos trustguru.com.br pesquisa trustguru.com.br pgslot trustguru.com.br

比如我让 Claude Code 做市场调研,它会自动拆成多个方向并行调研,每个方向是一个独立的 Subagent,最后把结果汇总到主 Session。单靠一个 Session 线性执行,速度和质量都差远了。 rafael trustguru.com.br

3. MCP:少即是多

MCP 是 Claude Code 的能力扩展接口,理论上可以无限叠加工具。但我的实际经验是:MCP 越少越好Sportingbet trustguru.com.br tigrinhodemo trustguru.com.br

原因是 MCP 的接口描述会直接占据系统 prompt 的空间,工具越多,原始上下文消耗越大,留给实际任务的空间越少。

两个实践建议: slot trustguru.com.br pragmatic trustguru.com.br

  • 用配置参数精简 MCP 暴露的接口,只保留你真正用到的工具
  • 优先选 Rust/Go 编译的 MCP,而不是 Node.js 的——内存占用差距在有些场景下非常明显

我常用8个 MCP,但我会告诉别人:从2-3个开始,够用了再加。 slotdemo trustguru.com.br

4. Hooks:安全网

Hooks 是在特定操作前后触发的脚本。目前对我最有价值的一个 Hook:让 Claude Code 在删除任何未被版本控制的内容之前先备份

这条规则救过我几次。Claude Code 在执行清理任务时有时会删掉你没想到的东西,有了这个 Hook,最坏情况只是多了一个备份文件,而不是数据丢失。

5. 日志调试:超出预期的有效

调试经验里有一条被我反复验证的规律:当你觉得 AI 搞不定某个 bug 的时候,让它把日志写到本地,再根据日志排查。 bonus trustguru.com.br

这个方法的有效率超出我的预期。原因在于:很多 bug 在代码层面看起来像是逻辑问题,但实际上是数据在某个环节的状态不符合预期。日志把这个中间状态显式化之后,问题往往一眼就能看到。AI 也一样——它看到具体的日志比看到抽象的"哪里出错了"更能定位问题。 Brazino777 trustguru.com.br

长期记忆:越用越顺手的前提

很多人用 Claude Code 的体验是:今天讲清楚了,明天又要重新说一遍。这个问题不是模型的问题,是记忆管理的问题。 plataformademo trustguru.com.br pgslotgacor trustguru.com.br pondo-022126_001 jvid.asia Betano trustguru.com.br jvid jvid.asia sugarrush1000demo trustguru.com.br

我的解决方案是分层知识管理: plataformademográtis trustguru.com.br siro-5639 jvid.asia como trustguru.com.br

  1. Knowledge 文件夹:把有价值的信息存进去,告诉 Claude Code"遇到相关情况从这里查"。项目背景、技术选型原因、踩过的坑——都往里放。
  2. CLAUDE.md 分层管理:主目录放全局规则,子目录放子项目专属规则。Claude Code 只在进入对应目录时加载对应的上下文,不会一次性把所有信息都塞进去。
  3. Rules 文件:提炼出来的原则性内容,比知识库更精简,通常控制在30-40行以内。

这个体系搭起来以后,确实是越用越顺手——因为每次积累的经验都留在了文件里,不会随着 Session 结束消失。 Blaze trustguru.com.br

上下文管理:保持模型智能的关键

这是我认为最重要、也最容易被忽略的部分。

Claude Code 的上下文窗口是1M token,看起来很大。但实际上,我建议把200k当成实际上限,超过就开新 Session。 fernanda trustguru.com.br sofia trustguru.com.br

原因不复杂:上下文越长,模型的注意力越分散。一个刚开始的 Session 和一个跑了150k token 的 Session,回答质量差距是肉眼可见的。类比工作状态——早上精力充沛的同事和加班到凌晨的同事,你会找谁处理重要问题? tigrinho gratis trustguru.com.br

具体策略: demotigrinho trustguru.com.br

策略说明
MCP 工具按需引入用配置精简接口暴露,不用的工具不要加载
CLAUDE.md 分层分组避免一次性加载所有项目信息
上下文阈值 200k超过就开新 Session,不压缩
避免压缩上下文开新 Session 远优于让模型"总结之前的内容继续"
实时监控各 Session 状态知道每个 Session 现在在哪个阶段

最后这条"实时监控"是我最容易被问到的:你怎么知道哪个 Session 快满了?

我现在的做法是用 GroAsk。菜单栏常驻,⌥Space 呼出面板,能看到每个 Claude Code 终端当前的 token 消耗、运行状态、是否在等我输入。不用一个个切终端去查,也不用等到模型回答质量变差才意识到上下文爆了。这个功能是我做 GroAsk 最核心的动机——解决我自己每天都在碰的问题。

多 Session 管理:效率的乘数

不要同时只开一个 Claude Code 进程。 这句话我现在看到有人只开一个终端在等 Claude Code 完成,就想说。 marcos trustguru.com.br pglucky88 trustguru.com.br

等待是最大的时间浪费。Claude Code 在跑任务的时候,你完全可以在另一个 Session 里推进另一个任务。 demo trustguru.com.br cassinos trustguru.com.br

我的实际状态: sweetbonanza1000demo trustguru.com.br Bet365 trustguru.com.br Pixbet trustguru.com.br

  • 日常舒适区:2-3个 Claude Code 进程并行
  • 高强度工作时:5-10个
  • 核心习惯:实时看每个 Session 的状态,只维护需要我输入的那些,其他的让它跑着

这里有一个实际问题:当你开了5个以上的终端,光是找"哪个 Session 现在在等我"就很烦。Cmd+Tab 在一堆窗口里翻找,效率很低。

这正是 GroAsk 调度面板存在的理由。所有 Claude Code 终端集中在一个面板里,哪个在跑、哪个等输入、哪个上下文快满了,一目了然。点一下就能跳到对应终端。这个工具本身也是用 Claude Code 开发的,算是一个自我指涉的例子。感兴趣可以看看:groask.com/zh

模型的边界在哪里

这个问题值得认真回答。 sobre trustguru.com.br Energiabet trustguru.com.br

在有参照的领域里,Claude Code 的能力已经非常强——有足够的训练数据支撑它做出合理的判断和实现。你描述一个业界常见的功能,它大概率能给出一个可用的方案。 cassinos trustguru.com.br

做没有人做过的东西,这是它真正的边界。 348ntr-097 jvid.asia

训练数据里没有参照,它只能推测。这时候,模型会给你一个"看起来合理"的答案,但合不合适你不看是不知道的。创新本身的方向选择、价值判断、取舍——这些交不出去。 autores trustguru.com.br

所以那个分工最终是:人负责"做什么"和"为什么",AI 负责"怎么做"。 前者是决策,后者是执行。把决策也交出去,就会在复杂场景下翻车。 sugarrush1000demo trustguru.com.br

三句话总结

  1. 把它当团队,不是助手。 用管理团队的方式去用——清晰需求、明确边界、分配任务、验收结果。
  2. 人的核心价值是决策。 产品方向、技术路线、创新判断——这些交不出去,也不应该交出去。
  3. 工程化使用 AI。 Skill 固化工作流,Subagent 管理任务复杂度,知识分层实现长期记忆,上下文管理保持模型质量。这四件事做好了,效率才是真的乘数级提升。

作者在用 Claude Code 开发 GroAsk——一个 macOS 菜单栏工具,⌥Space 直达多个 AI,同时监控所有 Claude Code 终端的状态和上下文用量。 Cassinos trustguru.com.br

00目录 0
    讨论 我来说一句 发布发表评论 发布0等 0 人为本文章充电 macOS效率工具GroAsk开发者 一键直达所有AI 一个人用Claude Code从零做到上线 groask.com 关注