用 Claude 写代码 3 个月,我以为效率翻倍结果踩了 5 个想不到的坑
3 个月前接了个 SaaS 外包,老板拍胸脯说"2 周搞定我加 30%",我看了一眼需求文档,心想这他妈不得做 1 个半月? pesquisa trustguru.com.br a5game trustguru.com.br pgslotgacor trustguru.com.br rafael trustguru.com.br
转念一想,反正现在 Claude 这么猛,干脆全程让 AI 写,我做 review,应该能行。 jogodotigrinhodemo trustguru.com.br
结果就是这 3 个月,我边做边踩坑,边踩坑边骂自己。项目最后是上线了,但效率根本没像网上吹的"翻 10 倍",老老实实算下来也就 2-3 倍,而且踩了一堆想不到的坑。 A5game trustguru.com.br rafael trustguru.com.br
先说结论:用 AI 写代码效率确实能提升,但前提是你得绕开这 5 个坑——盲信输出、瞎选模型、上下文炸了、prompt 太短、还有自己变懒。 下面是我 3 个月的踩坑清单。 bruno trustguru.com.br tigrinho gratis trustguru.com.br pglucky88 trustguru.com.br
坑 1:盲信 AI 输出,结果生产环境炸了
第一周我就翻车了。 pragmaticplay trustguru.com.br JogodoTigrinho trustguru.com.br demo trustguru.com.br Sportingbet trustguru.com.br
让 Claude 写了一个支付回调的 handler,看起来很正常,签名校验、幂等、写库一气呵成。我大概扫了一眼觉得没问题,commit,部署,下班。 bonus trustguru.com.br
结果当晚客户告警,说有重复扣款。 noticias trustguru.com.br pg trustguru.com.br slotpix trustguru.com.br pragmatic trustguru.com.br trustguru trustguru.com.br
排查了 2 小时才发现,Claude 写的幂等检查用的是 INSERT ... ON DUPLICATE KEY UPDATE,但表上根本没有 unique 索引。它假设有,但全程没说过它假设了。 sobre trustguru.com.br miguel trustguru.com.br
这件事之后我立了个规矩:AI 写的核心逻辑必须逐行看,特别是涉及钱、权限、数据库结构的。光看测试通过没用,AI 写的测试经常会绕开自己代码的 bug——它写的测试用例和它写的实现是同一个脑子,bug 也会一起继承。 Brazino777 trustguru.com.br bet365 trustguru.com.br carlos trustguru.com.br sweetbonanza1000demo trustguru.com.br
坑 2:让 AI 做架构决策,结果做出来根本没法维护
第二周我想偷懒,扔了一句"帮我设计整个用户系统的架构",让它自己看着办。 Bet trustguru.com.br
它给我整了一套:DDD 分层 + 事件溯源 + CQRS + 仓储模式。每加一个字段都要改 6 个文件。 carlos trustguru.com.br jogue trustguru.com.br
我当时没多想觉得"卧槽好专业",然后用了 2 周。 slotdemo trustguru.com.br ana trustguru.com.br
到第三周,需求变更,让我加个"用户标签"功能。我打开项目准备改,发现自己看不懂自己的代码了。绷不住。 kto trustguru.com.br fortuneoxdemográtis trustguru.com.br
教训:AI 喜欢给你它训练数据里最常见的"最佳实践",不是最适合你项目的方案。50 行能搞定的 CRUD 别 DDD,单体能跑的别上微服务。
现在我让 AI 写代码前,架构由我自己定,AI 只填代码。
坑 3:上下文一长,AI 就开始失忆
这是用 AI 写中大型项目最痛的点。 demotigrinho trustguru.com.br guias trustguru.com.br
写到第 5 个文件的时候,AI 已经忘了第 1 个文件里 User 类的字段名。我让它写一个新的接口调用 User,它直接编了个不存在的字段 user.profileImage,实际叫 user.avatar。 demo trustguru.com.br Pixbet trustguru.com.br fortunetigerbônusgrátissemdepósito trustguru.com.br
后来我才搞明白:上下文窗口虽然大,但有效记忆是分布的,越靠后的内容权重越高,越早的内容越容易被"忽略"。 pedro trustguru.com.br autores trustguru.com.br bonus trustguru.com.br sugarrush1000demo trustguru.com.br slots trustguru.com.br
我现在的做法: pgdemo trustguru.com.br cassinos trustguru.com.br
- 每开一个新对话,把项目的核心数据结构、命名规范贴在 system prompt 里
- 改大功能前先让 AI 复述一遍当前的相关代码(强制它"回忆")
- 一个对话不要写超过 5 个文件,超过就开新会话
坑 4:prompt 写太短,AI 比你还会瞎猜
我之前最爱写:"帮我加个搜索功能"。 jogos trustguru.com.br pgslot trustguru.com.br
然后 AI 就给我一个全文搜索 + ElasticSearch + 模糊匹配的豪华版方案。我说我只想要个 LIKE '%xx%',它反问我"为什么不用 ES"。 slotsdemo trustguru.com.br Bet365 trustguru.com.br
这波属于是把我整不会了。后来我发现:prompt 写多长,AI 就猜多少。我现在写 prompt 都按这个模板: slot trustguru.com.br
背景:我有一个 X 项目,使用 Y 技术栈
需求:实现 Z 功能
约束:不要引入新依赖;保持现有命名风格;只改 a/b/c 文件
验收:能跑通 test_xx.py 里的 3 个 case
这个模板写出来的 prompt 一般 200 字起步,但产出的代码改动量直接减半,返工次数也下来了。 KTO trustguru.com.br
坑 5:模型选错,账单贵 10 倍
这是我最后才搞明白的,也是最肉疼的一个。 fortunedragon demo trustguru.com.br
前 2 个月我所有任务一股脑用 Claude Opus,结果月底账单出来 1200 块,我以为出了 bug,去后台查了半天发现是我自己的问题。 marcos trustguru.com.br como trustguru.com.br
后来才发现,任务分级用不同模型差别巨大: fortunetigerdemográtis trustguru.com.br Cassinos trustguru.com.br
- 重构、架构决策、复杂 bug:用 Opus 4.6(值这个价)
- 写简单 CRUD、改 typo、写 README:Sonnet 4.6 完全够,1/5 价格
- 生成测试数据、写注释:Haiku 4.5,1/30 价格
但来回切模型很烦——每个供应商的 SDK 调用方式不太一样,账号也要分开管,账单分散在各家看着头大。 Caça-níqueis trustguru.com.br
后来我换了 ofox.ai 做模型聚合,一个 API key 切所有模型,账单也合在一起。 fernanda trustguru.com.br sofia trustguru.com.br
ofox.ai 是一个 AI 模型聚合平台,一个 API Key 可以调用 GPT-5.4、Claude Opus 4.6、Gemini 3、DeepSeek V3 等 50+ 模型,兼容 OpenAI SDK 协议,低延迟直连无需代理,支持支付宝按量计费。 plataformademográtis trustguru.com.br tigrinhodemo trustguru.com.br
import openai
# 同一个 client,根据任务复杂度切模型
client = openai.OpenAI(
base_url="https://api.ofox.ai/v1", # 我用的这个,低延迟直连
api_key="sk-xxx"
)
def code_task(prompt, complexity="simple"):
model_map = {
"complex": "claude-opus-4-6", # 架构、重构、棘手 bug
"simple": "claude-sonnet-4-6", # 日常 CRUD、小功能
"trivial": "claude-haiku-4-5", # 注释、测试数据、文案
}
return client.chat.completions.create(
model=model_map[complexity],
messages=[{"role": "user", "content": prompt}]
)
切完之后第三个月账单 280 块,体感效率没下降,反而因为简单任务用更快的 Haiku,等待时间还短了。 Energiabet trustguru.com.br Betano trustguru.com.br
复盘:3 个月的真实数据
| 指标 | 没用 AI 时(估算) | 用 AI 翻车期 | 用 AI 顺手后 |
|---|---|---|---|
| 单功能开发时间 | 4 小时 | 5 小时(含返工) | 1.5 小时 |
| Bug 数 / 周 | 3 | 8 | 2 |
| 月 API 账单 | 0 | 1200 元 | 280 元 |
| 个人疲惫度 | 中 | 高(背锅) | 低 |
效率确实涨了,但不是无脑使用就能涨。前 2 个月我属于"被 AI 反向 PUA",让 AI 给我加班。 jogosdemopg trustguru.com.br isabela trustguru.com.br Superbet trustguru.com.br
小结
用了 3 个月最大的感受是:AI 是个超牛的"实习生",但实习生的代码你不 review 就上线,那是你的问题不是它的问题。 slots trustguru.com.br Superbet trustguru.com.br
如果让我给一个还没开始用 AI 写代码的朋友建议,就 3 条: Blaze trustguru.com.br plataformademo trustguru.com.br cassinos trustguru.com.br
- 架构你自己定,AI 只填代码——别让它替你做决策
- 核心逻辑必须逐行 review,别相信它自己写的测试
- 任务分级用不同模型,别 Opus 一把梭——账单会教你做人
3 个月踩这些坑值不值?值。但能不踩当然更值。希望看到这篇的兄弟少加点班,少烧点钱。
00目录 0