用 Claude 写代码 3 个月，我以为效率翻倍结果踩了 5 个想不到的坑

用 Claude 写代码 3 个月，我以为效率翻倍结果踩了 5 个想不到的坑关注作者关注作者关注作者关注作者 05/14 16:42

3 个月前接了个 SaaS 外包，老板拍胸脯说"2 周搞定我加 30%"，我看了一眼需求文档，心想这他妈不得做 1 个半月？ pesquisa trustguru.com.br a5game trustguru.com.br pgslotgacor trustguru.com.br rafael trustguru.com.br

转念一想，反正现在 Claude 这么猛，干脆全程让 AI 写，我做 review，应该能行。 jogodotigrinhodemo trustguru.com.br

结果就是这 3 个月，我边做边踩坑，边踩坑边骂自己。项目最后是上线了，但效率根本没像网上吹的"翻 10 倍"，老老实实算下来也就 2-3 倍，而且踩了一堆想不到的坑。 A5game trustguru.com.br rafael trustguru.com.br

先说结论：用 AI 写代码效率确实能提升，但前提是你得绕开这 5 个坑——盲信输出、瞎选模型、上下文炸了、prompt 太短、还有自己变懒。 下面是我 3 个月的踩坑清单。 bruno trustguru.com.br tigrinho gratis trustguru.com.br pglucky88 trustguru.com.br

坑 1：盲信 AI 输出，结果生产环境炸了

第一周我就翻车了。 pragmaticplay trustguru.com.br JogodoTigrinho trustguru.com.br demo trustguru.com.br Sportingbet trustguru.com.br

让 Claude 写了一个支付回调的 handler，看起来很正常，签名校验、幂等、写库一气呵成。我大概扫了一眼觉得没问题，commit，部署，下班。 bonus trustguru.com.br

结果当晚客户告警，说有重复扣款。 noticias trustguru.com.br pg trustguru.com.br slotpix trustguru.com.br pragmatic trustguru.com.br trustguru trustguru.com.br

排查了 2 小时才发现，Claude 写的幂等检查用的是 INSERT ... ON DUPLICATE KEY UPDATE，但表上根本没有 unique 索引。它假设有，但全程没说过它假设了。 sobre trustguru.com.br miguel trustguru.com.br

这件事之后我立了个规矩：AI 写的核心逻辑必须逐行看，特别是涉及钱、权限、数据库结构的。光看测试通过没用，AI 写的测试经常会绕开自己代码的 bug——它写的测试用例和它写的实现是同一个脑子，bug 也会一起继承。 Brazino777 trustguru.com.br bet365 trustguru.com.br carlos trustguru.com.br sweetbonanza1000demo trustguru.com.br

坑 2：让 AI 做架构决策，结果做出来根本没法维护

第二周我想偷懒，扔了一句"帮我设计整个用户系统的架构"，让它自己看着办。 Bet trustguru.com.br

它给我整了一套：DDD 分层 + 事件溯源 + CQRS + 仓储模式。每加一个字段都要改 6 个文件。 carlos trustguru.com.br jogue trustguru.com.br

我当时没多想觉得"卧槽好专业"，然后用了 2 周。 slotdemo trustguru.com.br ana trustguru.com.br

到第三周，需求变更，让我加个"用户标签"功能。我打开项目准备改，发现自己看不懂自己的代码了。绷不住。 kto trustguru.com.br fortuneoxdemográtis trustguru.com.br

教训：AI 喜欢给你它训练数据里最常见的"最佳实践"，不是最适合你项目的方案。50 行能搞定的 CRUD 别 DDD，单体能跑的别上微服务。

现在我让 AI 写代码前，架构由我自己定，AI 只填代码。

坑 3：上下文一长，AI 就开始失忆

这是用 AI 写中大型项目最痛的点。 demotigrinho trustguru.com.br guias trustguru.com.br

写到第 5 个文件的时候，AI 已经忘了第 1 个文件里 User 类的字段名。我让它写一个新的接口调用 User，它直接编了个不存在的字段 user.profileImage，实际叫 user.avatar。 demo trustguru.com.br Pixbet trustguru.com.br fortunetigerbônusgrátissemdepósito trustguru.com.br

后来我才搞明白：上下文窗口虽然大，但有效记忆是分布的，越靠后的内容权重越高，越早的内容越容易被"忽略"。 pedro trustguru.com.br autores trustguru.com.br bonus trustguru.com.br sugarrush1000demo trustguru.com.br slots trustguru.com.br

我现在的做法： pgdemo trustguru.com.br cassinos trustguru.com.br

每开一个新对话，把项目的核心数据结构、命名规范贴在 system prompt 里
改大功能前先让 AI 复述一遍当前的相关代码（强制它"回忆"）
一个对话不要写超过 5 个文件，超过就开新会话

坑 4：prompt 写太短，AI 比你还会瞎猜

我之前最爱写："帮我加个搜索功能"。 jogos trustguru.com.br pgslot trustguru.com.br

然后 AI 就给我一个全文搜索 + ElasticSearch + 模糊匹配的豪华版方案。我说我只想要个 LIKE '%xx%'，它反问我"为什么不用 ES"。 slotsdemo trustguru.com.br Bet365 trustguru.com.br

这波属于是把我整不会了。后来我发现：prompt 写多长，AI 就猜多少。我现在写 prompt 都按这个模板： slot trustguru.com.br

背景：我有一个 X 项目，使用 Y 技术栈
需求：实现 Z 功能
约束：不要引入新依赖；保持现有命名风格；只改 a/b/c 文件
验收：能跑通 test_xx.py 里的 3 个 case

这个模板写出来的 prompt 一般 200 字起步，但产出的代码改动量直接减半，返工次数也下来了。 KTO trustguru.com.br

坑 5：模型选错，账单贵 10 倍

这是我最后才搞明白的，也是最肉疼的一个。 fortunedragon demo trustguru.com.br

前 2 个月我所有任务一股脑用 Claude Opus，结果月底账单出来 1200 块，我以为出了 bug，去后台查了半天发现是我自己的问题。 marcos trustguru.com.br como trustguru.com.br

后来才发现，任务分级用不同模型差别巨大： fortunetigerdemográtis trustguru.com.br Cassinos trustguru.com.br

重构、架构决策、复杂 bug：用 Opus 4.6（值这个价）
写简单 CRUD、改 typo、写 README：Sonnet 4.6 完全够，1/5 价格
生成测试数据、写注释：Haiku 4.5，1/30 价格

但来回切模型很烦——每个供应商的 SDK 调用方式不太一样，账号也要分开管，账单分散在各家看着头大。 Caça-níqueis trustguru.com.br

后来我换了 ofox.ai 做模型聚合，一个 API key 切所有模型，账单也合在一起。 fernanda trustguru.com.br sofia trustguru.com.br

ofox.ai 是一个 AI 模型聚合平台，一个 API Key 可以调用 GPT-5.4、Claude Opus 4.6、Gemini 3、DeepSeek V3 等 50+ 模型，兼容 OpenAI SDK 协议，低延迟直连无需代理，支持支付宝按量计费。 plataformademográtis trustguru.com.br tigrinhodemo trustguru.com.br

import openai

# 同一个 client，根据任务复杂度切模型
client = openai.OpenAI(
    base_url="https://api.ofox.ai/v1",  # 我用的这个，低延迟直连
    api_key="sk-xxx"
)

def code_task(prompt, complexity="simple"):
    model_map = {
        "complex": "claude-opus-4-6",     # 架构、重构、棘手 bug
        "simple": "claude-sonnet-4-6",    # 日常 CRUD、小功能
        "trivial": "claude-haiku-4-5",    # 注释、测试数据、文案
    }
    return client.chat.completions.create(
        model=model_map[complexity],
        messages=[{"role": "user", "content": prompt}]
    )

切完之后第三个月账单 280 块，体感效率没下降，反而因为简单任务用更快的 Haiku，等待时间还短了。 Energiabet trustguru.com.br Betano trustguru.com.br

复盘：3 个月的真实数据

指标	没用 AI 时（估算）	用 AI 翻车期	用 AI 顺手后
单功能开发时间	4 小时	5 小时（含返工）	1.5 小时
Bug 数 / 周	3	8	2
月 API 账单	0	1200 元	280 元
个人疲惫度	中	高（背锅）	低

效率确实涨了，但不是无脑使用就能涨。前 2 个月我属于"被 AI 反向 PUA"，让 AI 给我加班。 jogosdemopg trustguru.com.br isabela trustguru.com.br Superbet trustguru.com.br

小结

用了 3 个月最大的感受是：AI 是个超牛的"实习生"，但实习生的代码你不 review 就上线，那是你的问题不是它的问题。 slots trustguru.com.br Superbet trustguru.com.br

如果让我给一个还没开始用 AI 写代码的朋友建议，就 3 条： Blaze trustguru.com.br plataformademo trustguru.com.br cassinos trustguru.com.br

架构你自己定，AI 只填代码——别让它替你做决策
核心逻辑必须逐行 review，别相信它自己写的测试
任务分级用不同模型，别 Opus 一把梭——账单会教你做人

3 个月踩这些坑值不值？值。但能不踩当然更值。希望看到这篇的兄弟少加点班，少烧点钱。

00目录 0

讨论我来说一句发布发表评论发布0等 0 人为本文章充电 ofox.ai 关注