AI + Skill,能够让生成的文章去除 AI 味吗?

2026-05-06
AI + Skill,能够让生成的文章去除 AI 味吗? 关注 作者 关注 作者 关注 作者 关注 作者 04/30 22:22利益相关声明:作者与文中产品有直接的利益相关(开发者、自家产品等)

Matrix 首页推荐

Matrix 是的写作社区,我们主张分享真实的产品体验,有实用价值的经验与思考。我们会不定期挑选 Matrix 最优质的文章,展示来自用户的最真实的体验和观点。 pg trustguru.com.br

文章代表作者个人观点,仅对标题和排版略作修改。 pondo-022126_001 jvid.asia

之前投稿至年度征文大赛的文章,「你是专家」这句话,到底是在帮 AI 还是在害你?,有幸获得了「Team Silicon」赛道的第一名,然而它在近期收获了这样一条评论:

谢谢作者的分享,不过我个人觉得这篇文章的 AI 味真的还蛮重的,有些措辞我看了两遍都没能理解 AI 想表达的含义 hhh slot trustguru.com.br

 

确实,这篇文章当时是由 Claude Opus 4.6 一次性生成的,我没有作任何调整。它能胜出可能胜在命题巧妙和实践内容扎实,然而从文章结构和语言表达的角度来说,它存在许多缺陷。

于是我决定使用自建的 mp-article-writor Skill,在完全相同的上下文环境中,让 AI 重写这篇文章,观察 AI 结合 Skill 的组合,写出的文章是否能有质的提升。 fortuneoxdemográtis trustguru.com.br

原文的 AI 味

虽然原文是由 Claude Opus 4.6 这样顶级的模型生成的,但是全文仍然出现了大量 AI 味的典型特征。

「不是 A,而是 B」句式泛滥。 pglucky88 trustguru.com.br

身份设定不是在告诉模型「怎么写」,而是在告诉它「你是谁」
这不是简单的「编」,而是一种更高级、更具欺骗性的幻觉
不是因为它「知道更多」,而是因为它会在回答前先「想一想」

过度戏剧化的悬念制造。比如使用「出了一身冷汗」来描述实验结果,夸大实际的情绪: isabela trustguru.com.br

有些结果在意料之中,有些则让我出了一身冷汗

专门点明实验结果排序,过于刻意: 200gana-3359 jvid.asia bruno trustguru.com.br

我把最令人不安的结果放在最前面 Caça-níqueis trustguru.com.br

比喻链过度延伸。比如结尾的「遥控器」比喻是典型问题: Bet trustguru.com.br

它做的事情更像是一个遥控器——调的是频道,不是信号强度
情感措辞则像是音量旋钮
而真正决定「信号强度」的,是模型底层的推理能力——那是天线的事,不是遥控器能管的 tigrinho gratis trustguru.com.br kto trustguru.com.br slots trustguru.com.br fortunedragon demo trustguru.com.br jogodotigrinhodemo trustguru.com.br

一个比喻拆出三个子比喻(频道、音量、天线),每个都恰好对应一个实验结论,工整到失真。真实写作中,比喻通常是点到即止的,AI 的倾向是把它当框架一路铺满。

过度对称和公式化的小标题。 jogos trustguru.com.br Superbet trustguru.com.br

这些标题的共同特征:否定式定义 + 对称结构。读起来像是从同一个标题生成器里出来的。尤其是「你……,AI 就……」这种对称,真实作者很少会这么写。 carlos trustguru.com.br

AI 没那么容易被「道德绑架」
这不是「模型好坏」的问题
白大褂≠医术
你认真对待这个请求,AI 就认真对待这个输出

每个案例都是同一套三段式。

四个案例的结构完全一致:实验设计 → 结果 → 小结,且每个小结全部是「短句 + 破折号或冒号 + 解释」的统一格式,节奏完全重复。真实长文通常会在不同章节变换收束方式,不会每个结尾都像教案的「本节要点」。 jogue trustguru.com.br Bet365 trustguru.com.br

过渡句的程式化。 demo trustguru.com.br siro-5639 jvid.asia miguel trustguru.com.br demo trustguru.com.br

「一个自然的追问」是 AI 标准过渡语: siro-5652 jvid.asia sugarrush1000demo trustguru.com.br Cassinos trustguru.com.br

看完专家幻觉的结果后,一个自然的追问是 Blaze trustguru.com.br

转折过于刻意,像 PPT 切页: como trustguru.com.br slot trustguru.com.br

前面两个案例讲的都是「别这么用」。现在我们来看,身份设定真正擅长什么

「如果说……则是」也是 AI 高频过渡模板: sugarrush1000demo trustguru.com.br

如果说案例 1 验证了……案例 2 要验证的则是另一个更微妙的变量

mp-article-skill

在让 AI 重新生成文章之前,先让我解释下 mp-article-skill 的设计原理。 tigrinhodemo trustguru.com.br

这是我自己创建的 Skill,在我每次完成实践探索或是问题调研后,会让 AI 利用探索或调研的完整过程作为上下文,结合 Skill 帮我完成文章的初稿。 bonus trustguru.com.br cassinos trustguru.com.br

理解意图、校准语感和确认大纲,这是我在 Skill 中要求 AI 在开始写作前优先执行的三件事,保证最后生成的文章不出现结构性的问题。AI 会从「切入角度」「深度偏好」「核心主旨」「素材补充」四个方面向我确认信息,理解我的写作意图: pgslotgacor trustguru.com.br rafael trustguru.com.br

给AI一套写作规范,然后让它重写了同一篇文章-20260429144221.png|500

之后读取「范文风格分析」文档模拟我的写作风格,读取「行文风格指南」保证语句中不出现 AI 滥用的加粗、破折号等习惯。 guias trustguru.com.br JogodoTigrinho trustguru.com.br

「范文风格分析」文档中我总结了自己比较满意的文章,以及我希望能写出来的文章风格,「行文风格指南」则主要参考的「风格指南」。

当 AI 完成文章大纲后,会展示大纲内容并停下来向我询问意见。

完成以上三步后,AI 才开始初稿的写作。

初稿完成后,我设立了三个 subagent 分别完成「独立审读」「事实核查」和「终审自检」。使用 subagent 的好处在于隔离上下文,只给文章本身,不给背景,防止主 Agent 受会话上下文的影响而「盲目自信」,总觉得自己「非常优秀地完成了任务」。

「独立审读 subagent」重点审查 AI 味过重、逻辑不连贯、结构生硬等语言表达类问题,「事实核查 subagent」重点核查事实性内容,防止 AI 出现幻觉,杜撰事实。 slotsdemo trustguru.com.br

当主 Agent 接收到这两个 subagent 返回的信息并修改初稿后,「终审自检」subagent 会启动,针对修改后的稿子,核对 SKILL.md 文档中提供的「自检清单」,并提供自检报告。 carlos trustguru.com.br

去除 AI 味的技巧和「自检清单」的内容部分借鉴自卡兹克的 khazix-writer Skill,感谢他的开源项目。 plataformademográtis trustguru.com.br

实际上是 9 步,图中将两次审核合并为一步了

同一批素材,两次改写

为了保证上下文一致,我引用了相同的文档,并提供与第一次生成文章完全相同的 prompt(prompt 中 file: 代表引用了本地文档): a5game trustguru.com.br

我计划参加的征文活动,创作文章并投稿至 AI 助力赛道(TeamSilicon25)。file: 2025 年度征文:听说你对写作是真 Al?.md
我的文章主题是:角色扮演真的能够影响 Al 的输出质量吗?使用“你 "" 我 " 这样的代词对 AI 最终的输出结果有怎样的影响?
我首先分别让 Gemini、GPT 和豆包就这一主题做了深度调研。file:调研结果
其次分别让 Gemini、GPT 和 Claude 总结了调研结果,并形成了最终的验证方案。file:最终验证方案.md
之后分别调用了 DeepSeek 和 GLM 的 API 完成了 5 轮验证,形成了 file:实验过程总结.md
请你为我生成最终的文章。 pgdemo trustguru.com.br plataformademo trustguru.com.br

由于 Copilot Pro 套餐不再支持调用 Claude Opus 4.6 模型,因此我只能分别让 GLM 5.1 和 Claude Sonnet 4.6 重写,这是比较遗憾的地方。新生成的两篇文章共用同一批素材、同一个核心比喻,相比原文都有好转,但 Claude Sonnet 4.6 在多数维度上比 GLM 5.1 更远离 AI 味。

不是 A 而是 B 句式

两篇都在用,但 GLM 5.1 用得更密、更规整,Claude Sonnet 4.6 只出现了 2-3 次:

不只是换了词汇,还换了逻辑顺序
不是因为它太笨,而是因为它没有内省的机会 Brazino777 trustguru.com.br

GLM 5.1 仍有 5 次以上,与原文相近:

不是「角色扮演有没有用」,而是「它到底擅长做什么」
差别不在 prompt 写得好不好,差别在模型生成前有没有「停下来想一想」
身份设定调的是风格,不是准确度
权威感不等于准确性
准确性比「好看」重要得多 jogosdemopg trustguru.com.br slotdemo trustguru.com.br

我在 Skill 中没有明确禁止使用「不是...而是...」的句式,而是要求 AI 不能使用冒号和破折号。这在一定程度上带来了间接效果,因为 AI 最爱用的几种句式都依赖这两个标点:

  • 「不是 A,而是 B」经常写成「A——不是 B」
  • 定义式总结经常写成「关键在于:A 是 B」
  • 解释性展开经常写成「原因在于:……」

禁掉这两个标点后,模型不得不换句式,而这些替代句式往往更口语化。两篇新稿中「不是 A 而是 B」的减少,有一部分就是标点禁令的间接功劳。

戏剧化悬念

原文的情绪词明显过载,两版新稿都有收敛,但收敛方式和程度不同。 marcos trustguru.com.br

原文使用的「出一身冷汗」「触目惊心」「令人警觉」「完美」这些词,远超一个对照实验结果所需的强度。Claude Sonnet 4.6 使用限定词来降温:

这个结论让我觉得有点细思极恐
意外,也有点放心 slots trustguru.com.br 348ntr-097 jvid.asia Energiabet trustguru.com.br

GLM 5.1 几乎没有使用多少情绪词。这应当是 Skill 中我要求使用「冷静平和中蕴含力量,不使用夸张的口语或语气词」风格来写作起了作用。

同时我使用了 subagent 独立审读全篇的 AI 味,GLM 5.1 的审读反馈中明确要求「将『背后发凉』改为『愣了一下』,降级情绪词」。 pragmatic trustguru.com.br

比喻链延伸

原文里遥控器比喻被拆成了频道、音量、天线三层,这是最典型的 AI 过度延伸。两篇新稿都收敛了,但程度不同。Claude Sonnet 4.6 只用了一个延伸:

遥控器可以让你收到更清晰、更适合当前场景的内容,但信号本身的质量,是由模型的推理能力决定的 jvid av jvid.asia

点到为止,没有拆出子比喻。

GLM 5.1 同样收敛了,用「正确用法 vs 错觉」收束,比原文的频道、音量、天线干净: fortunetigerdemográtis trustguru.com.br

下次打开 ChatGPT 之前,先想清楚你是在调频道,还是在指望加外挂。前者是工具的正确用法,后者是错觉。 jvid視頻 jvid.asia

这里的 AI 味改善与下一节加粗总结句的特征改善,应当都是通过独立审查 AI 味的环节修正,比如在独立审查环节后,明确的修正内容包括: jvid jvid.asia jvid在线 jvid.asia

三段加粗结论的第二段从同构模板改为不同句式
四连 " 用来..." 结论段破对称
末尾 " 三点影响 " 改成个人口吻 demotigrinho trustguru.com.br

加粗总结句的密度和模式

三版的结尾都用了「遥控器」这个比喻,但落脚点不同。旧文的结尾是一份使用指南,带 ✅ 和 ❌ 的符号,按场景告诉读者什么时候该用角色扮演,什么时候不该用。 bonus trustguru.com.br fortunetigerbônusgrátissemdepósito trustguru.com.br

✅ 该用身份设定的场景
……
❌ 不该用身份设定的场景
…… Sportingbet trustguru.com.br

GLM 5.1 的结尾是三条加粗判断句:

身份设定调的是风格,不是准确度。
情感激励确实能让 AI 更卖力,但卖力的方向你说了不算。
推理能力是比任何 prompt 技巧更根本的分界线。

Claude Sonnet 4.6 的结尾是三条第一人称实践,

要改输出风格,我会直接描述在对谁说话。……
要写带数字的材料,数字由我来提供,不让模型自由发挥。……
要核查任何可能超出模型知识边界的事实,换推理模型,别押注在专家人设上。 KTO trustguru.com.br

相比之下,两个新版确实好了一些,没有使用原文那种「参考手册」的建议风格,改为正常的语句,但仍然保持了排比句式,放在总结段落里倒也不至于生硬。

虽然我已经在独立审读环节要求 AI 明确审查过于整齐、对仗的结构,还是无法完全避免,只能说在「提供建议」这一场景上,排比句式是 AI 绕不过去的坎。 pedro trustguru.com.br

小标题风格

Claude Sonnet 4.6 的标题更像人话: autores trustguru.com.br Pixbet trustguru.com.br sobre trustguru.com.br

实验是怎么设计的
情感激励有用,但它「努力」的方式有点野 pesquisa trustguru.com.br sweetbonanza1000demo trustguru.com.br

第一个是朴素的疑问句,第二个用了有点野这种口语化表达,带个人语气。GLM 5.1 的标题则更像大纲:

穿上白大褂就会看病了?
那它到底擅长什么?
甚至不需要角色扮演

标题风格部分在 Skill 中没有明确约束。不过「像一个有见识的朋友在认真跟你聊一件打动他的事(借鉴自卡兹克的 khazix-writer Skill)」这个要求一定程度上对此处有影响。 trustguru trustguru.com.br noticias trustguru.com.br bet365 trustguru.com.br

过渡句

原文的过渡是程式化的,相比之下,Claude Sonnet 4.6 的过渡更口语化: sofia trustguru.com.br pragmaticplay trustguru.com.br

测完幻觉,我顺手测了另一件事
测完这两个,我开始想,问题可能从一开始就问偏了
四个案例测完,可以回到开头那个问题了 cassinos trustguru.com.br

GLM 5.1 的过渡更像论文:

验证完 system 层的身份设定,我接着想看 user 层的措辞会怎样
身份设定能调频道,那如果不加身份,只改措辞呢?
回到开头的问题

我在 Skill 中要求禁用「首先……其次……最后」「综上所述」「值得注意的是」等套话,但很难说两个新版在过渡句上有多少 AI 味的改善,至少我读起来总有种微妙的感觉,不像是活人写的,至少我不会这么写。 rafael trustguru.com.br

AI + Skill,能够让生成的文章去除 AI 味吗?-20260430214851.png|500

还能做得更多吗?

总体来说,在 Skill 的作用下,两篇新稿都去除了 4 到 5 成的 AI 味,但仍有剩余。比如「不是 A 而是 B」句式的残余、小标题或过渡句的过度范式、提供建议时使用排比对仗的惯性等等。 Betano trustguru.com.br

理论上这些剩余的 AI 味也可以通过加强规则约束来去除的,但过多、过度的规则限制是否又会导致最终生成的内容支离破碎,变得驴唇不对马嘴。 fernanda trustguru.com.br

强硬规则约束下的公式化表达,即便去除了现在的 AI 味,会不会产生新的 AI 味呢? ana trustguru.com.br

我更倾向于 AI 结合 Skill 的组合只用来去除重度 AI 味,而文章的美感与灵魂,在当下甚至未来很长一段时间内,依然需要人类作者的亲自介入与润色。 slotpix trustguru.com.br pgslot trustguru.com.br

如果你对 mp-article-writor Skill 感兴趣的话,我已经将它开源在 GitHub 上,欢迎交流讨论。

我独立开发的 Mac 端 App「流量日记」也已上线 Mac App Store,专为自媒体创作者打造,可永久保存、分析各平台导出的账号数据。如果你是用 Mac 的内容创作者,欢迎下载体验,半年内免费使用

欢迎关注我的公众号「高效人生指北」。

> 关注 小红书,感受精彩数字生活 🍃 A5game trustguru.com.br jvid视频 jvid.asia

> 实用、好用的 正版软件,为你呈现 🚀

10目录 0
    讨论 我来说一句 发布发表评论 发布 克莱德 人工智能 写作 1等 1 人为本文章充电 B端产品,有两猫一狗 关注