刚上手AI，职场人就踩了幻觉的坑

摘要：赶在交稿日期截止的编辑周子衡看来，那段话“逻辑通顺、语气专业、甚至连百分比都标得刚刚好”，结果却是凭空捏造；电商客服王萌的团队，因为AI生成了一段“模板式话术”，误发了不适用的退货规则，客户拿着截图投诉，平台只能赔钱认栽；职业讲师蔡倩第一次用AI起草课件，就在

作者：高见

“这段数据你查过吗？”

“没有，是AI写的，看起来没问题。”

赶在交稿日期截止的编辑周子衡看来，那段话“逻辑通顺、语气专业、甚至连百分比都标得刚刚好”，结果却是凭空捏造；电商客服王萌的团队，因为AI生成了一段“模板式话术”，误发了不适用的退货规则，客户拿着截图投诉，平台只能赔钱认栽；职业讲师蔡倩第一次用AI起草课件，就在直播中被学员问住，才发现那组“情绪价值”数据，AI“编得像真的”；而一位产品经理更早意识到问题，他自己就做AI产品，但他制定了团队使用准则：AI生成的段落，不能直接决定任何事情。

这不是某种“AI作恶”的故事。这是一组关于AI幻觉的职场众生相。

豆包、文心一言、DeepSeek、元宝……这些国产AI工具，正在大规模进入职场内容流里。我们以为它们是工具，其实它们更像是一种“说得太像真的语气”，让每个使用者都可能在不经意间交出判断力。

在这场由幻觉构成的信任测试中，没有绝对安全的人。

有人把AI当思路发散，也有人开始给AI的每一句话贴标签；有人被它坑过一次，就再也不让它写结论；有人在全权托付之后，才意识到——AI不会替你背锅，幻觉也不会标红。

坤舆商业观察记录了几个用AI写东西的人。他们不是专家，不是极客，只是每一个普通工作日里，和你我一样，把“复制”“粘贴”“交稿”按下去的人。

他们遇见了AI，也开始重新理解什么叫“自己负责”。

01·“那段引用是AI编的，我都没检查”｜新媒体编辑

周子衡是一家互联网科技内容平台的编辑。日常就是不停写稿、改稿、配图、校对，节奏快、压力大，最怕出错，也最怕拖稿。

一年前，他开始习惯性地用豆包帮自己“提速”。

有一次，他在赶一篇关于消费电子的行业稿，写到一半临时需要补一段“市场份额的变化趋势”。他输入指令，让AI帮他写一个关于“2024年中国智能手机市场结构变化”的分析段。

AI很快给出了一段数据看起来很清楚的内容——其中写道：“根据2024年第三季度某调研机构数据显示，某国产品牌以18.6%的市场份额排名第一，同比上升3.2个百分点。”

这段话看起来毫无问题。数据精确、语气专业、语法顺滑，还有“同比上升”这样的细节增强说服力。他没再多想，直接复制进了文稿里。

直到第二天主编审稿时，只留下一句评论：“这个数据谁查的？报告名是什么？”

周子衡当场愣住，开始翻找原始来源。结果在所有主流机构（Canalys、Counterpoint、IDC）官网上都找不到这组数字。报告标题也查无此文。

那段AI生成的内容——完全是编的。

“最可怕的不是它胡说，而是它说得像真的。”他回忆。

事后他用同样的提问重新试了一次，发现AI每次写的数据段都略有不同，报告名、数值、变化幅度没有一项一致。幻觉不是偶然，而是一种常态。

他告诉自己以后要“一定要验证”，但在很多时候，面对高强度稿件节奏、碎片化补写需求，他也承认，“有时候就真的没空管了”。

现在，他已经不再用AI生成带数据的段落了。结构、语言、框架还可以让AI辅助，但只要出现“报告”“数字”“来源”这些关键词，他都会直接跳过，“那种句子看起来是对的，但大部分的时候你查不到出处”。

他贴在工位上的一张便利贴上写着八个字：“AI写得快，出错更快”。

02·“AI说支持退货，客户让我们赔钱”｜电商客服

王萌在一家电商平台做客服主管，管着一个十几人的小团队。去年，公司开始引入一套基于国产大模型的AI话术辅助系统，能自动生成售后场景中的标准回复，比如物流延误解释、退款规则说明、签收流程提示等。

起初，效果很不错。

在高峰期时，这套系统帮客服节省了近30%的打字时间。客服只需要输入问题关键词，就能快速调用一段模版化回复，再手动做个性化调整，效率高了不少。

直到春节前的一次售后争议。

一位客户申请退货，原本被驳回，因为商品属于“限时秒杀，售出不退”类目。但几分钟后，客户在平台发来一张截图，显示客服回复中明确写道：

“根据平台规则，您在签收后七天内享有无理由退货权利。”

这段话不是人工打的，而是AI生成并自动插入的。客服当时操作匆忙，直接发送了回复，没有修改。

问题是，该商品页面明确标注“不支持无理由退货”。

客户据此投诉平台“误导性承诺”，要求退款。最后公司决定对客户做一次性赔付处理，并在内部通报此事。王萌回溯聊天记录，确认这段话确实是系统生成的模版内容。

“它没有说错平台规则，但它不知道这个商品不适用。”王萌说。

那次之后，公司立刻调整AI功能权限，关闭“自动插入回复”选项，只保留“人工确认后发送”机制。她也重新做了一轮培训，要求坐席团队重新学习不同品类的售后条款。

“AI不是真的理解规则，它只是预测我们会怎么说。”她说，“但客服不能靠预测来应对例外。”

03·“我第一次用AI做课件，它就给我编了一个概念”｜培训讲师

蔡倩是一名职业培训讲师，做的是偏职场技能类的课程，有时候是平台直播，有时候是企业内训。她讲得多的是“如何做品牌定位”“短视频营销路径”这类话题，节奏紧、信息量大，对内容更新也要求极高。

去年她第一次接触AI写作工具，是在备一场线上课时。

那节课要讲“品牌情绪价值”，她觉得AI可以帮她节省一部分找例子的时间。她让AI生成一个开场段落，希望它能提供一组“当代年轻人情感消费偏好”的数据，引入情绪价值的核心概念。

AI的反应几乎完美——几秒钟后，给她写出一段逻辑顺畅、语气严谨的段落，里面引用了一组“六成以上年轻人偏好具有情绪表达的品牌”类的比率，并提到这来自“最新调研”。

她读完没怀疑，语气“太像PPT了”，一段直接贴上第一页。

直播当天，她刚讲完开场部分，一个学员在评论区留言：“老师请问这份调研出自哪里？我们公司想参考一下。”

她下意识一愣，试着回忆出自哪里，结果想不起来。课后她查了多个公开数据平台，完全找不到类似数据，也找不到那组数字。她终于明白，那段“引用”，其实是AI凭空拼接的幻觉。

“它写得太像真的了。”她说，“我第一次用它，就中了招。”

从那之后，她就设了一条规矩：只让AI提供结构建议，不再接受它写出来的“事实”。凡是出现数字、百分比、时间节点的地方，她都要手动查证两次。

“它最大的问题是太能模仿‘专业话术’了，模仿得越像，我们越容易放弃判断。”她说，“但我在课堂上要对每一句话负责，它不用。”

04·“我是做AI的，但我从不让它拍板”｜AI产品经理

高哲所在的公司，是一家做To B智能应用的AI创业团队。他负责产品设计，跟各种国产大模型打交道的时间，比起普通用户要早上两年。

他几乎每天都在用AI。

需求文档、竞品分析、PRD草稿、用户故事地图、市场调研报告……他给自己定了一套“效率模板”：用AI起草结构、快速归类观点、统一术语措辞，节省前60%的脑力负担。剩下40%，再自己修改和打磨。

“不是我信它，是我太熟它。”他说。

他对AI幻觉的警觉，来自一次“内部演示事故”。

那天他用文心一言写了一段关于行业发展趋势的说明，希望在会议上展示“AI在市场分析方面的辅助能力”。模型写得非常流畅，包含年份、增速百分比、行业预测甚至引述了看似具体的“研究内容”。

结果演示前10分钟，他临时决定复查一次，发现那段“预测”里引用的年份是错的，“下滑2.7%”的描述也找不到任何出处，整个段落拼得太顺了，顺到让人忽略了检查这一步。

“我那时就意识到，不是它写得不好，而是它写得太像真的了。”高哲说，“它会生成一种‘话术级的自信’，但你根本不知道它有没有在胡说。”

那次之后，他为自己团队建立了一套机制：

AI生成的内容，必须标注来源；凡是没有来源的部分，必须经过人工复核；涉及客户交付或关键判断的内容，不允许AI直接定稿，必须由两人以上确认。

他也在文档协作平台上设计了“AI片段提醒”功能：所有通过AI生成的段落，系统会自动添加“AI生成内容”高亮标签，便于团队协作时一眼看出哪些内容需要格外留神。

“AI不是写手，它是个脑暴助手。”他说，“你不能让它帮你决策，只能让它帮你发散。”

他有一个默认逻辑：AI只负责生成可能性，人负责筛选合理性。

现在他让团队里的年轻产品经理也尽量使用AI——不是因为相信它更准，而是让他们在工作中早一点意识到：“你终将要为AI的每一个建议负责。”

05·“AI为什么会编？因为它根本不懂真假”｜幻觉原理解析

在语言模型的世界里，没有“真假”，只有“可能性”。

AI幻觉，这个术语听起来像是技术世界的诗意表达，本质却非常具体——它指的是大模型生成出语法正确、逻辑通顺、但与事实不符的内容。比如不存在的报告、编造的数据、拼接的结论。

它不是AI“出错”，而是AI完成任务的方式本身就不依赖事实。

大多数人以为AI像搜索引擎，会“查找”正确答案。实际上，它更像是一个“超级自信的语言预测器”——你给它一个开头，它根据庞大的语言训练数据来“猜测”下一个词最可能是什么，拼出一段“看起来合理”的话。

它的训练目标，从来不是“说实话”，而是“说得像人”。

正因如此，它写出来的段落往往句式顺畅、术语专业、逻辑通顺，甚至模仿得出“权威感”十足的引用方式。对用户而言，这些特征让人“降低了警惕”。

它不会撒谎，它只是编得太像真的了。

尤其在中文场景下，这种幻觉感更容易放大。

互联网产业时评人彭德宇对坤舆商业观察表示：一方面，中文表达具有高度的模糊性和结构弹性：一个概念可以不定义、一个数字可以不标注出处、一个观点可以没有主语。模型在生成内容时，更容易凭借“语言惯性”组织句子，而不自觉地跳过事实验证。另一方面，中文开源语料中充斥着大量不标注来源的二手信息、模板化文章、商业软文和平台内容，这些内容在AI训练时没有“事实权重”的区分——它会像人类学语言一样，把“说得像样”当成“就是对”。

这导致幻觉不是个别事件，而是一种结构性风险。

它最常出现在以下几种情形：

•引用内容时：编造机构名、白皮书、研究报告；

•列数据时：拼接不相干的数字，甚至自创比例；

•提及政策/法规时：使用过时信息或伪造条款；

•生成结论时：拼凑常见逻辑链条，但事实基础不存在；

而这些内容恰恰是很多职场人最依赖AI的地方。

科大讯飞董事长刘庆峰曾表示，生成式人工智能存在幻觉，特别是深度推理模型的逻辑自洽性提升，使得AI生成内容真假难辨。

360集团创始人周鸿祎也在两会期间对媒体表示，AI幻觉虽然有利于文学创作，但在AI安全方面，幻觉可能会带来严重问题，比如在医疗、法律、金融等专业领域，大模型一旦胡乱编造，就会带来严重后果。

坤舆商业观察也认为：“我们太容易把AI写出来的东西，当成有出处、可信赖的内容。其实，它只是比你更会写‘像是有出处’的句子而已。”幻觉是生成式AI写作不可避免的副产品。就像你教一个孩子说话，却没有告诉他什么是真假，他只会模仿大人说得像的方式去“复现世界”，但他并不理解这个世界。

06·“它不撒谎，但我们得学会设防”｜平台与用户的应对机制

在AI幻觉面前，没有人能完全幸免。但越来越多的AI使用者，正在学会“设防”。