为什么会有人喜欢在老板面前表演？

摘要：他说，有一件突发的事，需要跨部门合作。但是，这件事并不是对方的本职工作。所以，他有些不好意思开口，就来找我商量，可不可以设立一笔小的奖金，让对方能更有动力地做这件原本不在工作范围内的事。

前段时间，有位同事找我讨论了一个问题。

他说，有一件突发的事，需要跨部门合作。但是，这件事并不是对方的本职工作。所以，他有些不好意思开口，就来找我商量，可不可以设立一笔小的奖金，让对方能更有动力地做这件原本不在工作范围内的事。

嗯。承担额外的工作，拿走额外的奖金。听上去，非常合理。

但是，我还是制止了。同时，我也强调，千万不能随便在公司里发钱。很多时候，我们希望一个人去做某件事，就很自然会想到用金钱激励。可是，这种方法其实并不可取。

为什么？

用现在最流行的人工智能语言来说，这就相当于是乱设了激励函数。

什么意思？

打个比方。小孩子学走路。

爸爸妈妈们是怎么教小孩子学走路的？不是告诉他如何发力、如何迈腿。因为他还听不懂。而是给他设定了一个奖惩机制。走得好，爸爸妈妈会抱。这是奖励。摔倒了，屁股会痛。这是惩罚。有了这套奖惩机制，孩子就会不断练习，并根据奖励和惩罚的反馈不断尝试调整姿势，直到在某一个瞬间，突然就“自然而然”地学会了走路。

这种学习方式，就叫做：强化学习。而这套奖惩机制，就叫做：激励函数。

那一旦设错了激励函数呢？得不到玩具，会哭。因为玩具，是哭的奖励。得不到关注，会叫。因为关注，是叫的奖励。

就像一个打扫房间的AI，设定了“看不见灰尘”的激励函数，可能就会学会“关掉房间里的灯”。医疗诊断的AI，设定了“准确诊断率”的激励函数，学会“只做笼统的诊断”。棋盘游戏的AI，设定了“不输棋”的激励函数，学会“无限延长游戏”或是“找方法暂停游戏”。

这种现象，也叫做：奖励破译（Reward Hacking）。发现并利用捷径和漏洞，从而获得奖励。即便这不是设计者的真实意图。

育儿如此。AI如此。一家公司也是如此。

公司里的员工们，最终会做出什么样的行为，采用什么样的协作方式，归根到底，也都是由激励函数塑造出来的。

比如，如果真的因为某件事，给某个人发了一笔额外的钱，那他肯定会很高兴，可能还会对公司心怀感激，也为公司多争取一些利益。但是，等过一段时间，又有另外一件计划之外的事情需要他帮助的时候，他可能也会期待能有一笔额外的钱。对这笔钱的“多少”，也会有自己的衡量标准。上次是300块钱，这次是多少？什么。150？这次的事，明明比上次复杂。怎么着也得是500。怎么会是150。

最终，公司的内部，就会生长出一套脱离于激励制度的价格体系。

每一个人，每一种活儿，都明码标价。但凡不给钱的事，就没人重视，没人干。每件事都得给钱。而且，不能给得“不公平”。

我们曾经讲过这么一个故事。

一位创业者，在一位员工入职5周年的时候，一个高兴，就送了一台当时最新的iPhone 8。第二年，又有几位员工满5周年了。接着发。第三年，第四年，第五年。十个人，五十个人，一百个人。接着发吧，100多万的成本。不发了吧，员工又会愤怒，觉得凭什么别人有，我没有。凭什么到我这儿就停了。

很多公司，在启动新项目的时候，也会这样。比如，只要参加新项目，就有1000块钱的奖金。到最后，名义上的“奖金”，就变成了实质上的“工资”，起不到任何激励作用了。

所以，请记住，轻易不要在正常的激励制度之外，再制定任何的奖励制度。

当然，随意发放金钱，只是一种设错激励函数的情况。有些公司，还存在着另外一种更加麻烦的，由老板主导的激励函数。

比如，平时的工作中，一位员工有多大的权力，全看老板的态度。出了问题，需要承担多大的责任，全凭老板的站队。到了年底，能拿多少钱，全凭老板的判断。因为老板会说，我每次下班都看到小王工作得特别辛苦，一直在干活儿，我不管，无论如何都得想办法给他发点奖金。

一旦一家公司的激励函数，是由老板的主观判断决定的，那员工就会想尽办法“管理”老板的判断。

现在，你可能就能理解，为什么会有人喜欢在老板面前表演了。

因为在一家激励函数取决于老板的判断力的公司里，表演，就是最有效的工作方式。

只要老板在场，原本工作效率不高的员工，也会表现得格外勤奋。只要老板还没下班，那我也不下班，看谁能坐得住。只要老板参会，那就踊跃发言，平常懒散拖沓一点没关系。反正演出圆满了，奖金、晋升、资源分配也就到手了。