摘要:他说,有一件突发的事,需要跨部门合作。但是,这件事并不是对方的本职工作。所以,他有些不好意思开口,就来找我商量,可不可以设立一笔小的奖金,让对方能更有动力地做这件原本不在工作范围内的事。
前段时间,有位同事找我讨论了一个问题。
他说,有一件突发的事,需要跨部门合作。但是,这件事并不是对方的本职工作。所以,他有些不好意思开口,就来找我商量,可不可以设立一笔小的奖金,让对方能更有动力地做这件原本不在工作范围内的事。
嗯。承担额外的工作,拿走额外的奖金。听上去,非常合理。
但是,我还是制止了。同时,我也强调,千万不能随便在公司里发钱。很多时候,我们希望一个人去做某件事,就很自然会想到用金钱激励。可是,这种方法其实并不可取。
为什么?
用现在最流行的人工智能语言来说,这就相当于是乱设了激励函数。
什么意思?
打个比方。小孩子学走路。
爸爸妈妈们是怎么教小孩子学走路的?不是告诉他如何发力、如何迈腿。因为他还听不懂。而是给他设定了一个奖惩机制。走得好,爸爸妈妈会抱。这是奖励。摔倒了,屁股会痛。这是惩罚。有了这套奖惩机制,孩子就会不断练习,并根据奖励和惩罚的反馈不断尝试调整姿势,直到在某一个瞬间,突然就“自然而然”地学会了走路。
这种学习方式,就叫做:强化学习。而这套奖惩机制,就叫做:激励函数。
那一旦设错了激励函数呢?得不到玩具,会哭。因为玩具,是哭的奖励。得不到关注,会叫。因为关注,是叫的奖励。
就像一个打扫房间的AI,设定了“看不见灰尘”的激励函数,可能就会学会“关掉房间里的灯”。医疗诊断的AI,设定了“准确诊断率”的激励函数,学会“只做笼统的诊断”。棋盘游戏的AI,设定了“不输棋”的激励函数,学会“无限延长游戏”或是“找方法暂停游戏”。
这种现象,也叫做:奖励破译(Reward Hacking)。发现并利用捷径和漏洞,从而获得奖励。即便这不是设计者的真实意图。
育儿如此。AI如此。一家公司也是如此。
公司里的员工们,最终会做出什么样的行为,采用什么样的协作方式,归根到底,也都是由激励函数塑造出来的。
比如,如果真的因为某件事,给某个人发了一笔额外的钱,那他肯定会很高兴,可能还会对公司心怀感激,也为公司多争取一些利益。但是,等过一段时间,又有另外一件计划之外的事情需要他帮助的时候,他可能也会期待能有一笔额外的钱。对这笔钱的“多少”,也会有自己的衡量标准。上次是300块钱,这次是多少?什么。150?这次的事,明明比上次复杂。怎么着也得是500。怎么会是150。
最终,公司的内部,就会生长出一套脱离于激励制度的价格体系。
每一个人,每一种活儿,都明码标价。但凡不给钱的事,就没人重视,没人干。每件事都得给钱。而且,不能给得“不公平”。
我们曾经讲过这么一个故事。
一位创业者,在一位员工入职5周年的时候,一个高兴,就送了一台当时最新的iPhone 8。第二年,又有几位员工满5周年了。接着发。第三年,第四年,第五年。十个人,五十个人,一百个人。接着发吧,100多万的成本。不发了吧,员工又会愤怒,觉得凭什么别人有,我没有。凭什么到我这儿就停了。
很多公司,在启动新项目的时候,也会这样。比如,只要参加新项目,就有1000块钱的奖金。到最后,名义上的“奖金”,就变成了实质上的“工资”,起不到任何激励作用了。
所以,请记住,轻易不要在正常的激励制度之外,再制定任何的奖励制度。
当然,随意发放金钱,只是一种设错激励函数的情况。有些公司,还存在着另外一种更加麻烦的,由老板主导的激励函数。
比如,平时的工作中,一位员工有多大的权力,全看老板的态度。出了问题,需要承担多大的责任,全凭老板的站队。到了年底,能拿多少钱,全凭老板的判断。因为老板会说,我每次下班都看到小王工作得特别辛苦,一直在干活儿,我不管,无论如何都得想办法给他发点奖金。
一旦一家公司的激励函数,是由老板的主观判断决定的,那员工就会想尽办法“管理”老板的判断。
现在,你可能就能理解,为什么会有人喜欢在老板面前表演了。
因为在一家激励函数取决于老板的判断力的公司里,表演,就是最有效的工作方式。
只要老板在场,原本工作效率不高的员工,也会表现得格外勤奋。只要老板还没下班,那我也不下班,看谁能坐得住。只要老板参会,那就踊跃发言,平常懒散拖沓一点没关系。反正演出圆满了,奖金、晋升、资源分配也就到手了。
而这种职场版的“奖励破译”一旦被找到,被允许,很快就会像病毒一样扩散开来。因为看到“表演者”获得奖励,其他员工也会被迫加入表演。就像一个班级里,老师只奖励那些举手发言的学生。那所有学生都会拼命举手,却不关心答案是否正确。
直到,公司形成一种“会说比会做重要,表现比产出重要,形式比内容重要”的价值观。直到,员工失去对真实价值的感知能力,开始相信表演本身就是工作的重要组成部分,甚至是工作的全部。直到,老板住进了自己“精心编织”的信息茧房。
PR部门会说,你的所有决策,都是准确无比的。身边的同事会说,你是偶像,是榜样。
最终,整个公司只向上负责,却不带来实际的市场成果。老板也感受不到市场上的风浪,反而感觉自己英明神武。
是的。有时,我们会疑惑,为什么有的人这么喜欢拍马屁。其实,这不是“天生”的,而是被老板的激励函数所催化出来的。一旦激励函数出了问题,通过强化学习训练出来的公司就会出问题。就像训练AI一样。
那么,对于一家公司来说,真正具有价值的激励函数,到底是什么?
答案只有一个。那就是:市场。
市场的反应,客户的反应,用户的反应,这些数据反馈,才是真正的激励函数。因为只有这样,员工的利益才和市场的真实利益是一致的。
盈利多少,给予相应奖励。客户数量增长多少,也给予相应奖励。不应该有人在中间做主观的判断,说什么“他太辛苦了,得多给一点”,或者“虽然他没完成任务,但是表现出了潜力”。这些都不行。
在真正具有价值的激励函数下,不断训练。假以时日,公司才有机会拥有扎根临时基地、不断进取的冲劲。而不是变成一家,所有人都在围着老板打转的公司。
当然,这就意味着,从今往后,老板得把自己的个人喜好,死死地关在笼子里了。
即便这极其的反人性。
但请你相信,难而正确的事,往往都是反人性的。
这些思考,与你共勉。
P.S.
很多人相信,人工智能是未来。却不知道,该如何拥抱这个未来。
很多人认为,人工智能是机会。却不知道,如何才能不错过机会。
所以今年,我和我的团队,也正式推出了,2025“进化的力量·刘润年中大课”。
6月7日,在上海影城,我会用一天的时间,和你好好聊聊人工智能。
不做现场直播。也不做事后回放。就让我与你,独家分享。
6月7日,就让我们,现场见!
*个人观点,仅供参考。观点/ 刘润主笔/ 二蔓/ 歌平版面/ 黄静
这是刘润公众号的第2560原创文章
来源:鼎力教育