一、什么是学习
在心理学中,“学习理论”是一个专门的领域。我们将通过认识“学习”,来了解和控制员工的工作行为,包括工作行为的形成、发展、保持和变化。
想要的工作行为有助于达成组织目标;相反,不想要的工作行为妨碍组织目标的达成。
简单说,留下我们所想要的,去掉那些我们不想要的。
好的行为:
不好的行为:
判定行为的“好”与“不好”,受到组织文化和组织规范的影响。
例如,在某高科技企业,工程师和科学家被鼓励质疑来自高层管理者的决定,因为专业的判断对于企业在市场的成功至关重要。
但是,在军队里,任何质疑都被认为是犯上的表现,都要受到严重的处罚。
学习的定义:因经验产生的相对持久的行为变化。
如何来理解这个定义?
首先,学习要落到“行为”上。学习理论强调客观的、可测量的、可评价的行为。行为必须是可公开观察的,而不能是不可观察、内在的、认知性的行为。
其次,学习要求某种变化的发生。学了就要有变化。学习过和没学习过要有不一样。
最后,变化是持久的,暂时的变化是不行的。
二、学习的类型
在组织中,员工需要学习和表现出具有生产力的工作行为。学习新的工作行为在很大程度上依赖于环境因素,管理者的作用就是创造必要的环境条件,以促进员工的学习,继而表现出组织期望的行为。
学习有很多种类型,在组织中最常见的主要有两种:操作性条件反射和社会(观察)学习。
(一)操作性条件反射:在奖励和惩罚中学习
要了解操作性条件反射,先要从经典条件反射讲起。
1.经典条件反射
巴甫洛夫(Ivan.P.Pavlov,1849—1936),苏联生理学家,经典条件反射学说的创立者。巴甫洛夫通过一系列在狗身上的实验研究提出了无条件反应的概念。
实验过程如下:
这样,就形成了小狗对铃声的经典条件反射。在这个实验里,铃声是一种中性刺激,单独听到铃声是激不起小狗的“食欲”的;而肉是一种无条件刺激,只要小狗看到肉,就会不由自主地分泌出唾液来。
“中性刺激(铃声)+无条件刺激(肉)”的组合,有一个专业术语——强化。
中性刺激不仅限于一种,所有来自体外的有效刺激,都可以作为中性刺激物。
巴甫洛夫还发现,强化的次数越多,条件反射就越强、越巩固。但是,当条件刺激不被无条件刺激所强化时,就会出现条件反射的抑制,主要有消退抑制和分化。条件反射建立以后,如果多次只给条件刺激而不用无条件刺激加以强化,结果是条件反射的反应强度将逐渐减弱,最后将完全不出现。例如,对以铃声为条件刺激而形成唾液分泌条件反射的狗,只给铃声,不用食物强化,多次以后,则铃声引起的唾液分泌量将逐渐减少,甚至完全不能引起分泌,出现条件反射的消退。
经典条件反射能帮助我们理解工作场所中一些行为。例如,在某医院的急诊室,红灯亮起表示马上要接诊一位新来的病人。久而久之,医护人员都感觉看到那盏灯亮起时,他们就会感到紧张。
相对而言,经典条件反射在工作环境中应用并不多。
2.操作性条件反射
(1)什么是操作性条件反射?
由美国心理学家斯金纳命名,是一种由刺激引起的行为改变。
操作条件反射与经典条件反射不同,操作条件反射与自愿行为有关,而巴甫洛夫条件反射与非自愿行为有关。
斯金纳
操作性条件反射是一种自发的学习。
先来看看斯金纳的实验:
斯金纳关于操作性条件反射的实验,是在他设计的一种仪器——“斯金纳箱”里进行的。
箱内放进一只白鼠(或鸽子),并设一个杠杆或按键,动物在箱内可自由活动,当它压到杠杆或触碰按键时,就会有一团食物掉进箱子下方的盘中,动物就能吃到食物。箱外有一装置记录动物的动作。
斯金纳箱
斯金纳通过实验发现,动物的学习行为是随着一个起强化作用的刺激而发生的,当动物获得食物以后,按压杠杆的次数大大增加。如果一个操作发生后,接着给予一个强化刺激,那么其强度就增加。
斯金纳的操作性条件反射所建立的原理,在许多动物和人类的学习中得到印证。
例如,咿呀学语的小宝宝,偶然发出了“mama”的音,妈妈以为孩子会叫“妈妈”了,会很高兴;而宝宝得到妈妈的强化,就会越来越多地发出mama的音节。
(2)操作性条件反射在管理中的应用——强化管理理论。
强化是指增强某人前面的某种行为重复出现次数的一种措施。
斯金纳强化理论认为在操作条件作用的模式下,如果一种反应之后伴随一种强化,那么在类似环境里发生这种反应的概率就增加。
因此,管理人员可以通过强化的手段,营造一种有利于组织目标实现的环境和氛围,以使组织成员的行为符合组织的目标。
强化管理的具体方式有四种:
(1)正强化:奖励那些符合组织目标的行为,以使这些行为得以进一步加强,重复出现。
组织中常见的奖赏:
(2)负强化:是指人们学习可避免不愉快或不良后果的行为的过程,强调的是一种事前的规避。
(3)惩罚:当员工出现一些不符合组织目标的行为时,采取惩罚的办法,可以使这些行为减少发生或不再发生。惩罚是力图使所不希望的行为逐渐削弱,甚至完全消失。
强化与惩罚的综合运用实例。
不同的积分可以兑换:
(4)消退:行为与其结果之间的联系也可能因得不到奖励而弱化。当曾经受到奖励的行为不再受到奖励时,这种行为出现的次数往往会减少,乃至最终消失或消灭。
3.如何正确运用强化
在对刺激发生反应时,不一定每次都给以强化的强化法称为“部分强化”。即使在部分强化条件下,学习也能成立。
组织奖赏往往采用部分强化(间歇强化)的方式进行,即不是对每一次行为都进行奖赏,而是间歇性地实施奖赏,使一些预期的反应得到强化,而另一些不强化。
只要频率控制好了,仍然可以达到塑造行为的目的。部分强化(间歇强化)的方式有四种:
(1)固定时间间隔方式:每次强化的时间间隔是固定的。例如,每月1日发工资固定时间间隔方式对于保持预期行为不是特别有效。
在实验室里,假设研究人员正在训练小白鼠按压杠杆,每隔10分钟给一次食物,就会观察到只有在当10分钟快临近时,小白鼠才会频繁地按压杠杆;而其他时间,它则不去按压杠杆。
例如,如果员工知道老板每天12点会经过自己的办公桌,就会在这个时间努力工作。然而,一旦老板没有在旁边表扬他们,他们就会提前去吃午饭或者不那么认真,因为他们知道努力工作不会得到奖励,不努力也不会受到惩罚。
再例如,一旦员工知道老板出差,就会在工作时表现出明显的放松状态。现在是上午11点,明明还没有到午休时间,已有员工开始听歌、网购、约饭局。更有甚者,直接在老板出差的日子翘班不来。
又如,每周四下午总经理组织开例会,各部门经理会在周四下午前把工作再核查一遍,以备总经理查问。但是其他时间就比较松散。
(2)可变时间间隔方式:每次强化的间隔是可变的,即随机性较大,无法预计。
(3)固定比率方式:反应只有累积到了规定数量才会得到强化。即在执行了规定数量的行动后实施强化。
在实验室里,小白鼠会一直按压杠杆。
例如,销售人员知道每实现10000元的销售量就会得到奖金,为了持续不断地获得奖金,销售人员会不停地努力。
又如,生产线上每制作完成15个部件,部件工厂的工人就有报酬可拿。这会造成高的生产效率,工人也会选择更少的休息。
例如,假设超市的理货员每完成一定量的工作后,可以休息半天。
固定比率强化的方式很适合用来学习新的行为,因为主动权掌握在员工自己的手中,但这种方式容易出现过劳或工作质量下降。
(4)可变比率方式:两次强化之间预期的行为数量是可变的。
例如,赌博的人大多数时候都会输,但在玩了一定次数后,就会得到一定的回报。因为赌博的人永远都不知道哪一次会得大奖,他们可能持续玩上很长的时间。这就是赌徒心理。
电话保险销售员无法预知他们要打多少通电话才能得到一个订单,可能每个电话都能成交,也可能在成交一个订单之前要打十几个电话。但他们知道,打更多的电话,才能完成更多的销售,因而才有可能得到更多的奖金。
可变比率方式是一种低成本的强化方式,它比固定比率方式更有效,员工的行为也更难消退。
比较以下四种强化方式:
小结:
(1)固定的强化方式(固定时间/固定频率)会出现反应后暂停现象,可变的强化方式(可变间隔/可变频率)则不会,但固定比率强化会比固定时间强化恢复更快,反应率相对平稳。
(2)按比率强化比按时间强化有着更高的反应率,因为多劳多得。
(3)变化的强化设计比固定的强化设计造成更高的反应率,因为其具有不可预期的特点。
(4)学习新的行为要用固定强化设计,因为强化还没有建立起联结;而固定比率强化优于固定时距强化,前者有更高的反应率。
(5)变化的强化设计相比固定的强化设计,反应更难消退;而相比于变化比率强化,变化时距强化更难消退。
上述各种强化方式有很多重要的相似点和不同点。强化方式对人们在组织中的行为有强烈的影响,在实际应用中,可将几种不同的强化方式结合使用,从而形成适合本组织的强化方式。
(二)如何正确运用惩罚,消除不良的组织行为
组织除了系统地运用奖励(强化)来鼓励良好的行为,也运用让人不愉快的惩罚,以减少或消除不良行为,如缺勤、迟到、拖拉、偷窃和滥用财物等。
调查表明,有80%以上的公司都会采用不同形式的惩罚来加强管理,或起到威慑作用。
1.组织中惩罚使用的方法——渐进式惩罚
渐进式惩罚:是指将惩罚建立在违纪的严重程度和频率基础上。
某公司的惩罚措施由轻到重如下图:
如果是较严重的违规(如偷盗公司财物),会直接采用较严厉的书面警告,而不会从轻到重地处罚。
如果是不可原谅的违规(如泄露公司重大机密),则直接给予解雇。
要注意所有错误行为与处罚规则之间的关系,都应该事前明确告知员工,如印制公司的管理手册、进行新员工培训等。
2.组织有效运用惩罚措施的关键
组织要想有效运用惩罚来帮助管理,应注意遵循以下原则:
原则1:犯错后立即惩罚。
原理:在不良行为发生与负面结果产生之间间隔的时间越短,人们就会在它们之间建立起越强的联系。
实践:不良行为一经出现,立即实施惩罚。
例子:小李经常迟到,在他迟到后,主管立即找他谈话。
原则2:错罚相当。
原理:如果不良行为导致的结果并不很严重,那么不应进行严厉惩罚;如果惩罚太严厉,人们会抗议。
实践:实施适当的惩罚,既不太重也不太轻,小错轻罚,大错重罚。
例子:主管因为小李一次迟到而想要解雇他。
原则3:对事不对人。
原理:惩罚本质上不应该针对人,应该关注的是行为,而不是犯错的人。
实践:惩罚不良的行为,而非行为者。
例子:避免说小李懒惰、散漫、懒骨头,而是说他不准时上班会导致的问题,如客户找不到他。
原则4:不遗漏。
原理:如果你有时没有惩罚错误行为,那么别人就会心存侥幸。
实践:对每次违规都应加以惩罚。
例子:小李每次迟到,都要记录。
原则5:一视同仁。
原理:如果有些人受到惩罚而其他人没有,那么管理者就会指责偏袒或不公。
实践:在相同的违规事件中对每个人的惩罚相同。
小张、小王迟到了,跟小李迟到受到一样的惩罚。
原则6:清楚说明。
原理:说清楚什么行为导致什么样的处分,这样会使惩罚更有效。
实践:清楚地说明实施惩罚的原因。
例子:罚了小李迟到的钱,要告诉他为什么受罚以及依据什么规定。
原则7:惩罚不与奖励同时进行。
原理:惩罚与奖励同时出现,容易使人们在错误行为与奖励结果之间产生错误的联结。
实践:不要在惩罚后接着给予不相关的奖赏。
例子:刚因为小李迟到罚了他的钱,马上又宣布小李因为谈下一个大客户而得到一笔奖金,人们都摸不着头脑,以为功能抵过。
二、社会学习理论:通过观察他人而学习
虽然操作性条件反射非常准确地刻画了影响组织内学习的很多重要因素,但是并未完全涵盖学习的某些方面。对于组织成员而言,成人学习的一种重要方式——观察学习也应当了解。
阿尔伯特·班杜拉
观察学习来自于美国心理学家班杜拉的社会学习理论(social cognitive theory)。班杜拉的社会学习理论提出,学习是在观察和与其他人交往之中形成的。
1.什么是社会学习理论
通过观察示范者的行为而学习,并变成自己的行为。
例如,攻击性带来很多社会问题,小到人与人之间的暴力行为,大到战争。
攻击性的课题是社会心理学中最热门的研究。
社会心理学是研究人际互动和集体行为的一个分支领域,在这一领域工作的科学家提供了大量人类攻击性行为的证据。其中最著名、最有影响的实验之一,称为“波波玩偶实验”。
波波玩偶是与儿童体形接近的一种充气玩具。
班杜拉和他的同事成功地演示了儿童是如何学会攻击性的方式的。
波波玩偶
班杜拉的实验将儿童置于两组不同的成人模特当中,一组是具有攻击性的模特,另一组是非攻击性的模特。
参加实验的是幼儿园的36位男孩和36位女孩,年龄3~6岁,平均年龄是4岁零4个月。这些孩子被分为3个实验组。这些孩子中,24位被安排在实验对照组,其他的被分为两组,每组24人。其中的一组去观察攻击性行为成人模特,另外24位儿童观察非攻击性成人模特。在实验之前,班杜拉对孩子们的攻击性做了评估,每个组参与实验孩子的攻击性平均是大体相等的。并且每个儿童在实验过程中都保证不会受到其他儿童的影响。
孩子们被带进一个游戏室,在那里成人模特展示出不同的行为。实验员把一个成人模特带进房间,让他(她)坐在凳子上参与孩子们的活动。
10分钟过后,让他们开始玩一套套零件玩具。在非攻击性一组,整个过程中只是摆弄玩具,完全忽视了波波玩偶。在攻击性一组,成人模特则猛烈地攻击波波玩偶。
结果:成人模特不在场的时候,观察过暴力行为的一组孩子们的倾向于模仿他们所看到的行为。
在社会学习理论中,通过观察他人的行为进行学习也称为“替代学习”,个体(学习者)观察他人(榜样)如何完成一种行为,并观察这一行为在环境中的效果(是否得到强化),一旦出现类似情形,学习者就会对榜样进行模仿。
2.观察学习的步骤
人们要通过观察榜样进行学习,需要采取以下几个步骤:
(1)注意到榜样。越关注,学习越有效。例如:主管要求下属认真观察其正在做的事情就属于这种情况。
言传身“教”
(2)观察榜样如何完成这一行为。
(3)记住榜样的行为。为了记住榜样的行为,对其行为进行描述或想象是有帮助的。
(4)对榜样的行为进行复制。这就要求学习者要具备完成这一行为所需的技巧和能力。人们只有能够准确地做榜样所做的事,才能从中学习到。随着操练的增多,能力也会随之提高。
(5)有向榜样学习的动机。学习者必须看到榜样的行为受到强化。
例如:假设在新工作中,你知道一个同样担任销售代表的同事通过加入当地的市民组织逐步获得潜在的销售优势,不久以后,在与办公室同事的交谈中,你知道另一个同事也从他参加的市民组织中获得了颇丰的收入。在几次观察到这种现象之后,你可能最终会将加入这些团体与获得销售优势联系起来,尽管你还没和这些群体建立有益的关系,但是你根据对别人的观察预期这样做可获得成功。
人们只会学习那些他们有理由、有动力、有能力做到的行为。
人们不仅通过观察他人来学习做什么,而且通过观察来学习不做什么。这是一种有效的学习方法,而不必人人都为亲身犯错付出代价。
例如,人们观察到同事因为工作中不恰当的行为而受到惩罚后,会避免做同样的事。
组织中的大量学习都属于替代学习。
例如:在培训新员工时就会大量用到这一方法,正式的教学可能通常需要由那些经验丰富的老员工向新员工展示正确的行为方式,同时通过模拟练习让员工们观察哪些行为是适当的,而哪些是错误的。