B. F. 斯金纳
B. F. Skinner
生于1904年,出生地:宾夕法尼亚州,萨斯奎汉纳。
卒于1990年,逝世地:马萨诸塞州,剑桥市。
毕业于汉密尔顿学院和哈佛大学。
核心思想
让激进行为主义进一步“激进”的学者是B. F. 斯金纳。他认为,一个有机体的个体心理无法解释行为,我们的行为仅仅是对于外部环境刺激的反应。对于斯金纳而言,基因之所以重要,只是由于它们令人类拥有了能够学习不同行为的生理基础。
斯金纳在伊万·巴甫洛夫的经典性条件反射的基础之上,提出了“操作性条件反射”。斯金纳指出,巴甫洛夫的条件反射能够让狗做好进食的准备,但是他所提出的条件反射则能够促使狗去寻找食物。他使用了自制的迷笼,后来被称作“斯金纳箱”,他对实验程序进行了精细化和标准化,并且向世界表明,动物踩踏杠杆的行为与唾液分泌反射一样是有形且可测量的,由此一系列全新的研究诞生了。
斯金纳之所以使用“操作性条件反射”这一术语,是因为这些行为是为了产生结果而作用于环境的行为。他认为,正是这些结果决定了某一行为是否还会出现。当然,此观点与爱德华·桑代克的联结主义有着异曲同工之妙。
但是斯金纳最具开创性的贡献在于他所谓的“强化程式”,而且他通过实验证明,强化程式对于条件反射的效力高低具有决定性作用。他发现,反应与奖赏之间的搭配模式能够大幅影响联结的强度。你可以训练一只动物学会踩踏杠杆从而获得食物,甚至不需要每一次踩踏杠杆都出现食物。事实上,在呈现食物方面,某些强化程式可以使动物更有可能踩踏杠杆,并且持续这一行为。
斯金纳与行为主义心理学家查尔斯·费斯特(Charles Ferster)提出了三种主要的强化程式:
●连续强化:比较适用于在一个行为和一个奖赏之间建立联系的初期。具体而言,只要一个行为出现,那么就给予一个强化物或者激励性奖赏。
●间时强化:在某一特定类型的行为出现之后,间隔一段时间,方给予奖赏,不管该行为出现了多少次。
●比率强化:在某一特定类型的行为出现特定次数之后,方给予奖赏,不管这一行为经过了多长时间。
除此之外,还有两种描述性的强化程式:
●固定的强化程式,指的是强化物的给予方式是按部就班、可以预测的。
●变化的强化程式,诚如其名,指的是强化物的给予方式会随时间而改变,并且无法预测。
譬如说,如果你的工资每两周发放一次,不论你是否曾经请过假,那么这种强化程式就属于固定的间时强化,因为工资的发放间隔是固定的。但是,假设你只有每做成三单生意,才能获得固定金额的奖金,完全没有基本工资,那么这就属于比率强化,因为只有在你做成一单生意这一行为出现三次之后,你才能拿到工资。作为一名靠工资为生的人,变化的间时强化程序会让你感到十分苦恼。固然,每隔一段时间你都会拿到工资,但是每次发放工资的时间间隔不一样,而且不可预测。变化的比率强化同样令人沮丧,你只有在工作中将某一行为重复一定次数之后,才能拿到奖金,但是,每次奖金发放所需要重复行为的次数则是不同的。
斯金纳发现,整体而言,比率强化诱发行为的效果更好,因为它能够使得行为与强化物之间的联系得到促进,你可以非常迅速而且明确地看到从事某一行为可以导致强化物出现。而且,变化的强化程式诱发的行为,更加难以消减,或者说难以戒掉。这是因为你永远无法确定究竟奖赏会在什么时候出现,你可能会想:为什么现在就戒掉呢?
这里必须要指出,“负强化”这一术语的意思与很多人头脑中所认为的并不一致;它并不意味着移除一个令人不愉悦的结果,而是移除一个刺激。所以,虽然很多人将“正强化”等同于奖赏、将“负强化”等同于惩罚,然而事实并非如此。在条件反射模型中,衡量“正”和“负”的唯一标准就是刺激的呈现或者消除。当然了,惩罚会使得行为获得重复的可能性降低,而强化会使得行为获得重复的可能性提高。惩罚和强化可以为“正”,也可以为“负”,这取决于刺激是呈现还是消失。
斯金纳还证实了“行为的塑造”现象的存在:如果某人的行为接近于理想目标行为,你相应地予以强化,通过这样的方式,你就可以让他的行为越来越接近你所希望的。其中最著名的案例,或许就是斯金纳所展示的会弹钢琴的猫,能打乒乓球的鸟,以及会操作使用吸尘器进行清洁的猪。斯金纳甚至还曾经同美国军方合作,训练鸽子引导炸弹,并且取得了一些进展,只不过支持该项目的资金最终消耗殆尽了。
在职业生涯后期,斯金纳将自己的行为主义者信条和乌托邦理念结合起来,撰写了小说《瓦尔登湖第二》(Walden Two),其书名来自亨利·戴维·梭罗(Henry David Thoreau)的著作《瓦尔登湖》(Walden),梭罗在该书中描写了一种个人生活在大自然当中、身边的环境极其简单而且完全自给自足的状态。在斯金纳小说中所构建的乌托邦版本里,一群人形成了一个集体,每一个人都可以投身于工作、兴趣爱好和艺术当中。行为主义者的信条,当然是集体中的任何人都没有自由的意志,或者说甚至不存在过多真正的自由,因为集体成员应该根据集体环境对他们所进行的强化而相应地采取行动。斯金纳还给该小说拟写了副标题,《超越自由与尊严》(Beyond Freedom and Dignity),这听起来可以说与乌托邦似乎毫无关系了,但是在斯金纳所提出的假设中,人类的每一名个体都应该竭尽所能地去使自身行为的社会效益最大化。
最后,斯金纳还强调,语言习得与其他任何行为之间都不存在质的差异,和其他任何事物一样,语言也是通过重复和强化进行学习。这成为激进行为主义的另一个信条,最终带来了巨大的争论和异议。
重要影响
斯金纳巩固并且革新了行为主义,使其成为塑造二十世纪中期思想界的一股力量。他的强化程式和操作性条件反射模型也推动了心理治疗方法的发展,治疗病症涵盖了从强迫症到药物滥用等多种障碍。斯金纳的行为主义者观点与诺姆·乔姆斯基的先天论争论不休,饱受关注,两人针对语言习得所提出的理论针锋相对、互不相让。
可以说,斯金纳的强化程式构成了人类行为与动机的基础,从工作生活,到儿童管教,再到投机赌博的一切事物。
首先以老虎机为例。你可能知道,总体而言,自己对抗这个“一只手恶棍”的胜率,从数据上来看是必输无疑的——赌场可不是什么热心肠又宽容大度的组织。即便如此,还是有很多很多人一遍又一遍把钱浪费在老虎机里,即便每一次都输也依然如此。这是为什么呢?
答案即在于斯金纳的变化的强化程式里。这种程式所强化的行为最难以消除,正因如此,每次光顾拉斯维加斯,你都会跃跃欲试;也正因如此,你很难知道自己应该何时弃牌。你知道老虎机某些时候会吐钱,而且有些时候会吐出一笔很大数目的钱。而且,老虎机是否吐钱并不取决于具体时间,而是其快速转动的次数。噢,当你知道自己再转一次,可能整台老虎机就会铃声大作,灯光闪烁,口哨声四起,然后吐出一大笔钱时,是多么难以挪动脚步啊!
变化的强化程式还可以部分解释为什么我们很多人如此着迷于自己的智能手机。毕竟,如果你不断地翻页,查找,不停地刷新,你可能就在某些时候发现十分有趣的内容。或许你已经不安地发现,自己有时候几乎是无意识就拿起手机,并且在没有手机时是多少有点不自在的。这是因为,你感到自己必须要浏览更新信息,或者,至少,听到更新时那“叮”的一声提示音就好。这是一种变化的比率强化——只要把玩手机一段时间之后,就能收获快乐,但你永远不知道要玩多久才能找到让自己十分感兴趣的东西。你知道,“叮”的一声,或许只是餐厅发来的一封垃圾邮件,而这餐厅是因为你当时想要领取一份免费的小食才获得你的电子邮件地址的。但这一声也可能是来自一位老朋友的讯息,可能是老板发过来的一句“工作完成得漂亮”,还可能是妹妹给你发来的一个有趣的故事。正因如此,你才继续玩手机,而且这一个行为非常难以戒除。
让我们再思考一下工作的动力。你是否曾经开过博客,尽管刚开始时雄心壮志,几个月之后却意兴阑珊呢?你可能会责怪自己太不自律了。相对于工作而言,你更喜欢写博客,你可能还曾经拥有过建立一个博客帝国的野心,幻想过自己最终辞掉工作,成为一名全职博客写手。可惜,你却无法坚持自己的时间安排。其中的原因,可能是撰写博客并没有什么有形的强化物。你非常喜欢“写博客”这个宏观理念,而且你也知道必须要通过时间积累起读者群,但是,每一篇单独的博文都没有产生什么具体的结果,所以,撰写博文也就失去了直接的强化物。除了写作带来的模糊的良好感觉,你根本就没有强化程式。并且,如果只是艾德娜阿姨曾经阅读过你的博客,那也不足以支撑你继续坚持下去。与之相反,你的日常工作,每两周都会为你带来收入,从无意外,而且如果你突然停止上班,那么薪水最终也会完全消失。正因如此,上班这一行为,要比为博客撰文这一行为更加地持久。
对于很多人来说,儿童管教,很关键的方面是行为强化。当你尽力劝说小朋友不要在百货商场的地板上躺着不起来、大吵大闹时,有什么有效的方式呢?“暂停”[1]是一种经典的负惩罚——再强调一次,这并不是因为该方法实质上呈现了不愉快的刺激,而是因为它移除了积极的刺激。家长不再给予孩子奖励了:在暂停时间结束之前,孩子不能再玩耍,家长不会再理会孩子,而且也不允许孩子四处走动或者去玩别的东西。当然,对于大多数孩子而言,绝对会感觉到不愉快的刺激出现——兄弟姐妹们玩耍的声音传过来,自己却不能参与进去,简直让人眼泪会无法抑制地流下来。不过,作为家长,你之所以让孩子“暂停”,目的是消除那些被你看到,并且你不希望再次出现的行为,所以你希望将这些行为与奖赏之间存在的任何联系都切割开来。
用贴纸奖励孩子,对狗狗进行响片训练,代币制,这些从本质上来看都是斯金纳式的概念。事实上,它们已经成了我们调动他人积极性的基础工具,以至于大家已不再去深思其中所蕴含的心理学机制了,也不再去回想我们究竟想在哪些行为及其强化方式之间建立起联系。