第五章知觉 · 心理学与生活

第五章知觉 ■感觉、组织、辨认与识别近距和远距刺激真实、模糊和错觉知觉研究的方法 ■21世纪的心理学：虚拟现实 ■注意过程选择性注意注意和环境中的客体 ■知觉中的组织过程图形、背景和封闭性知觉组织原则空间上的和时间上的整合运动知觉深度知觉知觉恒常性 ■生活中的心理学：你如何接住飞行中的球 ■辨认与识别过程自下而上的和自上而下的加工物体识别情境和期望的影响最后的复习 ■要点重述关键术语让我们来看看一个名叫肯基的男人的经历。他在非洲位于赤道附近一个叫俾格米（Pygmy)的文化中长大，自出生以来就只居住在茂密的热带森林中。有一天，他第一次和人类学家科林·托恩布尔（Cdin Tumbull)一同乘车穿越一个开阔的平原。后来，托恩布尔这样描述肯基的反应： “肯基远眺平原上几英里以外大概一百头左右正在吃草的一群野牛，问我那是哪一种昆虫。我告诉他它们是比他所认识的森林野牛大一倍的野牛。肯基大笑着要我别讲这样的蠢话，并再次问我它们是哪一种昆虫。然后他自言自语，为了找出更合理的比较，试图把那些野牛比作他熟悉的那些甲虫和蚂蚁。当我们坐上汽车向这些野牛吃草的地方行进时，肯基还在做这样的比较。尽管肯基和其他俾格米人一样勇敢，当他看到那些野牛变得越来越大时，还是坐得离我越来越近，嘴里嘀咕着说一定有什么魔力……终于当他认识到它们真的是野牛时，他不再害怕了，但仍然感到困惑，为什么刚才它们看起来那么小，是否刚才真是那么小而现在突然变大了，或者是不是有什么骗术？”(Turnbull，1961，p.305) 肯基的故事相当清楚地证明了一个人的经历对其知觉的影响。因为肯基生来只居住在热带森林，他没有先验的知识来立刻解释达到他眼中的感觉信息——从远处物体上反射的光线。在本章中，你将学习自己的知识如何影响你能够并且真实知觉到的东西。在第4章中你已经了解到，你所处的环境中充满了光波和声波，但是那并不是你们体验世界的方式。你看到的不是光波，而是墙上的海报；你听到的不是声波，而是广播中的音乐。感觉只是“演出”的开始，还需要更多的东西才能使刺激变得有意义和有趣，而最重要的是你能做出有效的反应。知觉（perception)是一系列组织并解释外界客体和事件产生的感觉信息的加工过程。这些加工过程提供额外的解释，成功地为你在环境中导航。我们可以给出一个简单的例子来帮助你思考感觉和知觉的关系。把一只手放到面前尽可能远的地方，然后把手移近面孔。当手向面孔靠近时，它在你的视野中占据的面积越来越大。这时你可能无法看到被手遮住的海报。手是如何遮住海报的？手变大了吗？海报变小了吗？你的回答肯定是“当然不是”。这个例子告诉你一些感觉和知觉的差别。你的手能够遮住墙报是因为当手离面孔越来越近时，手投射到视网膜上的像越来越大。是你的知觉加工使你懂得，尽管手投射到视网膜上像在变化，但你的手和海报的实际大小是不变的。可以说，知觉的作用是使得感觉有意义。知觉加工从连续变化、并且经常是没有秩序的感觉输入中，提取信息并把它们组织成稳定且有序的知觉。知觉对象是指被知觉到的东西——知觉加工的现象的或经验的结果。它不是物理的客体或它在感受器中的图像，而是知觉活动的心理产物。由于你的解释是由稳定的知觉活动来控制的，因此你对手的知觉在其大小改变的过程中保持不变。在很多时候，感觉和知觉的发生是无需努力的，并且是连续和自动的，因此这使得你把它们看成是理所当然的。本章的目的在于让你理解和领会那些帮助你轻而易举地对世界给出合适解释的加工过程。我们首先对视知觉加工过程给出一个总的概述。 ■感觉、组织、辨认与识别从广义上讲，知觉这一术语是指理解环境中客体和事件的总的过程——感觉它们，理解它们，识别和标记它们，以及准备对它们做出反应。最好的理解知觉的办法是把它分成三个阶段：感觉、知觉组织，以及辨认与识别客体。正如我们在第4章学到的那样，感觉是把物理能量转换成大脑能够识别的神经编码的过程。比如，感觉提供了视野内基本的事实。视网膜细胞对边界和差别反应较强，而对恒定不变的刺激的反应较弱。大脑皮层中的细胞从视网膜的输入提取初步的特征。知觉组织（perceptual organization)指下—个阶段，在这个阶段形成了对一个客体的内部表征和对外部刺激的知觉。这种表征为观察者外部环境提供了有用的描述，以视觉为例，知觉加工提供了对客体可能的大小、形状、运动、距离和朝向的估计。这些估计基于一系列整合过去经验和当前感觉输入以及知觉框架中的刺激的智力计算完成。知觉加工包括对一系列简单特征如颜色、边界、线段等的综合（整合和联结），形成可被再认的客体的知觉。这些智力活动通常在没有意识觉知的情况下迅速而有效地完成。为了更清楚地理解这两个阶段的差别，让我们看一下理查德博士的例子，他的大脑损伤不影响他的感觉，但是改变了他的知觉加工过程。 ■我们如何知晓？——感觉和知觉组织的分离理査德博士是一个受过良好训练和富有经验的心理学家。不幸的是，他的大脑受到损伤，并改变了他对世界的视觉经验。但幸运的是，脑损伤并没有影响他的大脑语言中枢，因此他能相当清楚地描述脑损伤后不同寻常的视觉经验。总体而言，脑损伤似乎影响了他整合感觉信息的能力。理查德博士说，当视野中有几个人而他看其中的一个时，有时会把这个人的某些部分看成是分离的而不是属于同一个单一的整体。在把声音和同一个视觉事件结合时他也有一定的困难。当看一个人唱歌时，他可以看到嘴在运动并听到声音，但是声音却好像来自一个外国电影中的配音。要把事件的部分看成一个整体，理査德博士需要某些起“胶水”作用的东西。比如，当被看成碎片的那个人走动时，所有的部分都往同一个方向运动，理查德博士这时就能把那些碎片知觉成同一个人。即使在这时，知觉“胶水"有时也会产生荒谬的结果。理查德博士常常把空间上分离但具有相同颜色的物体，如香蕉、柠橡、金丝雀等，看成是在一起的。在人群中穿相同颜色衣服的人看起来会融合到一起。理査德博士的视觉经验被解体，被切碎，变得很奇怪，与他的大脑受损之前大不一样（Marcel，1983)。 □□ 理查德博士的眼睛或分析刺激物体性质的能力没有任何问题，他能准确地看清物体的部分或性质。确切地讲，他的问题发生在整合，即把感觉信息的碎片结合到一起形成对于视觉环境中某一事件的完整和协调的知觉。他的病历是一个明显的感觉和知觉加工分离的例子。这个例子也提醒你们，尽管你们不知道感觉分析和知觉组织的工作方式或它们是否真的在工作，但这两种过程却一直在进行。辨认与识别（identification and recognition)，这第三个阶段赋予知觉以意义。圆形的物体可以被看成是捧球、硬币、钟表、橘子或月亮；人可以被辨别为男性或女性，朋友或敌人，亲戚或摇滚明星。在这一阶段，知觉问题“这个物体看起来像什么？”变成了辨认问题：“这个物体是什么？”和识别问题：“这个物体的功能是什么？”。辨认与识别一个物体是什么，叫什么以及如何对它做出最佳反应，要涉及更高水平的认知加工过程，包括你的理论、记忆、价值观、信仰以及对客体的态度。现在我们已经对使你能够理解你周围的知觉世界意义的加工过程做了简要的介绍。由于第4章主要介绍感觉，因此我们将把主要的注意集中于最初物理能量转换后的知觉方面。在日常生活中，知觉似乎是完全不费力的。在下面的部分，我们将努力让你相信，实际上你做了许多复杂的加工，大量的智力工作，才得以获得“容易的错觉”。 ■近距和远距刺激假设你就是图5.1A中的人，正坐在一张舒适的椅子上审视整个房间。房间内某些物体上反射的光进入你的眼睛形成视网膜上的影像。图5.1B显示进入你左眼的部分(右边凹陷的部分是你的鼻子，下面是你的手和膝盖）。视网膜上的影像是如何与产生这些影像的环境做对比的？ ![](https://box.kancloud.cn/2016-08-14_57affd9a9057b.jpg) 图：一个人的拇指怎么能遮住帝国大厦？ ![](https://box.kancloud.cn/2016-08-14_57affd9aa5446.jpg) 图5.1 解释视网膜上的像视知觉的主要任务是利用来自近距刺激的信息(即客体在视网膜上的像）来解释或辨认远距刺激（环境中的客体）。 □□ 一个非常重要的差别是，视网膜上的影像是二维的，而环境是三维的。这一差别会导致很多影响。例如，把图5.1A中物体的形状与其视网膜上的影像相比（图5.1B)。真实世界中的桌子、地毯、窗户和图画都是长方形的，但实际上只有窗户在视网膜上产生长方形的影像。画的影像是不等边四边形，桌子上部的影像是不规则四边形，地毯的影像实际足三个分离的区域并有20多条边!这是我们所面临的第一个麻烦：你如何得以把这些物体知觉成简单标准的长方形？然而实际情形还要复杂。你也注意到你知觉到的屋子的许多部分实际上在视网膜上并没有出现。例如，你知觉到的两面墙的垂直边界从屋顶一直到地板，但这个边界在视网膜上的像只到桌子顶部为止。同样，地毯在视网膜上的像有一部分被桌子所遮挡。但这并不影响你把地毯知觉成单一的完整的长方形。实际上，当考虑到环境中的物体和它们在视网膜上的像的差别时，你会对自己把周围环境知觉得这样好而感到惊讶。由于环境中的物理客体与它们在视网膜上的光学成像的差别如此之大和重要，心理学家把它们仔细地区分为对于知觉而言的两种不同刺激。环境中的物理客体被称为远距刺激（distal stimulus，远离观察者），而它们在视网膜上的光学成像称为近距刺激（proximal stimulus，靠近观察者），如图5.2所示。 ![](https://box.kancloud.cn/2016-08-14_57affd9ac5b77.jpg) 图5.2 远距刺激和近距刺激远距刺激即环境中的物理客体。近距刺激是由远距刺激决定的感觉活动的模式。如图所示，近距刺激可能与远距刺激很相像，但它们是分离的东西。 ![](https://box.kancloud.cn/2016-08-14_57affd9adb423.jpg) 图5.3 感觉、知觉组织，以及辨认和识别阶段本图示意输入信息的感觉、知觉组织到辨认和识别的加工过程。当知觉表达来自感觉输入中的信息时，就发生自下而上的加工。当知觉表达受个体的先验知识，动机、期望及其他高级精神活动的影响时，就发生自上而下的加工。 □□ 现在可以更简要地说明我们讨论的要点：你希望知觉的是远距刺激——环境中“真实”的客体——然而你必须从近距刺激中获得信息——视网膜上的像。知觉的主要计算任务可以看成是根据近距刺激中的信息来确定远距刺激，在知觉领域中这是确凿无疑的。对于听觉、触觉、味觉等知觉而言，其中都包括了运用近距刺激中的信息以获得远距刺激特征的加工过程。为了演示远距和近距刺激如何对应知觉过程的三个阶段，让我们看一下图5.1情景中的一个物体：挂在墙上的画。在感觉阶段，这幅图画对应于视网膜上的二维不等边四边形。顶边和底边向右会聚，左边和右边长度不等，这是近距刺激。在知觉组织阶段，你把这个不等边四边形看成是三维空间中和你成一定角度的长方形。你把顶边和底边知觉成是平行的，但是向右侧后退；你知觉到长度相等的左边和右边。你的知觉加工对远距刺激产生了一个很强的假设；现在需要的是辨认。在识别阶段，把这个长方形物体确认为一幅图画。图5.3是表示这些事件顺序的流程图。把信息从一个阶段送到下一个阶段的过程用方块之间的箭头表示。在本章结尾我们将解释该图所表示的相互作用。 ■真实、模糊和错觉我们已经把知觉任务定义为从近距刺激辨认远距刺激。在讨论使得这一任务得以实现的知觉机制之前，我们想讨论一下环境中知觉复杂刺激的其他方面：两可刺激和知觉错觉。 □□ 模糊性知觉的主要目的是获得一个准确的对世界的“确定”。生存依赖于对环境中客体和事件的准确知觉——树丛中运动的是老虎吗？——那并不总是容易确定的。看一下图5.4由黑白斑点组成的照片。它是什么？试试从背景中找出刺激图形。试着看出一只行走的达尔马提亚狗。 ![](https://box.kancloud.cn/2016-08-14_57affd9af1c68.jpg) 图5.4 横糊图形你在图中看到了什么？试着看出一只行走的达尔马提亚狗。 ![](https://box.kancloud.cn/2016-08-14_57affd9b13a52.jpg) 图5.5 知觉模糊每一个例子都有两种解释，但是你在同一时刻不会有两种经验。你是否注意到自己的知觉在两种可能性中来回变换？ □□ 由于这只拘和背景混在一起，边界不清楚，因而发现它有一定的困难。（提示：这只狗在图中的右侧，头朝向中央）关键信息丢失，元素之间意外的关系，以及常规图形的不明显使得图形变得模糊，模糊性(ambiguity)是理解知觉的一个重要概念，因为它表明在感觉水平上单一的图像在知觉和辨认水平上可能有多种解释。图5.5是三个两可图形的例子。每个例子可以有两个确定但矛盾的解释。盯住每一个图形看，直到你能得出两种解释。注意，一旦你看出两种解释，你的知觉就会在二种解释之间来回变换。这种不稳定性是两可图形最重要的特点。花瓶/面孔和Necker立方体是知觉组织阶段模糊性的例子。你对环境中同一个客体有两种不同的知觉。花瓶/面孔可以被看成黑背景上的白色物体或白背景两侧的两个黑色物体。Necker立方体可以被看成在你左下方或右上方的三维中空的立方体。对于这两个图形，模糊变换都是由于三维空间中的物体在物理上的不同安排，但都基于同一个刺激图形。鸭子/兔子图形是在识别阶段具有模糊性的例子。在两种解释中其物理形状相同。模糊性出现在决定它代表哪种动物以及在当前信息混淆的情况下如何对其分类。许多卓越的艺术家都把知觉模糊性作为其作品中创造性手段。图5.6是萨尔瓦多·达利的作品“奴隶市场和消失的伏尔泰半身像”。这件作品揭示了复杂的模糊性，作品的一部分必须经过强烈的再组织和解释才能被知觉成法国哲学家伏尔泰的半身像。拱门下的白色天空是伏尔泰的前额和头发，两位女士服装上白色的部分是他的两颊，典子和下巴，（如果你觉得看到他有困难，可伸直胳膊拿书或摘下眼镜）然而，一旦你看出画中伏尔泰的半身像，你就总能看出这个法国人藏在哪里。正常人类知觉最基本的性质之一是倾向于把环境中的模糊和不确定性转换成一个清晰的解释，使得你能够自信地采取行动。在一个充满变化的世界里，你的知觉系统必须能发现不变和稳定。 ![](https://box.kancloud.cn/2016-08-14_57affd9b2ad24.jpg) 图5.6 艺术中的横糊性本图是萨尔瓦多·达利的作品“奴隶市场和消失的伏尔泰半身像”。你能发现伏尔泰吗？达利是众多在作品中使用模糊性的现代艺术家之一。（见彩插) □□ 错觉两可刺激给你的知觉系统带来了在几种可能性中识别惟一图形的挑战。对某种刺激这样或那样的解释是否正确取决于特定的环境。当你的知觉系统欺骗你用被证明是错误的方式体验一个刺激图形时，你就在感受错觉。错觉(illusion)一词与ludicrous有相同的同根，二者都源于拉丁语—词，意思是嘲弄。由于具有相同的感觉系统生理基础和对环境的类似经验，许多人在相同知觉情形下会有类似的错觉（我们在第6章中会解释，这不同于幻觉。幻觉是由于异常生理或精神状态而使个体体验到的不能共享的知觉扭曲）。看一下图5.7中经典的错觉现象。演示这些视错觉只是为了方便，其实错觉也存在其他感觉通道，如听觉（Bregman，1981；Saberi，1996；Shepard & Jordan，1984)和味觉（Todrank & Bartoshuk，1991)。自从奥佩尔（J.J.Oppel)在1854?1855年首次发表对错觉的科学分析后，有大量的关于自然、感觉、知觉和艺术中错觉的论文被发表。奥佩尔对错觉研究的一定贡献如右所示。一排线段，它们在被分割成一段一段时比只呈现两端的线段时看起来更长： ![](https://box.kancloud.cn/2016-08-14_57affd9b3ecfa.jpg) 奥佩尔把他的研究工作叫做几何光学错觉。错觉指出了知觉与真实的差别。它们能够证明感觉、知觉组织和辨认在抽象概念上的差别，并帮助你理解知觉的某些基本性质。 ![](https://box.kancloud.cn/2016-08-14_57affd9b55fed.jpg) 图5.7 戏弄大脑的五种错觉这些错觉中的每一个都代表一种知觉被证明是错误的情景。研究者们经常利用这些错觉来检验他们的理论。这些理论解释了为什么在一般情形下相当准确的知觉系统在特定情形下会产生错误。 □□ 研究者经常创造新的错觉或重新构造已有的错觉现象，以此来证明知觉加工的重要特征。看一下图5.8中Muller-Lyer错觉的不同版本。A是Franz Muller-Lyer于1889年在研究光学时首次给出的错觉现象。在1900年前Muller-Lyer和其他人又发展了其他的版本。在每个例子中，轴线的长度（或在D中两个顶角之间的距离）是相同的。人们常常会对此感到惊讶——你应该用点时间测量一下。尽管发现这些错觉现象时代久远，研究者也付出了许多努力，但关于其起源还是没有定论（Greene & Nelson，1997)。它——很容易产生较长线段的错觉——对研究视觉加工的理论家们提出了不断挑战。这些例子显示，错觉不仅仅是一个夺怪的现象，它们也为心理学理论提供了重要的数据。因此，相对于错觉本身而言，研究者们更感兴趣的是错觉提供给我们在许多情形下知觉如何获得关于外界的准确信息的知识。 ![](https://box.kancloud.cn/2016-08-14_57affd9b7391d.jpg) 图5.8 Muller-Lyer错觉的不同版本所示的Muller-Lyer错觉的每一个版本都产生于1900年之前。你是否在每一个例子中都知觉到线段长度的差异？知觉研究者已经试图发展一些理论来解释为什么这些错觉如此容易获得。 □□ 日常生活中的错觉错觉也是你们日常生活的基本组成部分。想一下你每天关于地球的经验。尽管你知道太阳肯定永远都在太阳系的中心，但你每天还是看到“日出”和“日落”。你能理解对于哥伦布和其他航海家而言，依靠勇气去否定地球是平地的错觉并乘船驶向表面上的边界是多么非凡的业绩。类似的，当月亮在头顶上时，尽管你知道月亮没有在追你，但它看起来还是不论你走到哪里总是跟在你的背后。这是由于月亮远离你的眼睛而造成的错觉。当月光到达地球时，它们本质上是平行的，并且不论你走到哪里，都与你的运动方向垂直。人们能够通过控制错觉来获得期望的效果。建筑师和室内设计师们利用知觉的原理来创造空间中比其自身看起来更大或更小的物体。一个较小的居室，如果墙壁涂上浅颜色，在屋中央（而非靠墙）使用一些较低的沙发、椅子和桌子，房间看起来也会更宽敞。美国宇航局为航天项目工作的心理学家们设计太空舱内部的环境，使之在知觉上有一种愉快的感受。电影院和剧场中的布景和光线方向也被有意地设计以产生电影和舞台上的错觉。除了这些错觉——某些比其他的更有用——你在环境中一般来讲还感觉不错。这也是为什么研究者特别要研究错觉以解释知觉究竞是如何工作得这样好。但是，错觉本身表明你的知觉系统并不能完美地完成从近距刺激复原远距刺激的任务。 ■知觉研究的方法现在你已经熟悉了有关知觉的一些主要问题：知觉系统如何恢复环境的结构？模糊性如何被解决？为什么会有错觉？在我们回答这些问题之前，我们需要给你更多主导知觉研究的理论背景。这些理论之间的许多不同点在于第3章介绍过的“先天”和“后天”的区别。争论在于一开始大脑使用多少你所拥有的基因来处理知觉世界。作为一个先天论者，你可能会辩论说你一来到这个世界就有某种内在知识或大脑结构来帮助你解释周围的环境。或者，作为一个经验论者，你可能会断言你来到这个世界的时候只是一块白板，准备去学习有关知觉世界的一切。大多数现代理论家赞成你对世界的经验是由先天和后天的结合形成的。然而你会看到，这些理论家并不同意形成这种结合的双方是平衡的。 ■21世纪的心理学：虚拟现实以下是21世纪初在影视作品中非常普通的场景设计：男女主人公陷入虚拟的世界——由计算机产生的世界——和戏剧性的结局。例如，在黑客帝国(The Matrix)中（如果你没看过这部电影就不必再阅读这句话余下的部分），男主人公发现他周围他以为是“真实”的一切实际上都是由已经控制地球的超级计箪机精心制作的虚拟现实。幸运的是，迄今为止，我们多数人所面临的虚拟现实被认为是无害的；我们能够轻易地从公园娱乐旅行中经历的虚拟环境中脱离出来。这些经验的改进常常依顿于研究者设计新设备以愚弄我们的知觉系统的能力。设计虚拟环境的人试图把从对知觉加工的基础研究中获得的知识转变为我们对一个全新世界的经验。许多虚拟现实系统的目的是创造虚拟环境中一种特殊的对于现实的感受。现实可以从几个维度来定义，这包括虚拟世界把参与者带进具有丰富社会内涵和交互作用的情景（Lombard & Ditton，1997)。但是，对知觉而言，对现实的感受往往依赖于如何投入到知觉上看起来是真实的虚拟世界。在过去几年里，研究者已经开始系统地研究虚拟世界，用以产生高度逼真现实的知觉信息。为评价现实，研究者经常测量人们如何在具有不同知觉结构的虚拟环境中完成各种任务（Nash et al，2000；Nichols et al.，2000)。看一下这样一个研究项目，它研究视觉剌激如何影响人们在模拟环境中驾车的能力——研究者称为保持车道的任务（Kappe et al.，1999)。虚拟环境中那些提供有趣的类似知觉加工的视觉刺激的变化，能提高受试者的操作水平。回忆一下在真实世界中，你能从注意中心和外周获得信息。这在虚拟环境中如何实现？研究者发现当视觉刺激提供周边信息时，受试者保持车道的操作水平得以提高。但是，与真实世界中的经验类似，外周信息不需要提供高度的细节。这一发现对于人们设计视觉刺激的方式有直接的影响。这类实验表明，只有视野中央的部分需要高度的细节。外周信息重要，但较粗的视觉信息就可以满足需要。在今后的几年里，虚拟环境无疑将会变得更重要：研究者和发明家会学到更多如何让你的知觉加工相信计算机提供的环境是真实的知识。网址： www.hitl.Washington.edu/projects/knowledge_base/onthenet.html，一个搜集网上有关虚拟现实资源的网站 www.vrs.org.uk 虚拟现实学会的主页 □□ 赫尔姆霍兹的经典理论 1866年，赫尔曼·冯·赫尔姆霍兹（Hermann von Helmholtz)赞成经验——或者说后天——在知觉中的重要性。他的理论强调智力加工在解释常见的能兴奋神经系统的两可刺激中的作用。通过运用对环境的先验知识，观察者提出关于事物存在方式的假设或推论。例如，你会把四条腿穿过树林的动物看成是狗而不是狼。因此，知觉是一个归纳的过程，是从特殊的影像推断其所表达的一般客体和事件类别。由于这种过程处于你的意识觉知以外，故赫尔姆霍兹把它称为无意识推理（unconscious inference)。通常，这些推论过程很管用。然而，当特殊境况允许对同一种刺激有多重解释，或者当要求做出新的解释而观察者却仍喜好旧的、熟悉的解释时，错觉就会产生。赫尔姆笛兹的理论把知觉分解成两个阶段。在第一阶段——分析阶段——感觉器官把物理世界分析成基本的感觉。在第二阶段——整合阶段——你把这些感觉单元整合成对客体和其属性的知觉。赫尔姆霍兹的理论认为，你是在对世界的经验的基础上学习如何去解释感觉。你的解释事实上是对知觉有根据的猜测。 □□ 格式塔方法形成于20世纪20年代的德国格式塔心理学（gestalt psychology)更强调内在结构——先天的——在知觉经验中的作用。格式塔心理学的主要成员，如库尔特·考夫卡(Kurt Kofflca)(1935)、沃尔夫冈·苛勒（Wolfgang Kohler)(1974)和马克斯·威特海默（Max Wertheimer)(1923)，主张心理现象只有被看成是有组织和结构的整体而不是分解成原始的知觉单元时才可以理解。“格式塔”的概念大致就是“形式”、“整体”、“结构”或“本质”的意思。格式塔心理学提出整体大于局部之和，是对心理学原子论观点的挑战。例如，当你听音乐的时候，尽管它是由孤立的音符组成的，但你仍然知觉到的是整体的悦耳的旋律。格式塔心理学家认为，对世界的这种整体知觉的产生是由于大脑皮层被组织成用这种方式来工作。你用这种方式来组织感觉信息，是因为对大脑特定的结构和生理来说，这是一种最经济简单的组织感觉输入的方式。(我们会在后面的章节中讨论很多来自格式塔心理学家的知觉组织的例子。） □□ 吉布森的生态光学詹姆斯·吉布森（James Gibson)(1966，1979)和埃莉诺.吉布森(Eleanor Gibson)提出了一个非常有影响的研究知觉的方法。吉布森认为可以通过对现时周围环境(或生态）的分析更好地理解知觉，而不用把知觉理解为有机体的结构。正如一位作家所指出的那样，吉布森的方法“不是问你的头脑里有什么，而是问你的头脑在什么里面”（Mace，1977)。特别是，吉布森的生态光学理论(theory of ecological optics)把注意集中在外界刺激的属性而不是你知觉刺激的机制，这种观点与先前所存的理论有很大的不同。吉布森的思想强调感知是对环境的一种积极的探索。当一个观察者在环境中移动时，视网膜上的刺激形式在时间和空间上都是不断变化的。生态光学理论试图确定对一个移动的观察者的眼睛有用的环境信息。吉布森派的理论家认为知觉系统是在复杂和变化的环境中积极的活动的——寻找食物、水、配偶和避难所——生物体内进化而来的（Gibson，1979；Nakayama，1994)。按照吉布森的观点，“我们如何认识这个世界？”这个问题的答案其实很简单。你可以直接提取来自环境的感觉信息中的不变性或稳定性。没有必要去假设更高水平的知觉推论系统——知觉是直接的。尽管环境中每个客体视网膜像的大小会随着客体的距离和视角而改变，但这些变化不是随机的，而是系统的，物体反射光的某些属性在各种视角和视距条件下是保持不变的。由于人类在一个稳定性知觉对生存很重要的环境中进化，因而你的视觉系统的作用就是觉察这种稳定性。你现在已经了解了一些研究者提出的用来解释知觉加工的理论。接下来我们讨论这些知觉过程，包括它们是如何选择或注意环境中可用信息的很小一部分的。 ![](https://box.kancloud.cn/2016-08-14_57affd9b946ee.jpg) 图：生态光学理论处理视觉世界中的不变属性。—个自然向导能从这幅羚羊群的最观中能得到什么倍息？ ■小结知觉的整个过程可以被分解成三个阶段：感觉阶段、知觉组织阶段和辨认/识别阶段。视知觉的主要任务是利用近距刺激的信息——物体形成的视网膜像——辨认和解释远距刺激——环境中的真实物体。两可图形在感觉水平有单一的解释，但是在组织和辨认水平却有多重可能解释。错觉体现了知觉加工过程理论的局限。知觉理论基本认同知觉能力是先天和后天的共同产物，但它们不同意两者是平衡的。赫尔姆霍兹强调经验的重要性，认为多数知觉需要无意识推理。格式塔理论强调知觉经验必须被看成是整体的，赞成知觉过程中内在加工的作用。詹姆斯·吉布森的理论强调观察者作为一个积极的探索者的作用，关注环境中刺激所反映的稳定信息。 ■注意过程现在，花一些时间来寻找环境中不在你知觉里的10件东西。你是否注意到墙上的一个点？你是否注意到钟的滴答声？如果你开始仔细地检查你的周围，你会发现实际上有许多东西可以成为你注意(attention)的焦点。一般而言，你越是注意环境中的某个客体或事件，就越能知觉或了解关于它更多的信息。这就是为什么注意是知觉研究中一个作常重要的主题的原因：你注意的焦点决定了最能为知觉过程利用的信息的种类。正如你将会看到的，研究者试图了解何种环境刺激需要引起你的注意，注意如何帮助你体验那些刺激，我们将从注意是如何选择性地突出环境中的客体和事件开始。 ■选择性注意在这部分开头，我们要求你努力找出——带入你的注意——一些当时逃出你注意的东西。这种思想实验描述了注意的一个重要功能：选择感觉输入的一部分做进一步的加工。让我们来看看你是如何决定将要注意环境中的哪些部分以及这些决定带来的对可用信息的影响。 □□ 确定注意的焦点是什么力量使物体成为你的注意焦点？这个问题的答案有两个方面，我们可以称其为目的指向选择和刺激驱动捕获(Yantis，1993)。目的指向选择（goal directed selection)反映的是你对将要注意的物体做出的选择，是你自己的目标的功能。你可能已经习惯于这样的观点，即你能有意识地选择物体做特殊检查。刺激驱动捕获（stimulus-driven capture)发生在刺激的特征——环境中的物体——自动抓住你的注意时，它不依赖于知觉者当时的目的。你已经经历过刺激驱动的捕获，例如，当你驱车外出时，车子停在交通灯前面，而你正在胡思乱想，交通灯突然由红色变成绿色，就会吸引你的注意力，甚至在你没有特别关注它的时候也一样。你或许想知道这两个过程之间的关系：研究表明，至少在某些情况下，刺激驱动捕获会胜过目的指向选择。 ■我们如何知洗晓？——决定注意焦点过程之间的竞争研究者们发明了可以使目的指向选择和刺激驱动捕获发生竞争的视觉刺激(Theeuwes et al.，1998)。如图5.9的A部分所示，实验的每个序列都以呈现由6个包含暗色8字的灰色圆形的视觉刺激开始。此后呈现会一个接一个改变。在一半序列中，如B部分所示，除了其中的一个圆形，其他都会从灰色变成红色。被试的任务是把其注视点转移到那个保持灰色的圆形，并对其中的字符是否是正向或反向的字母c做出反应。当执行这个任务时，被试使用了目的指向选择：他们有目的地把他们的注意力转移到保持灰色的圆形。现在看图5.9的C部分。这部分在余下的另一半序列中呈现，新的元素加人了视觉刺激——个新的红色圆形。新的客体是那些基本上能引起刺激驱动捕获的视觉刺激。通常情况下，我们预期被试会把他们的双眼转向新客体。然而，在这个特殊的实验中，被试不要让他们的眼睛转移到那个物体：他们仍然被要求仅仅报告那个单一的灰色圆形的内容。这时发生了什么呢？被试能阻止自己把注意转到那个新的红色圆形上吗?事实上，多数情况下，新的物体自动地抓住了被试的注意——尽管这个物体完全与实验者为被试设定的目标无关。 ![](https://box.kancloud.cn/2016-08-14_57affd9bac5c9.jpg) 图5.9 选择注意的过程在这个实验的每个序列的开始，被试现看有六个灰色圆形的刺激(A部分）。当刺激改变时，被试的任务是报告在那个仍然保持灰色的圆形中的“C”是正向的还是反向的。在一半的序列中，刺激图形没有引进新的客体（B部分）；在另一半序列中，则有(C部分）。尽管被试的目的是注意那个单一的灰色圆形，但是新的客体——当它们呈现时——会自动吸引他们的注意。你之所以能识别这种刺激驱动捕获的现象，是因为它在背离知觉者的目的时会起作用。这是因为，如果被试能忽略新的红色圆形，他们的任务就会做得更好。事实上，他们无法忽略它（实验被试几乎总是希望在研究者分配给他们的任务上表现得尽可能好）。一个重要的普遍结论是，你的知觉系统被组织起来使你的注意被自动拉到环境中新的物体上(Yantis & Jonides，1996)。 □□ 不被注意的信息的命运如果你已经选择性地注意了一个知觉呈现的子集——依赖于你自己的目标或刺激的属性——那么那些没有被你注意的信息会有什么结局呢？想像一下当你正在听一个讲座的时候，你的两边都有人在谈话。你如何跟上讲座的进程？你会注意到交谈中的什么内容？是不是任何出现在谈话内容中的信息都会把你的注意从讲座上转移开？这些问题最早由布罗德本特（Donald Broadbent)(1958)研究，他把心理看成是一个通讯的通道——像一条电话线或计算机的连线——积极地加工和传播信息。根据布罗德本特的理论，作为一个通汛的通道，心理只有有限的资源去执行全部的加工。这个限制要求注意严格调整从感觉到意识的信息流。注意形成了一个通过认知系统的信息流的瓶颈，把一些信息过滤掉，让另一些信息继续进入。注意的过滤器理论表明选择发生在加工的早期，在获得输入的意义之前。为了检验过滤器理论，研究者用双耳分听(dichotic listening)技术，在实验室重建了有多重输入来源的现实场段。在这种范式中，被试戴着耳机听同时呈现的两种录音信息——不同的信息呈现给不同的耳朵。被试被要求仅仅把两种信息中的一种重复给实验者，而把另一耳中的信息都忽略掉。这种程序被称为掩蔽注意信息（见图5.10)。 ![](https://box.kancloud.cn/2016-08-14_57affd9bc2e4f.jpg) 图5.10 双耳分听任务被试听到在每只耳朵同时呈现的不同的阿拉伯数宇：2(左)，7(右），6(左）,9(右），1(左），和5(右）。他报告听到正确的数列——261和795。然而，当要求被试仅仅注意右耳的输入，他报告只听到795。研究者发现，当注意已经过滤了所有被忽视的材料使得回忆不可能发生时，有些被试仍能回忆一些信息，这使过滤器理论极端模型受到了挑战（Cherry，1953)。例如，试想一下你自己的名字。人们总是报告说在一个喧闹的房间里，即使在聊天的时候也能听到有人喊他们的名字。这经常被称为鸡尾酒会现象。 ■我们如何知洗晓？——我们如何知洗晓？——你是否必须去注意“听”你的名字？被试听到两种声音——一个是男声，一个是女声——读一串单音节词。他们要求仅仅注意他们的右耳，并尽可能准确地复述到达那只耳朵的词（掩蔽)。在实验过程中的某些时刻，被试（除了控制组被试）的名字会呈现在他或她的非注意耳。他们注意到了吗？大约有三分之一(34.6%)被呈现自己名字的被试报告说听到了。他们没有报告听到任何其他的人名，控制组被试（对他们没有呈现名字）报告没有听到任何名字。另外，报告听到名字的那些被试的掩蔽成绩在他们的名字出现瞬间受到了干扰（Wood & Cowan，1995a)。 □□ 这些结果表明你自己的名字并不一定吸引你的注意——有三分之二的听者没有注意到他们的名字。虽然如此，这些结果也较强地表明，对受忽视通道的一些有意义的分析一定已经进行了——否则，三分之一听者的注意根本不会被吸引到他们的名字上。基于这些实验，研究者们相信，非注意通道信息在一定程度上获得了加工——但没有足够到达意识觉知（Wood & Cowan，1995b)。只有非注意信息的属性非常特殊——例如以听者名字的形式——信息才会成为有意识注意的中心。（在第6章我们会再回到注意和意识的关系上来。）一般的规律是非注意信息不会让它的出现被觉察。因此你会知道，为什么让你自己从正在进行的任务或目标中转移出来是危险的。如果你没有注意某些信息——可能是教授的讲座——材料是不会被自动了解的。现在让我们看一下注意在使你能找出并正确辨认物体中所扮演的作用。 ■我们如何知洗晓？——注意和环境中的客体注意的一个主要功能是帮助你在杂乱的视觉环境中找到特殊的物体。为了了解这是怎么工作的，你可以做一个很简单的实验。把你的书放下一会儿，然后试着去做： △试着找出一些红色的东西。现在试着找出一些粉红色的东西。 △试着找出一些方形东西。现在试着找出一些圆形的东西。 △试着找出一些蓝色的东西。现在试着找出一些蓝色的圆形东西。在各种情况下你觉得哪个比较困难？研究表明你会发现找到粉红色物体的位置比红色物体更容易（Treisman & Cormican，1988)，方形物体比圆形物体更容易（Kim & Cave，1995)，由一个特征决定的物体比由两个特征决定的物体更容易(Treisman & Sato，1990)。为什么你会这么认为呢？你肯定是发现了一些前注意加工和注意加工的特点了。尽管有意识的记忆和对客体的辨认需要注意，但是很多复杂的信息加工是在没有注意和觉知参与的情况下进行的（Kubovy et al.，1999)。这个早期的加工阶段称为前注意加工（preattentive processing)，因为在感觉输入首次由感受器进入大脑的时候，它们在你去注意之前就已经被加工了。前注意加工能熟练地在环境中找到由单一特征定义的客体（Treisman & Sato，1990；Wolfe，1992)。请看图5.11的A部分。你能找到一个白色的T吗？这是可以跟在你身处的房间中找一个蓝色的物体相对照的练习。前注意加工允许你在环境中平行地去搜索一个单一的明显的特征。这意味着你可以在同一时间内搜索环境中的任何一个地方。作为这种平行搜索的产物，你的注意会直指向那个正确的客体。然而要注意，并不是所有的单一特征都是一样明显。很多人发现找方形比找圆形更容易——可能是因为方形的角比较突出（Kim & Cave，1995)。很多人发现找出离中心色较远的颜色更容易，例如远离红色的粉红色——可能就是因为这种颜色远离环境的标准（Treisman & Gormican，1988)。然而，尽管在单一特征中有这些显著的差别，你仍然会发现检测特征的组合是比较困难的。请看图5.11的B。再试着找一次白色的不是更困难了吗？在这种情况下，你的注意系统并没有能够用平行搜索的方式把白色的T从白色L中区分出来。你仍然可以用平行搜索的能力忽略所有黑色的T，但此后必须一个接一个，或者序列地，考察白色的符号。这种经验可以跟你在环境中找到一些既是红色又是圆形的东西相比较。前注意加工允许你迅速地找到红色的或圆形的东西——前注意加工允许对你的周围进行指向性的搜索(guided search)(Wolfe，1994；Wolfe & Gancara，1996)。然而，这时你必须单独注意每个客体，确定它是否与两种特征——圆形和红色——的结合相匹配。 ![](https://box.kancloud.cn/2016-08-14_57affd9bdd8c0.jpg) 图5.11 注意和视觉搜索（A）找到一个有一显著不同特征的客体，你可以用平行搜索。（B）找到一个棊于特征组合的客体，你必须使用序列搜索。（C）因为用了平行搜索，对于只有少量干扰项和更多干扰项的刺激而言，搜索时间是没有差异的。（D）用序列搜索，干扰项数目的多少会产生差异。D中的搜索比B中的捜索要快。 □□ 研究者们通过确定在干扰项数量的作用下发现目标的难度来认识平行搜索和序列搜索的差异。假设我们让你从呈现的5个黑色的T中找出白色的T(如图5.11C)与从34个黑色的T中找出白色的T(A)。因为你能用平行加工的方式来完成这项任务，所以在每种情况下会花差不多相同的时间找到白色的T。另一方面，当你从图形的B部分移到D部分时，会感觉到在D部分的时候会更快发现白色的T。你必须序列地对每个白色的单元进行注意，所以每个白色单元（直到你找到那个正确的目标）会单独地增加搜索时间。研究者们可以用这种逻辑来发现前注意加工的知觉世界的其他方面。看图5.12。在A部分，试着找出有黄色和蓝色的目标。在B部分，试着找出有蓝色窗户的黄房子。是不是第二种任务更简单？当两种颜色被组织成部分和整体时，成绩受额外干扰项的影响就会小得多（Wolfe et al.，1994)。这证明前注意加工为你在环境中寻找客体提供了相当程度的帮助。我们现在从对单一特征的加工转换到对整个客体和情境的知觉上来。 ![](https://box.kancloud.cn/2016-08-14_57affd9bf3c6a.jpg) 图5.12 对两种颜色组合的搜索（A）寻找黄蓝相间的目标。（B）寻找有蓝色窗户的黄房子。（A）当组合发生在一个目标的两个部分的颜色之间时，搜索是非常低效的。（B）但是，当组合发生在一个整体目标的颜色和它的一个部分的颜色之间时，搜索却是非常有效的。(见彩插） ■小结你选择性地注意环境中的刺激，或者是因为你选择这样——目的指向选择——或者是剌激的某些方面吸引了你的注意——刺激驱动吸引。注意的过滤器理论把智力看成是有限的资源。非注意信息很少能进入意识觉知。前注意加工允许你发现环境中那些能用单一明显特征辨认的客体。 ■知觉中的组织过程想像一下，如采你不能够把来自几百万个视网膜感受器输出的有用信息放到一块儿组织起来，这个世界将会多么混乱不堪。你或许看过万花筒里没有联系的颜色块在眼前晃动和旋转。把感觉信息组织到一起使你有连续的知觉的过程总称为知觉组织过程。你已经看到，个体由于这种知觉组织的结果而经验到的东西被称为知觉的对象。例如，你对图5.13中的二维几何设计的知觉可能就是三排倾斜的图形，第一排由正方形组成，第二排由箭头组成，第三排由菱形组成。这看起来可能并不特别——但是我们已经在本章中提到，知觉的所有表面上毫不费力的方面都是由熟练的加工轻松完成的。我们将在这个章节讨论的多数组织过程是由格式塔理论家最先描述的，他们指出你知觉到什么依赖于组织原则，或者说你知觉图形和形式的简单规则。 ![](https://box.kancloud.cn/2016-08-14_57affd9c14e1f.jpg) 图 5.13二维几何设计的知觉你对这个几何设计的知觉是什么？ ![](https://box.kancloud.cn/2016-08-14_57affd9c28437.jpg) 图：假设你正在这条街道上行驶，发现你开过了你的目的地，必须转向。你的注意会去搜索这个喧闹环境中的什么特征？ ■图形、背景和封闭性为什么你会按自己的方式去知觉图5.13呢？在对这幅图的早期知觉中，组织过程把它划分成图形和背景。图形（figure)是位于最前部的类似客体的区域，背景(ground)被看成是用来突出图形的幕布。在图5.13中，你可能把黑色区域看成是图形，把亮的区域看成是背景。然而，你也可以通过把图形和背景反转而看成不同的刺激图案，这非常像你处理两可的花瓶/人脸图形。为此，你可以试着把白色的区域看成是一张较大的白色的纸，挖了9个孔，通过它们你可以看到一块黑色的背景。把一个图形看成位于背景前面的趋势非常强烈。事实上，甚至当你知觉到的图形其实是不存在的，刺激也会产生这种效应！在图5.14的第一幅图像中，你可能会知觉到一棵杉树突出在背景内，背景是一个包含一些红色圆圈的白色平面。然而清注意，这里并无杉树的形状图形，图形中只有三个实心的红色图形和作为底部的线条。因为红色图形笔直的边界联合的力式暗示了一个实心的白色三角形，你才看到前面的错觉白色三角形。图5.14中的另一图案给你一个错觉：一个完整的三角形叠加在另一个上，尽管它们俩都不是真实存在的。 ![](https://box.kancloud.cn/2016-08-14_57affd9c3cede.jpg) 图5.14 适合你的心理角度的主观轮廓你是否看到到一棵杉树和一个三角形重叠在另一个三角形上？用你的拇指把两角遮住可以使你自己确信三角形并不真实存在。知觉组织过程专门用于区分出图形和背景，以此产生这些主观轮廊。 □□ 在这个例子中，看起来有三个水平的图形/背景组织：白色的杉树，红色的圆形，和在其他东西后面更大的白色平面。注意，你在知觉上把刺激中白色的区域划分成两个不同的部分：白色的三角形和白色的背景。这种划分产生的地方，或者说你知觉到的错觉轮廓（illusory contours)，其实不存在于远距刺激，而仅仅在于你的主观经验。错觉轮廓在1900年首次被提出，但它们的所有秘密至今还没有被研究者揭示（Lesher，1995)。你对这些图形中白色三角形的知觉也证明了另一个很强的组织过程：封闭性。封闭性(closnre)使你把不完整的图形看成完整的。尽管刺激仅仅给你角度，但是你的知觉系统提供了它们之间的边界，使图形成为一棵完整的杉树。封闭性过程表明你具有把刺激知觉成完整的、平衡的和对称的倾向，即使存在空隙、不平衡和不对称时也一样。 ■知觉组织原则在图5.13中，你会知觉到被明显组织成三排的9个图形区域，每排由沿右对角线放置的相同的形状组成。你的视觉系统是如何完成这一知觉组织，又是什么因素控制它呢？组织的难题最早是由格式塔心理学家马克斯·威特海默（1923)研究的。威特海默给观看者呈现由简单几何图形组成的阵列。改变一个因素，观察它是如何影响人们知觉阵列结构的方式，他就能据此阐明一些组织的规律。这些规律中的一些在图5.15中可以看出来。在A部分，有一队间隔相同的图形，它的组织是模糊不清的——你能把它同等地看成是圆点组成的行或列。然而，当稍微改变间隔，使得相邻圆点间的水平距离小于垂直距离，如B所示，你会清楚地看到阵列被组织成水平的行；当改变间隔使垂直距离减小时，如C所示，你会看到阵列被组织成垂直的列。这三种组织一起说明了威特海默的接近律(law of proximity)：在其他条件相同时，最近（最接近的）的元素会被组织到一起。格式塔心理学家把这种结果解释成整个刺激模式以某种方式决定了它本身部分的组织；换言之，整体知觉与仅仅是部分的集合不同。在D中，圆点的颜色代替了它们的间隔而进行变化。尽管圆点间的距离相同，你的视觉系统仍自动地基于颜色的相似把它们组织成行。你看E中的圆点时把它们组织成列是因为大小相似，你看F中的圆点时把它们组织成行是因为形状和朝向相似。这些组织效果可以总结为相似律(law of similarity)：在其他条件相同时，最相似的元素组织到一起。当元素在视野中移动的时候，相似的运动也会产生很强的组织。共同命运原则（law of common fate)指出，在其他条件相同时，朝同一方向运动和具有相同速度的元素会被组织在一起。如果G中每隔一列的圆点朝上运动，如图中标记所示，因为它们在运动上的相似性，你可能会把图像组织成列。在芭蕾舞表演中，一些演员用与其他人不同的方式运动时，也会有这种效果。请记住理查德溥士的观察，当他视野中的一个物体作为一个整体运动时，就会被恰当地组织。他的经验正是共同命运的强烈组织效果的证据。 ![](https://box.kancloud.cn/2016-08-14_57affd9c52954.jpg) 图5.15 知觉组织现象我们根据不同的格式塔组织原则会感知到从B到G的每一个排列都是以特定的方式组织起来的。 ■空间上的和时间上的整合我们目前所提到的所有格式塔规则已经可以使你确信，许多知觉过程都存在以“恰当的方式”将周围环境的碎片整合在一起的过程。然而你通常不能在一瞥之间或者注视时感知整个场景（回忆我们对注意的讨论）。你在给定时间内所能感知的通常只是整个视觉世界有限的一部分，由此向各个方向延伸的许多部分是看不见的。为了获得关于周围环境完整的信息，你必须整合从不同空间位置(即空间上的整合）以及在不同时刻（即时间上的整合）所获得的信息。你可能感到惊讶的是，你的视觉系统不用很费力就能创建一个关于环境每一时刻信息的整合图形。研究表明，对于环境的每一次注视的视觉记忆并没有保留精细的细节(Carlson-Radvansky & Irwin，1995；Irwin，1991；Simons，2000)。事实上，当整个客体从一个位置变到另一个位置时，观察者有时是不能够觉察到的。 ■我们如何知晓？——你刚才看到了什么？在一系列实验中，被试对排列有5件熟悉物体的图片注视两秒钟，大约4秒钟以后，被试观察第二个图片。在一半的试验中，第二个图片与第一个完全相同。然而，如图5.16的A部分所示，另一半试验中第二个图片与第一个不同，表现为三种方式：其中一个物体改变（例如，第一个图片中的订书机被第二个图片中的启钉器所替代），其中两个物体转换它们的空间位置，或者是整个物体集合被放置在新的结构中。要求被试判断这两个图片是否相同。你可以在短暂的思考后想像出这是一个很简单的任务：你怎么会没有注意到订书机已经变成了启钉器？然而，正如图5.16的B部分所表明的，对于物体改变和位置转换的反应正确率远远低于百分之百的正确水平。被试对于一些非常明显的变化是“看不见的”。许多人对这样的结果感到很惊奇。我们怎么会只有如此少的加工资源用以保留场景的细节，以至于我们不能够注意到订书机已经变成了后钉器？部分的答案可能是外部世界本身是一种普遍稳定的信息资源（O'Regan，1992)。对于外部环境中那些保持稳定的信息没有必要存入记忆，这样你就不必加工那些习以为常的东西了。你根据不同状态处埋信息的一个有趣结果是由“不可能”图形所引发的错觉，如图5.17所示。例如，注视每一个拐角和侧面都能够提供物体看起来好像是一个三维的三角的解释（图A)，但是当试图把它们整合成为一个连续的整体的时候，这些细节并不能够正确地结合在一起(图B)。图C具有两个臂，它会在你警觉地观察前变为三个叉子。图D中知觉到的楼梯永远是向上或者向下的。 ![](https://box.kancloud.cn/2016-08-14_57affd9c6fe7e.jpg) 图5.16 变化盲视（A）实验要求被试判断第二幅画面与第一幅画面“相同”还是“不同”。 (B)当物体本身被改变或者两个物体交换时，被试经常不能够觉察到区别。而当整个布局改变时，被试的判断几乎总是正确的。 ![](https://box.kancloud.cn/2016-08-14_57affd9c898c3.jpg) 图 5.17 不可能图形当你观看这些图形的时候，每一次注视都会使你认为这个物体是一个可能的三维物体。只有当你试图去对这些注视位置进行整合的时候，你才会发现物体是不可能的。 ■运动知觉一种的确需要你对外部世界的不同瞥视进行比较的知觉是运动知觉。考虑图5.18中的两幅图，设想这个人静止站立着，而你朝他走过去。他在你视网膜上成像的尺寸会随着你的逐渐靠近而变大，成像增大的速率提供了你向他接近的速度的信息（Gibson，1979)。 ![](https://box.kancloud.cn/2016-08-14_57affd9cbc4e2.jpg) 图5.18 接近一个人当你接近刺激的时候，视网膜成像的尺度会增大。然而假设你现在静止，而有其他物体在运动中。对于运动的知觉就好像形状和方向的知觉一样，通常依赖于一个参照框架。如果你坐在一间黑屋子里注视一个静止的光点，在光点外面有一个缓慢来回运动的矩形时，你会感知到光点是在一个静止的矩形中来回运动。即使当你的眼睛绝对静止地注视着那个光点时也会有这种错觉，即诱导运动（induced motion)。此时你的运动探测细胞根本不会对静止的光点反应，而会对运动的矩形线条产生相应的神经冲动反应。看到运动的光点是需要一些更高层次的知觉组织的，因为光点及其假设的运动是以矩形提供的参照框架而感知到的。看起来视觉系统有一种强烈的趋势把一个较大的、包围的图形作为一个较小的、被包围的图形的参照框架。你可能经历了诱导运动许多次却没有意识到它。月亮（几乎是静止的）经常看起来好像是穿过云层在运动，而实际上是云层在月亮前运动。周围云层所诱导的对月亮的运动感知和矩形对光点的作用一样（Rock，1983，1986)。你是否曾经坐在一列缓慢启动的列车上？站台上的立柱或者旁边静止的列车是不是看起来好像都在向后运动？ ![](https://box.kancloud.cn/2016-08-14_57affd9cd5f56.jpg) 图：是什么使你知道本图中的主角在运动？运动的方向如何？另一种运动错觉揭示了更高层次的对运动知觉的组织过程，被称为似动(apparent motion)。似动的最简单的形式就是φ现象（phi phenomenon)，当视野不同位置的两个光点以大约每秒4到5次的频率交替出现就会发生这种现象。这种效应还会出现在室外的广告牌和迪斯科灯光照明中。当这种交替的速率相对较慢的时候，就好像是单个光点在两个位置之间来回移动。这种运动从第一个点的位团里到第二个点的位置有很多的路径，然而人类观察者通常只能看到最简单的路径，那就是一条直线（Cutting & Proffitt，1982；Shepard，1984)。然而与交替呈现给观察者一个运动中的人体画面时，这种直线规则就被打破了，因为视觉系统按照正常的生物学运动方式进行填充（Shiffrar，1994；Stevens et al.，2000)。 ■深度知觉到目前为止，我们考虑的只是平面中的两维图形。然而，我们每天所感知的却都是三维空间中的物体。感知所有三个维度空间对于你接近所想要的东西（例如有趣的人物和美味的食物），以及躲避危险（例如高速行驶的汽车和下落的钢琴）是绝对重要的。这种知觉就需要精确的关于深度（从你到物体的距离）和方向的信息。你的耳朵可以帮你确定方向，但它们却不能够帮你确定深度。当你思考深度知觉的时候，要谨记视觉系统必须依赖视网膜成像，而它却只有两个空间维度——垂直和水平。为了阐明两维的视网膜如何完成三维的工作，考虑图5.19中的情况。当一个处于a点位置的光斑刺激视网膜，你怎么能够知道它是否来自a1或者a2?事实上,它可以是来自直线A上的任何一点，这是因为来自那条直线上任意一点的光线都投射到同一个视网膜细胞。同样，直线B上所有的点都投射到视网膜单个点b。更糟糕的是，连接由直线A上任一点到直线B上任一点的直线（例如a1到b2或a2到b1)都会在视网膜上产生相同的像。最终的结果就是你视网膜的像在深度上是不明确的：它可以由许多位于不同距离的任意一个物体产生。 ![](https://box.kancloud.cn/2016-08-14_57affd9cec112.jpg) 图5.19 深度的不明确性直线A上的任意一点投射到视网膜上相同的点a；直线B上的点都投射到点b。而且，任何连接直线A和直线B的线段在视网膜上产生相同的像。你可以从这张图中明白为什么会产生深度的不明确性：处在不同距离的物体在视网膜上产生相同的像。 □□ 图5.5中Necker立方体的两可图形也是由于深度的不确定性造成的。你可以在特定的场景下被愚弄的事实说明深度知觉是需要对感觉输入进行解释的，而且这种解释可能是错误的（如果你曾经打网球时打不到球，你就已经知道了这些）。你对深度的解释依赖于很多关于距离的不同信息来源（通常称作深度线索）——包括双眼线索、运动线索和图形线索。双眼线索和运动线索你有没有想过为什么人会有两只眼睛而不是一只？另一只眼睛并不是备用的，它提供了关于深度的一些最好的和最具说服力的信息。双眼深度信息的两个来源是视差和视轴辐合。 ![](https://box.kancloud.cn/2016-08-14_57affd9d0b137.jpg) 图5.20 视网膜像差视网膜像差随费两个物体之间的深度距离而增加。 □□ 由于双眼的水平距离有2?3英寸，因此它们接收到的外部世界的图像稍有不同。为了让你确信这一点，试着做下面的实验。首先，闭上你的左眼，用右眼校准两个食指，使其与远处某个小物体成一直线，保持一根手指为一臂的距离，另一根手指在脸前方一英尺左右的距离。现在你的手指保持不动，闭上你的右眼睁开你的左眼，同时继续注视远端的物体。你的两根手指的位置发生了什么变化？第二只眼睛并没有看到它们与远处的物体成一直线，而是得到了一个稍有不同的图像。一个物体在两眼中对应的图像在水平方向上的位移称为视差（retinal disparity)。这种不同或差异的大小依赖于物体与你的相对距离，因此它提供深度线索（参见图5.20)。例如，当你交替睁闭两眼时，较近的手指相对较远的手指的位置变化要大。当你用双眼观看外部世界时，所见的大多数物体刺激两眼视网膜的不同位置。如果在两个视网膜上对应的图像差足够小的话，视觉系统能够把它们融合成为某个深度上的单个物体（然而，如果成像分开很远的话，当你交替睁闭双眼时，你实际上看到两个像。)停下来思索一下，我们视觉系统的工作是多么令人吃惊：它利用两个不同的视网膜图像，比较它们相应部分在水平方向上的位移（双眼视差），然后产生一个具有深度的单一物体的整体知觉。视觉系统能够有效地把两个成像之间水平方向上的位移解释为三维世界的深度。其他关于深度的双眼信息来自视轴辐合(convergence)。当两只眼睛注视一个物体时，它们就会在某种程度上向内侧转动（参见图5.21)。当物体非常接近时，例如在你面前几英寸，眼睛必须相向转动很多以保证同样的像落在两个中央凹上。当观察你的朋友先注视一个远处的物体，然后再注视一英尺距离的物体，你可以真实地看到视轴辐合。大脑利用你眼部肌肉的信息来判断深度。然而，眼部肌肉的视轴辐合信息对于深度知觉最多只在10英尺内有效。在更远的距离，角度的差异太小以至于不能够被探测到，这是因为当注视一个很远的物体时，两眼的视线几乎是水平的。 ![](https://box.kancloud.cn/2016-08-14_57affd9d23082.jpg) 图5.21 深度的辐合线索与处于较远距离时相比，一个物体靠近你的时候你的眼睛会更多地发生视轴辐合。你的大脑利用你眼睛肌肉辐合的信息作为深度线索。为了弄清运动是怎样作为深度信息的另一个来源，请做以下的演示。和前面所做的一样，闭上一只眼睛并且使你的两根手指与稍远的某个物体成一条直线。然后把头向一侧移动，同时注视那个远端的物体并保持你的手指不动。当移动头部时，你会看到两根手指都在运动，但是较近的手指看起来相对较远的手指运动得越来越快，注视的物体根本没有运动。这种关于深度的信息来源称作相对运动视差（relative motion parallax)。运动视差提供了关于深度的信息，这是因为当你运动时，环境中物体的相对距离决定了它们在视网膜成像场景中相对运动的大小和方向。下一次乘车旅游时你就会注意到窗外运动视差的原理。远处行驶的汽车看起来比近距离的物体更像是静止的。图形线索如果只有一只眼睛有视力，你就不能感知深度了吗？事实上，对于一只眼睛也有关于深度的进一步的信息。由于它们包括在图片中发现的各种深度信息，因此这种线索被称为图形线索。画家创作出看似三维的图像（在只有两维的纸或画布上）就是利用了图形线索的技巧。当一个不透明的物体阻挡了第二个物体的一部分时，就出现了插入或着遮挡（参见图5.22)。插入给你关于被遮挡的物体要比遮挡物更远的深度倍息。遮挡表面也会阻挡光线，造成作为附加深度信息的阴影。 ![](https://box.kancloud.cn/2016-08-14_57affd9d3686c.jpg) 图5.22 深度的插入线索是什么视觉线索告诉你这个女人是否在栅栏的后面? ![](https://box.kancloud.cn/2016-08-14_57affd9d6079e.jpg) 图5.23 相对大小作为深度线索更加靠近的物体在视网膜上投射更大的像。结果就是当你看到这些相同物体的排列的时候，你把更小的解释为具有更远的距离。 ![](https://box.kancloud.cn/2016-08-14_57affd9d74db7.jpg) 图5.24 Ponzo错觉会聚的线条附加了深度这一维度，因此，距离线索就使得上边的线条看起来比下边的线条更长，即使它们事实上具有相同的长度。 □□ 关于图形信息的另外三个来源都与光线从三维世界投射到二维表面（如视网膜）的方式有关：相对大小、线条透视和质地递变。相对大小包括光线投射的一个基本原则：相同的物体在不同距离时投射到视网膜上的像大小不同。最近的物体投射的像最大，而最远的物体投射的像最小。这个原则被称为大小/距离关系原则。从图5.23可以看出，如果你认为排列的是相同的物体的话，你就会把更小的解释为距离更远些。线条透视是一种同样依靠大小/距离关系的深度线索。当平行线（定义为沿着其长度方向具有相同的距离）向远处延伸时，它们在视网膜上的像会聚为一个点（参见图5.24)。自1425年以来，意大利文艺复兴时期的艺术家首次用绘画中引人注目的深度描述了这一重要事实(Vasari，1568/1967)。在他们的发现之前，艺术家们在绘画中结合了插入、阴影和相对大小等信息，但是却不能在不同深度下展示出物体的真实场景。你的视觉系统对于会聚线条的解释会引起Ponm错觉(也可以见图5.24)。上面的线看起来更长，因为你是根据线条透视把会聚的部分解释为向远处延伸的平行线在这种线索下，你认为上面的线条好像更远一些，因此看起来更长——在视网膜成像大小相同的条件下，更远的物体应该比近处的物体更长。质地梯度能提供深度线索是因为随着表面深度增加，质地的密度会变大。图5.25中的麦地就是一个质地作为深度线索的例子。你可以认为这是大小/距离关系的另一种结果。在这里，组成质地的单元随着距离的增加变得越来越小，而你的视觉系统把这种逐渐缩小的谷物解释为三维空间中更远的距离Gibson(1966，1979)提出，质地和深度的关系是所知觉的环境中一个恒定的变量。 ![](https://box.kancloud.cn/2016-08-14_57affd9d8bc44.jpg) 图5.25 质地梯度作为深度线素的例子麦地是质地梯度作为深度线索的一个自然的例子。注意麦子倾斜的方式，几何设计利用同样的原理。 □□ 现在应该很清楚有许多来源提供深度线索。然而在正常观察的条件下，从这些来源得到的信息会组成一个单一的协同的关于环境的三维解释。你感觉到的是深度，而不是在近距刺激中各种不同的深度线索。换句话说，你的视觉系统自动地利用不同的运动、插入和相对大小作为线索，不需要你的意识觉察就进行复杂的计算，使你得到三维环境的深度知觉。 ■知觉恒常性为了帮助你发现视知觉的另一个重要特性，我们让你用自己的课本做个游戏。把你的书本放在桌子上，然后移动你的头靠近它直到只有几英寸的距离，再把头移回到正常阅读距离。尽管在较近时书本在视网膜上刺激的区域比较远时大得多，你没感到书本的大小保持不变吗？现在把书本垂直放置，试着顺时针倾斜你的头部。当你这样做的时候，书本在你视网膜成像在逆时针旋转，但你没有感到书本仍是垂直的吗？一般来说，尽管你的感受器接受的刺激在改变，但你所看到的世界是不变的、恒定的、稳定的。心理学家把这种现象叫作知觉恒常性(perceptual constancy)。粗略地讲，它意味着虽然近距刺激的性质会随你每次眼睛和头部的运动而改变，但你感知的远距刺激的性质通常是恒定的。尽管刺激眼睛的光线模式的性质存在很大的变化，你感知外部世界物体性质的恒定和稳定对于生存是至关重要的。知觉的重要任务是在视网膜成像发生变化的条件下去发现环境中恒定的性质。我们将看到它在大小、形状和方向等方面是如何工作的。 □□ ![](https://box.kancloud.cn/2016-08-14_57affd9da8136.jpg) 这些壁画的透视具有怎样的说服力？请注意它们创作时间的差异。(见彩插）大小和形状恒常性什么决定对一个物体大小的知觉?你感知一个物体的实际大小一部分是基于它的视网膜成像的大小。然而，用书本进行的演示表明，视网膜成像的大小同时依赖于书本的实际大小和它与眼睛之间的距离。正如你现在知道的，距离的信息从许多深度线索可以获得。你的视觉系统把这种信息与视网膜关于成像大小的信息相结合，产生通常与远距刺激实际大小相对应的客体大小的知觉。大小恒常性(size constancy)是指在视网膜成像大小变化的情况下感知物体真实大小的能力。如果感知物体的大小要考虑到距离线索的话，那么当你被距离愚弄的时候，你也会对大小感到困惑的。在如图26所示的Ames房间发生的错觉，与他4英尺高的女儿坦娅·津巴多相比，6英尺高的作者看起来在房间左面的角落里显得很矮，但在右面的角落看起来是巨大的。产生这种错觉的原因就是你所知觉到的房间是长方形的，而且后面两个拐角和你是相同的距离。这样，你感知坦娅的实际身高在两种条件下都与你视网膜成像的大小相一致。实际上，由于Ames房间创造了一种聪明的错觉，坦娅实际并不在相同的距离上。它看起来是一个长方形的房间，但它实际是由非矩形的表面构建的，并且在深度和高度成不规则角度，正如图5.26旁边的草图所示。由于距观察者只有一半的距离，在右边角落里的任何人都将有一个更大的视网膜的像。（顺便说一句，为了产生错觉你必须用一只眼通过一个窥视孔观察场景——图5.26的照片是最有利的观察点。如果你在观看房间时能够左右运动的话，你的视觉系统就会获得关于这个不寻常的房间结构的信息。) ![](https://box.kancloud.cn/2016-08-14_57affd9dc7cc8.jpg) 图5.26 Ames房间 Ames房间设计成用一只眼通过窥视孔进行观察——照片呈现的是最有利的位罝。Ames房间是由非矩形的表面在深度和高度上成不规则角度构建的。然而，仅仅只从窥视孔观察，你的视觉系统会认为这是一个普通的房间，并且会得到关于坦娅和菲利普·津巴多相对高度的不寻常猜测。 ■生活中的心理学：你如何接住飞行中的球？你是否有过这样的经历：你正站在左内侧的场地内，这时你清楚地听见了球棒击球的声音，并看到一个棒球或垒球急速地向你飞来。接下来你会做什么？你怎么知道应该跑向哪里来接住球？如果你自己从没有在室外玩过的话，可能仍然有机会对其他人精彩的接球而感到吃惊。他或她是如何在恰当的时间到达恰当的位置的呢？知觉科学家有根据地把接住一个飞行中的球描述为一件困难的事情：“球的运动模式本质上表现了所有主要的空间位置，而深度线索直到（球的路径）的最后一部分才会有用”(McBeath et al.，1995，p.569)。然而，人们却很擅长追赶飞出的球。研究者的目标是提供一种理论使得在计算的复杂性与实际的易用性之间搭起一座桥梁。（回忆本章的开始部分，我们最初的目标是帮助你理解知觉过程是如何提供给你简单的错觉的。）哪种视觉线索提供了你找到球的方式？研究者已经提出了两种球在运动中不变的线索（参考前面Gibson关于知觉途径的恒常性的讨论）。一些理论学家提出，接球手在跑动的时候选择其关于球在垂直维度上速度的视觉经验，以保持恒定的路径（Dannexniller et al.，1996)。另一组理论学家认为，接球手在跑动的时候选择其关于球相对背景的角度以保持恒定的路径(McBeath et al.，1995，1996)。研究者如何检验这些理论呢？典型的方法是发射飞行的球，然后对接球手试图接球的过程进行录像。下一个研究步骤是对接球手的反应进行数学函数的拟合，以便获知他们试图对球飞行的视觉经验的哪些方面保持恒定。（可能这时候你感到很幸运，因为你并不需要理解关于如何在真实世界中接到球的知觉问题的数学意义！）研究发现大部分接球手经常把接住球分成两个阶段（Jacobs et al.，1996；McBeath et al.，1996)。第一个阶段是我们已经思考很多的——努力跑到正确的位置。在第二个阶段中，接球手会减速，也可能完全停下来。第二个阶段中，在球快速地接近手套时，使位置和深度线索发生作用。一旦接球手用手套接住球，并没有完全完成任务：他们必须尽可能快的把球掷回场内，试图阻止跑垒者前进或得分。因此，接球手经常一面进行接球的复杂知觉过程，一面还要注意他们环境中重要的信息。你能够从你的学习中抽出一些时间来玩接球的游戏吗？那应该使你获得关于这个特定的知觉问题的你自己的看法。 ![](https://box.kancloud.cn/2016-08-14_57affd9ddef0e.jpg) 图：接球手利用什么视觉线索才能接住飞行中的球？知觉系统推断物体大小的另一种方式是利用具有相似形状物体性质的先验知识。例如，一旦你认出了一座房屋、一棵大树或者一只狗的形状，即便你甚至不知道它离你的距离，你也会知道它们各自有多大。当过去的经验不能够给你相似物体在极远距离的形状信息时，大小恒常性就失效了。当你从摩天大厦顶端向下看行人时就会认为他们很像蚂蚁，这时你就经历了这种困感。这种经验也是我们在本章开始讲的来自赤道非洲的肯基的故事核心。回忆一下肯基，他在茂密的森林生活了一辈子，却不能够理解看到的远处的水牛。在一个不熟悉的知觉环境中，肯基第一次试图把新异的知觉纳入到一个熟悉的情境里，他认为他所看到的那些微小的、远处的斑点是一些昆虫。由于没有在远距离看到水牛的先验经验，他就没有了大小恒常性的基础，就像高速行驶的汽车接近他们，肯基的视网膜成像越来越大，他就产生了动物在改变大小的可怕错觉。我们可以设想，过一段时间以后，肯基再看到它们的感觉就会像人类学家托恩布尔一样了。所获得的知使得他能够对其感觉经验进行合理的解释了。形状恒常性（shape constancy)非常接近于大小恒常性。你能够正确地感知物体的形状，即便当物体处于倾斜的位置，使得视网膜成像的形状与物体本身的形状存在实质的不同时。例如，一个倾斜的矩形在你的视网膜上投射成一个梯形的像；一个倾斜的圆形投射成椭圆的像（参见图5.27)。然而你通常会准确地感知在空间中倾斜的圆形和矩形的形状。当具备一个很有效的深度信息的时候，你的视觉系统能够简单地通过考虑你与它不同部分的距离来确定一个物体的实际形状。 ![](https://box.kancloud.cn/2016-08-14_57affd9df2e56.jpg) 图5.27 形状恒常性当一枚硬币旋转的时候，先是变成椭圆形，然后这个椭圆变得越来越窄，直到变成一个细长的长方形，接着又变成椭圆，然后又是一个圆形。但是，在任何一个方位它都被知觉为一枚圆形的硬币。 ![](https://box.kancloud.cn/2016-08-14_57affd9e142cf.jpg) 图：哪一辐照片更能表达麦当娜最新的音乐录影带被MTV拒绝后的表情？ □□ 方向恒常性当你把头倾斜到一侧看书时，外部世界看起来并没有倾斜；而只有你的头是倾斜的。方向恒常性（orientation constancy)是指在视网膜上的成像发生改变的条件下，你识别环境中真实图形方向的能力。方向恒常性依赖于你内耳中的前庭系统（第4章讨论）——这些信息让你知道自己的头是倾斜的。通过结合前庭系统的输出和视网膜上的朝向，你将能够准确地知觉出物体在环境中的朝向。在熟悉的环境中，先验的知识会提供一些关于物体朝向的附加信息。然而，当一些复杂的、不熟悉的图形以异常的朝向出现时，你可能就不容易识别它们。你能识别图5.28中的图形吗？当一个复杂的图形由几个部分组成时，你必须单独调整各个部分的朝向（Rock，1986)。所以，当你只是把图形中的某个部分旋转了方向，其他部分仍会被知觉为没有旋转：请看这两幅著名歌星表当娜颠倒的画像。你可能可以看出其中一副画像中的眼睛和嘴巴有轻微的变化，但是这两幅图像看起来非常相似。然而，如果将这两幅图像反转过来看，两幅图片看起来则截然不同。其中一副仍然是麦当娜，而另一副则看起来像是一个她母亲都不会喜欢的妖怪。在画像颠倒时，你未能知觉出两个画像的区别，这可能是因为你未能同时将面部的所有部分都颠倒过来。这也是人们长期观看正向的环境和面孔形成的功能。亮度恒常性当你观看图5.29中砖墙的时候，并没有把某些砖块看成亮红色，某些看成暗红色，而是将这些砖块知觉为亮度一样的红色，只是有些砖块被阴影挡住了而已。这就是亮度恒常性(lightness constancy)的一个例子，即人们在不同照明条件下，将物体的白度、灰度和黑度等知觉为恒定的倾向。和前面介绍的其他恒常性一样，在日常生活中，你经常有亮度恒常性的经验。比如说，你穿礼一件白色的衬衫从灯光昏暗的房间里面走到阳光明媚的房间外而。在灿烂的阳光下，衬衫反射的光线要强得多，但是在两种环境中，你会觉得衬衫的亮度是一样的。实际上，之所以存在亮度恒常性，是因为即使物体反射光线的绝对量发生了改变，反射光线的百分比却是基本上恒定的。白色的衬衫反射80%?90%的光线，而黑色的牛仔裤只反射5%的光线。所以在同样的环境下衬衫看起来总是比牛仔裤要亮。在这一部分中，我们介绍了许多知觉组织的过程。在本章的最后，我们将介绍客体的辨认与识别过程，这两个过程给物体和事件赋予了意义。 ![](https://box.kancloud.cn/2016-08-14_57affd9e2fd6a.jpg) 图5.29 亮度恒常性亮度恒常性可以解释为什么你把墙上所有的砖块都知觉为由相同的材料组成。 ![](https://box.kancloud.cn/2016-08-14_57affd9e45205.jpg) 图5.28 被旋转了90度的非洲你认出被旋转了的非洲大陆吗？当一些不熟悉的图形处于一个不寻常的角度时，识别它就变得困难起来。 ■小结由于人们有将图形知觉为位于背景的前面的强烈倾向，所以导致了轮廓错觉。格式塔心理学家们提出了几种知觉组织原则，包括相邻性、相似性和共同命运。知觉加工从外界的每个注视点获取新的信息。在视网膜上刺激的不同模式提供了运动线索。对多个信息源的视轴辐合产生了深度知觉。双眼视差和视轴辐合是双眼深度线索，它们是双眼水平位置的结果。相对运动视差提供了物体间的相对距离。艺术家们利用图示的深度线索，例如插入、线性透视、质地梯度等来使二维画面上产生三维的效果。人们利用距离线索和对熟悉物体大小的经验知觉大小恒常性。形状恒常性是借助于较好的深度信息。朝向恒常性依赖于前庭的感觉和对物体朝向的先验知识。亮度恒常性是由于无论在什么样的照明条件下物体都反射或多或少的相同比例的光线。 ■辨认与识别过程你可以认为前面所讲的所有知觉加工都提供了远距刺激合理且比较准确的物理特性——物体在三维世界中的位置、形状、大小、情境、颜色等。然而，如果仅仅是知觉过程，你还是不知道这些物体是什么，不知道是否曾经见过它们。你感觉像是来到了一个外星球，所有的东西对于你来说都是陌生的，不知道吃什么，穿什么，远离什么东西，以什么来记时，正是由于你能够识别和辨认大多数以前曾经见过的东西，所以不会觉得所在的环境是陌生的。所以是辨认与识别给知觉对象赋了意义。 ■自下而上的和自上而下的加工在识别一个物体时，你要把所看到的东西与存储的知识进行匹配。从周围的环境获取感觉信息，然后将这些信息发送给大脑以抽取并加工相关的信息，这就是自下而上的加工过程。自下而上的加工（bottom-up processing)与经验事实密切相关，它处理一定量的信息，并将外界刺激的具体物理特征转化为抽象表征。这种类型的加工也被称为数据驱动的加工，因为这种加工开始于外界的感觉信息——数据。然而，在许多情况下，你可以利用已经掌握的环境信息来帮助知觉识别。例如，当去参观动物园的时候，你知道在那里更可能见到一些在其他地方见不到的动物，比如在那里会比在自己家后院更有可能看到老虎。你的期望影响了你的知觉，这种现象就是自上而下的加工。自上而下的加工(top-down processing)包括过去知觉环境的经验、知识、动机和文化背景等。由于自上而下过程的存在，使得高级的心理过程会影响对事物和事件的理解。由于记忆中存储的概念影响对输入信息的解释，自上而下的加工也被称为概念驱动（或者是假设驱动）的加工。自上而下的加工的重要性可以在droodles画中体现出来（Price，1953/1980)。如果没有旁边的注解，这些画没有任何意义，但是，一旦这些画被辨认出来，你就很容易发现其中的意义(如图5.30)。 ![](https://box.kancloud.cn/2016-08-14_57affd9e56a4e.jpg) 图5.30 Droodles 以上两幅上画的是什么动物？（A)是一个鸟抓住一只很强壮的蜗虫；（B)是一只长颈鹿的脖子；你能看得出来吗？虽然在你得到一些可用的信息之前，你无法识别它们，但你可能觉得两幅图画上的东西看起来很熟悉。我们还可以从语言知觉这个领域中获得更多的关于自下而上和自上而下加工的例子。比如说你无疑有过在一个很吵闹的聚会中与别人交谈的经验。在那样的吵闹环境下，很有可能并不是你发出的每个物理信号都准确无误地到达对方的耳朵里。周围的咳嗽声，吵闹的音乐声，或者是响亮的笑声等因素肯定会遮蔽你说的某些话。尽管如此，人们却很少觉察到声音信号的中断，这种现象叫做音素重建（Warren，1970)。正如我们在第11章所讲的那样，音素是语言中最小的意义单位，音素重建的发生正是因为人们利用了自上而下的加工将丢失的音素补充完整。听者往往很难说出到底他们是听到了部分原始语音被噪音所替代的词还是听到一个夹杂着噪音的完整的词（如图5.31的A部分)(Samuel，1981，1991)。如图5.31B部分所示，自下而上和自上而下的过程共同作用来完成音素重建过程（McClelland & Elman，1986)。假设在一个吵闹的聚会上，朋友对你说的话含糊不清，你听到的句子是“I have to go home to walk my (noise) og.”虽然噪音盖住了/d/音，但是你可能还是认为实际听到的是dog这个单词。为什么呢？如图5.31，两类信息与语音知觉相关联，一种是单个单词，另一种是组成单词的语音（sounds)。当/o/和/g/这两个语音到达该系统时，它们以自下而上的方式把这些信息提供到词的水平。这提供了你的朋友所说单词的几种可能。然后自上而下的加工开始发挥作用，根据整句话的情景，你推断出“dog”是放可能的单同。但是当整个过程——对一些候选词自下而上的辨认和自上而下的选择——发生得足够迅速时，你就不会意识到/d/的丢失，而是觉得听到了完整的单词（Samuel，1997)。当下次在吵闹中的环境时，你会因为自己的知觉加工速度如此有效而感到高兴的。 ![](https://box.kancloud.cn/2016-08-14_57affd9e693cc.jpg) 图S.31音素重建 (A)即使在某个语音被噪音所代替时，听者似还是听到了丢失的那部分语音。（B)在这个例子中，当你的朋友说dog这个词时，噪音遮蔽了/d/音，根据耳朵从周围环境获得的信息，你的知觉系统得出几个假设，即你朋友说的那个单词可能是：dog、log、fog等。然后，根据自上而下的情境所提供的信息——“I have to go home and walk my...” 可知你的朋友说的应该是dog。图5.32的画像是最后一个自上而下加工的例子。如果他们的名声消逝得不太快的话，你应该能够认出他们。但是他们长得真像图中所画的那样么？或许不是，至少在他们名望很高时不是这样。你对这些漫画的识别能力说明你对世界的知觉不仅仅是依靠由感受器获得的自下时上的信息。你所具备的整合已有知识和所见图画的能力，使你能够识别出这些夸张的漫画是埃迪·堪菲（Eddi Murphy)和希拉里·克林顿（Hillary Clinton)。事实上，有研究表明，由于突出了一些与众不同的特征，漫画比精确的画像更容易被识别（Mauro & Kubovy，1992；Rhodes et al.，1997)。 ![](https://box.kancloud.cn/2016-08-14_57affd9e7fba4.jpg) 图5.32 是什么让你能够认出这两个名人的？你能认出这两个人吗？由于你以前认识这两张面孔，所以利用自上而下的信息，你能够从这些漫画中恢复这两个人的真正面孔。 ■物体识别从语音知觉的例子中，研究者得出一个用于研究自下而上再认加工的一般方法：研究者尝试确定知觉系统用以识别知觉整体的各个组成成分。对于语言加工来说，语音知觉加工整合语境信息的语音来识别个别单词。那么你使用哪些基本单元来构造对外界客体的表征呢？例如，你如何将--个灰色的、形状古怪的、大小适中的、满身都是毛的东西确认为猫？假定原先在你的记忆中有对猫的表征，那么识别过程就是将知觉到的信息与记忆中的表征进行匹配的过程。但是，这些匹配过程是怎么完成的？一种可能是记忆表征包含对整个物体的各个组成部分及其相互关系的表征（Marr & Nishilara，1978)。比德尔曼（Irving Biederman) (1987；Hummel & Biederman，1992)认为所有的物体都是由一系列的几何离子或儿何子（geometricalions，orgeons)组成。几何子不是一些大的或者是任意的图形集合。比德尔曼认为，根据“每个三维的几何子都在二维的视网膜上产生独特的刺激模式”这个原则可以确定36个几何子。这种独特的规律使得可以从视网膜上的感觉刺激逆向推出外界的客体是什么。图5.33是一些标准的部分如何组成各种物体的例子。研究者证明这些几何子在物体识别中确实有一定的作用。他们呈现给被试一些不完整物体的图片，其中的几何子完整或破损（Biederman，1987；Biederman & Cooper，1991)。如图5.34所示，左边第一列是一些普通物体的线条画。中间一列是相同的物体，虽删掉了部分信息，但你仍能识别其中的几何子及其相互关系。最右边的一列则同时删掉了关于几何子及其相互关系的信息。你是否同意识别最右边一列中的物体比较困难？这些比较说明，人们可以根据不完整的信息识别物体（如你能恢复丢失的音素），然而一旦某些关键成分被破坏，那么就很难识别出整个物体。但是，仅仅有完整的各个部分的信息，并不总是足以识别出物体（Hayward & Williams，2000；Tarr，1994)。如图5.35所示，困难之一是人们经常从不同的角度来观察同一个物体。从不同的角度看，物体同一个部分的外观看起来相当不同。所以你需要将标准局部各个角度的表征都存储起来。当你观看一个物体时，要在心理上对其知觉进行转换并与记忆中的表征进行匹配。所以识别出一个灰色的、形状古怪的、大小适中的、满身都是毛的东西为猫必须要将各个几何子适当地并从某个特定的角度组合。 ![](https://box.kancloud.cn/2016-08-14_57affd9ea0384.jpg) 图5.33 基于成分的识别三维物体的组成部分及其结合。A部分中的三维物体都是由大小不同的圆柱体组成的。B部分中的物体是由各种不同的组成成分结合而成。 ![](https://box.kancloud.cn/2016-08-14_57affd9eb6a2c.jpg) 图5.34 部分在物体识别中的作用中间一列：被删除的视觉信息并没有影响组成成分的完整性；右边一列：被删除的部分则影响了组成成分的完整性。你是否觉得中间一列更容易识别。 ![](https://box.kancloud.cn/2016-08-14_57affd9f0f32d.jpg) 图5.35 从不同的角度观察同一个物体从不同的角度观察同一个物体时，看到物体的不同部分。为了克服识别的困难，需要在记忆中存储物体多个角度的表征。 ■情境和期望的影响另外，发现一个灰色的、形状古怪的、大小适中的、满身都是毛的东西经常出现在你家也能帮助你识别这是一只猫。这是一个自上而下的加工过程：期望会影响你假设环境中物体是什么。你适否曾经有过这种经历：发现你认识的人出现在你认为他不会出现的地方，比如说出现在另外的城市或者是另外的社团里？在这种情况下，你需要更长的时间去识别他们，有时你甚至不敢相信他们就是你认识的那些人。这并非因为他们的样子变了，而是他们出现的场合、情境是你期望不到的。物体被识别的空间和时间情境是一种重要的信息来源，因为从这些情境中，你产生一种期望，期望哪些东西你可能见到和哪些你不可能见到。知觉识别取决于期望和物体的物理特性。物体识别是一个构造和解释的过程。根据已有的知识、所在的场所、周围的环境等因素的不同，识别出的物体也会有所不同。比如下面的单词： ![](https://box.kancloud.cn/2016-08-14_57affd9f24daa.jpg) 是不是THE CAT?然后再看看这两个单词各自中间的那个字母。它们的物理特性完全是一样的，但是在第一个单词中，你将它识别为H，而在第二个单词中则将它识别为A。为什么？很明显是你的英语知识影响了你的知觉。由T_E所构成的情境使得那个字母史可能是H而不是A，而C_T所构成的情境则相反（Selfridge，1955)。研究者常通过对定势的研究来证明情境和期望对知觉和反应的影响。定势（set）是指准备好以某种特定的方式对某刺激进行知觉或反应。定势有运动定势、心理定势、知觉定势等三种。运动定势是指准备好做一个事先设定好的快速反应。一个赛跑运动员被训练得具有很好的运动定势，就是在听到起跑的枪声后尽可能快地起跑。心理定势是指准备好根据规则、说明、期望或者是习惯倾向等来处理某些问题，比如问题解决任务或游戏。当原来的规则在新的情境中不适用时，心理定势实际上是会妨碍问题解决的，这一点在第9这中也会讲到。知觉定势是指准备好在特定的情境中知觉到特定的刺激。例如，一个新妈妈常常会有一种知觉定势，就是总觉得听到她孩子的哭声。定势常常会引导你改变对两可刺激的解释。比如下面两列单词： FOX；OWL;SNAKE；TURKEY；SWAN；D?CK BOB；RAY；DAVE；BILL；HENRY；D?CK 当你读以上两列单词时，你会认为两个D?CK分别是什么？如果你认为第一个应该是DUCK、第二个应该是DICK，那么这是因为这一列单词让你产生了一种定势，从而引导你以某种特定方式在记忆中寻找合适的词。注解也会提供一种能够产生对两可图形的知觉定势的情境。比如前面说过的将droodles知觉为有意义的物体。又比如，请仔细看图5.36A，然后让你的一个朋友看图5.36B，接着，你们俩同时看图5.36C，这时你们俩分别看到了什么？前面那两张带有注解图形对你们知觉后面的那张没有注解的两对图形有没有影响？多找几个朋友来重复这个实验，看看有没有什么一致性的差异。情境对知觉的影响需要你的记忆以某种形式组织，使得在适当的时间，与特定情设相联系的信息能够被利用。换句话说，要产生适当或不适当的预期，必须利用你已有的知识。有时候记忆看到的东西和眼睛看到的东西一样多。在第8章中，我们将讨论记忆的这个特性，即记忆是如何使情境影响知觉的。 ![](https://box.kancloud.cn/2016-08-14_57affd9f37ac8.jpg) 图5.36A 一个年轻漂亮的女人 ![](https://box.kancloud.cn/2016-08-14_57affd9f4fc0a.jpg) 图5.36B —个老女人 ![](https://box.kancloud.cn/2016-08-14_57affd9f6b74a.jpg) 图5.36C 你看见了什么？ ■最后的复习为了巩固你在这一章中所学到的东西，请看图5.3的流程图，你现在已经具备必要的知识来理解整个流程图。图5.3中的测验同时也提供了一种学习知觉知识以后的重要复习，那就是对某个刺激事件的知觉反应是人的整体反应。除了你的感觉器官接受的信息以外，你对刺激物的最终知觉还依赖于你是谁、你和谁在一起、你的期望、需求和价值观等。一个知觉者通常要扮演两个不同的角色，就是赌徒和内部设计者。作为一个赌徒，知觉者打赌现在所看到的东西能够用以前掌握的知识和个人经验来解释。作为一个很强的内部设计者，知觉者在坚持不懈地重新安排各种刺激，使得他们之间更加协调和连续。为了获得清晰的和一致的知觉，就要拒绝不协调的和混乱的知觉。如果知觉完全是自下而上的过程，那么你将会被一些此时此地的、普通的、具体的事实所约束。你能够将经验登记起来，但是对以后没有什么用处，在不同的环境下你看到的世界不会是不同的。然而，如果知觉加工只有自上而下的过程，那么你将会迷失在你所想像的和你所期望的世界中。两种加工过程的适当平衡才能完成基本的知觉目标：以生物的人和社会的人的需要方式去体验外部世界，并适应周围的物理和社会环境。 ■小结辨认与识别过程包含自下而上和自上而下两种加工，它们共同作用以获得对世界一致的理解。物体识别开始于将物体分解为一些部分或者是几何子。对各个部分的知识必须结合具体观察角度的知识，才能最终识别物体。物体所在的时间和空间情境使得人们产生一定的预期，从而影响人们识别物体的能力。通过对定势的研究，研究者证明了情境对知觉的影响作用。要点重述 ■感觉、组织、辨认与识别 ·知觉系统并非简单地记录外界世界的信息，而是主动地组织和解释这些信息。 ·知觉过程包括三个阶段：感觉阶段、知觉组织阶段及辨认与识别阶段。 ·在感觉加工阶段，物理信号被接受并被转化为神经信号和感觉经验。 ·在组织阶段，知觉加工把感觉信息组织为一致的图形并产生客体和模式的知觉。 ·在辨认与识别阶段，把对客体的知觉与记忆中的表征比较，然后识别客体并赋予意义。 ·知觉的任务是从包含近距（感觉）剌激的信息中确定远距（外界）刺激是什么。 ·当相同的感觉信息可以被组织为不同的知觉时，会产生模糊现象。 ·知觉错觉的知识会约束一般的知觉加工。 ■注意过程 ·注意是指你能够选择部分感觉输入而忽略其它的感觉输入。 ·你的目标和物体的特性同时决定你把注意放在哪里。 ·未被你选择的信息对你的即时经验影响很小。 ·前注意加工使你能够在视觉环境中有效地搜索。 ■知觉中的组织过程 ·组织加工提供与感觉输入一致的知觉。 ·这些过程将知觉组织成图形和背景。 ·人们倾向于将不完整的图形知觉为完整的图形，将相似的物体组织在一起。 ·人们对部分的组织和解释与特定的时空情景相关。 ·无论实际的感觉刺激如何，人们都倾向于将参照系知觉为静止的，而其中的刺激视为运动的。 ·视觉系统运用物体的大小、距离等信息来将视网膜上的二维信息转化为三维的信息。 ·人们倾向于将物体知觉为大小、形状、朝向和亮度是不变的。 ■辨认与识别过程 ·在知觉加工的最后阶段——辨认与识别阶段，通过结合自上而下和自下而上的加工赋予知觉对象意义。 ·知觉同时依赖于感觉刺激、已有的知识和期望。 ■关键术语模糊性似动注意自下而上的加工封闭性视轴辐合双耳分听远距刺激图形格式塔心理学目的指向选择背景指向性的搜索辨认与识别错觉错觉轮廓诱导运动共同命运原则接近律相似律亮度恒常性方向恒常性知觉知觉恒常性知觉组织 φ现象前注意加工近距刺激相对运动视差视差定势形状恒常性大小恒常性刺激驱动捕获生态光学理论自上而下的加工无意识推理