Archive for the ‘学术理论’ Category

《惊人的假说》第四章视觉心理学

Monday, April 17th, 2006

“当我们追溯心理学发展的历史时,我们就会陷入空想、矛盾和谬误与某些真理交织在一起的迷宫之中。”

——托马斯·里德(Thomas Reid)

我希望我已经说服了你,看并非如你想像得那样简单。看是一个建构过程,在此过程中,大脑以并行的方式对景物的很多不同“特征”进行响应,并以以往的经验为指导,把这些特征组合成一个有意义的整体。看涉及大脑中的某些主动过程,它导致景物明晰的、多层次的符号化解释。

我们现在要考虑的是,当我们观看物体、它与我们及其他物体的相对位置以及它的形状、颜色、运动等某一属性时,大脑必须执行的某些基本操作。也许,我们应该认识到的最重要的一点,就是视野中的物体并不像你看到的那样。每个物体并非以清楚和确定的方式做了标记,你的大脑必须使用各种线索,使景物中对应同一物体的各个部分整合在一起。在现实世界中,这并不是一件容易的事情。物体可能部分被遮挡或是呈现在易于混淆的背景之中。

举个例子就会较清楚了。请看图5中的这张照片。你会毫不费力地立刻看出,这是一张正在注视窗外的年轻女子的面孔。但仔细观看就发现,窗户的木窗棂将该女子的面孔分成了四部分。但是,你并没有把它看成是四个不同人脸的四个分离的片断。你的大脑将它们组合在一起,解释为一个单一物体——被面前的木窗棂部分遮挡的一张面孔。这一组合是怎样完成的呢?

这便是格式塔心理学家马克思·沃特海默(Max Wertheimer)。沃尔夫冈·科勒尔(Wolfgang Kohler)和库尔特·科福卡(Kurt Koffka)的主要研究兴趣之一。这场运动于1912年前后在德国兴起,并在美国结束。纳粹掌权后,他们三人全部离开德国。我的词典将“格式塔(gestalt)”定义为“一个各部分之间相互影响的有机整体,而整体大于各部分之和。” name="a2" id="a2">换句话说,你的大脑必须根据你以往的经验和你的基因中所体现的远古祖先的经验,通过发现各个部分的最优组合,主动地构造这些“整体”。这种组合最有可能对应于真实世界中某个物体的有关方面。很明显,重要的是各部分之间的相互作用。格式塔学派试图对视觉系统共同的相互作用类型进行分类,并把它们称为知觉定律。他们的组合定律包括接近性、相似性、良好的连续性和封闭性。下面让我们依次对它们进行讨论。

接近律说明,我们倾向于将那些相互靠得很近且离其他相似物体较远的东西组合在一起。这在图6中就看得很明显。该图由许多规则的矩形阵列小黑点组成。你的大脑既可能将它们组织成水平线也可能组合成垂直线。但实际上,你把它们看成是垂直线。这是因为,一个点到其最近点的距离,在垂直方向要比水平方向短。其他实验显示,接近律通常指“空间上接近”,而非在视网膜上的接近性。

格式塔的相似律是说,我们将那些明显具有共同特性(如颜色。运动、方向等)的事物组合在一起。如果你看见一只正在跑的猫,你就会把它身体的各个部分组合在一起。因为一般来讲,当猫跑时,它的各个部分会在一个方向上运动。同样原因,正在树丛中爬行的猫也会被识别出来。但是,如果它纹丝不动,我们就很难发现它。

良好的连续性定律可以由图7加以说明。该图的上部分显示两条相互交叉的曲线。我们的确把它看成是两条线,而不是像该图的下部分所显示的那种交汇于一点的四条线或是两个靠近的V型。我们同样倾向于把中断的线段看成是被某个物体遮挡一部分的连续直线。

请看图8a所表示的一组八个奇形怪状的物体。中间两个与字母Y类似,另外六个为扭曲的箭头。而在图8b,你大概会看到一个被三个斜条遮挡的三维立方体框架。现在,那些奇形怪状的物体已成为上下两图的组成部分。第二个图形中更容易看成是立方体,因为它似乎是一个被斜条遮挡的单一物体。而第一个图形,由于缺少任何遮挡线索,因而更容易被看成是八个独立的物体。

封闭性在线画图形中表现得最为明显。如果一条线形成了封闭的或几乎封闭的图形,那么我们就倾向于把它看成是被一条线包围起来的图形表面,而不仅仅是一条线。 name="a4" id="a4">

格式塔学派还有一个被称为“简洁”(Pragnanz)的普遍原理,它可以近似地被译为“优良性”。它的基本思想就是视觉系统对输入的视觉信息作出最简单、最规则和具有对称性的解释。大脑如何判断哪个解释“最简单”呢?现代的观点认为,最好的解释往往只需要很少的信息(在技术意义上)进行描述,而坏的解释往往需要更多的信息。 name="a6" id="a6">

换句话说,大脑需要一个合理的解释而不是奇特的解释。这就意味着,这种解释不因观察点的微小变化而发生根本改变。这是由于,在过去当你看一个物体时,你常常在景物中运动,因此,你的大脑已经把该物体的各个不同方面记录了下来,并认为它们属于同一个事物。

格式塔知觉定律不能看作是严格的定律,而只能算是一种实用的启发式研究。因此,它们可以作为视觉问题的合适的人门知识。真正哪些操作过程导致了这些“定律”的出现,这正是众多视觉心理学家试图发现的东西。

正如格式塔学派已经认识到的那样,视觉中的一个重要操作就是图形背景分离。要识别的物体称为“图形”,其周围环境称为“背景”。这种分离也许并不总是轻而易举的事,仔细观察图9你就会知道,如果你从来也没有看到过这幅图,你会很难看出有什么可识别的物体。但过了一会儿,你就有可能意识到,图画的一部分代表一只达尔马提亚(Dalmatia,南斯拉夫地名)狗。在这种情形,图形背景的分离被有意复杂化了。

还可能构造一幅模棱两可的图形背景分离图像。请看图10。第一眼看来,它像一个花瓶,但继续观察就可能看成是两张脸的侧视图。本来花瓶是图形,而现在人脸的轮廓线成了图形,原先的花瓶就成为背景了。但是,这两种解释很难在同一时刻看到。

大脑在决定哪些视觉特征属于某个物体时,要依赖于大体上符合格式塔知觉定律的明显的视觉线索。因此,倘若一个物体较坚实(接近性)、具有明确的轮廓(封闭性)、朝一个方向运动(共命运),而且整个为红颜色(相似性),那么,我们就很可能认为这是一个运动的红球。

对一个动物来说,出色地完成此类任务是至关重要的。否则,它就很难发现天敌或猎物以及苹果之类的其他食物。它必须能把图形和背景分离开来。所谓的伪装物就是试图混淆这一过程,伪装的作用是破坏表面的连续性(如战士穿的迷彩服),并产生一个易于混淆的轮廓,从而使真实的轮廓伪装起来。颜色也可能与背景混杂在一起。一只蹑手蹑脚移动的猫不时地停下来,就是为了避免给猎物提供任何运动线索。正如有人所认为的那样,我们由进化获得的良好的颜色视觉,使我们的灵长类祖先能够在纷乱的绿色背景中发现红色的果实。能给我们带来众多视觉乐趣的东西,可能就是最初发现食物和识破伪装的装置。

我们对最早阶段视觉加工知识的了解,部分来自于对眼和脑的研究(参见第十章)。需要执行的最早操作差不多是去除冗余信息。眼中的光感受器对落人眼睛的光强起反应。假如你观察一面完全均匀而光滑的白墙,那么你眼内的所有光感受器将会对光作出同样的反应。有什么理由将所有这些信息传递给大脑呢?对眼底视网膜来讲,最好是先对这些信息进行处理,使大脑知道哪里是空间上光强变化的地方——墙的边缘。如果整个视网膜区域没有光强变化,那么就不发送任何信号。大脑从“无信号”就可以得出“无变化”以及墙的这一部分是均匀的推论。

正如我们在后面章节将会看到的,在某种程度上,大脑对不同类型信息的处理是在不同的平行通路中实现的。因此,对如何观看形状、运动、颜色等过程分别进行研究是有道理的,尽管这些过程具有某种程度的相互作用。

让我们先从形状开始,很明显,抽提轮廓对于大脑非常有用。这就是为什么我们对线条图能如此容易地产生反应的原因。即使没有任何阴影、纹理、颜色等特征,你仍然可以对某景物的线条图形作出解释(如图11)。这说明,大脑中某些元素对精细的细节有较好的反应,另外一些对细节较少的部分起反应,而其他元素则对空间上的粗略变化起反应。你如果仅仅能看到后者,这世界就会模糊得像焦距没调准一般。心理学家常使用“空间频率”一词。高空间频率相应于精细的细节,低空间频率对图像在空间上的缓慢变化起反应。

请看图12。你很可能将它看成是具有均匀灰度的一些小正方形的组合体。现在,如果把它弄模糊(摘掉眼镜、半闭着眼睛或将它放到房内的远处),你就可能认出是林肯的面孔。图的细节(小正方形的边缘)干扰了识别过程。当视觉变得模糊时,这些细节就不那么显眼了。这时,尽管由于图像中只有较低的空间频率信息,因此图像仍然有些模糊,但是你却能认出他的面孔了,当然,一般说来,不论低空间频率或高空间频率对解释图像都有帮助。

大脑面对的最为困难的问题之一,是从二维图像中抽提深度信息。我们需要深度信息,不仅是为了确定物体与观察者之间的距离,而且还要识别每个物体的三维形状,使用两只眼睛是有帮助的。但常可利用一只眼睛或看它的照片就能看出它的形状。大脑使用哪些线索从二维图像中获得三维信息呢?一个线索就是由入射光的角度产生的物体阴影。请看图13。你可能将其中的一排看成是平面上的四个凹陷物,而将另外一排看成四个突起物。这样的深度印象就来自人射光的阴影。

偶尔,这种解释也可能是模棱两可的。凝视一会儿该图或者将页面倒置,你就会把凹陷看成突起,或把突起看成凹陷(注意,这种变化是同时发生的)。你的大脑最初认为,照明光来自某一侧,但倘若照明光实际来自另一侧,那么同样的阴影就会对应不同的形状,正如你所看到的那样。

另一个令人信服的线索是“从运动恢复结构”。这是说,如果一个静止物体的形状难以看清楚(经常是由于缺少某些三维形状线索),那么稍微转动一下该物体就容易识别了。在讲课时,如果把一个由小球和辐条制成的复杂分子的模型投影在屏幕上,就不易理解。但如果播放它的转动模型的电影,其三维形状就会一目了然。在电视节目《生命的故事》的片尾,你可能看到过这种情景。在那里,DNA分子的模型随空中的音乐而旋转。

要进行三维观察,只看三维空间中的每个物体是不够的。你还必须观看三维空间的整个场景,以便弄清楚哪些物体离你近,哪些物体离你远。即便是二维图像也存在两种很强的深度线索。

第一个线索是透视,它可以用埃姆斯变形房间(因发明者阿德尔伯特·埃姆斯(Adelbert Ames)而得名)进行生动的演示。这种房间只能用单眼从外部通过小孔去观察。这样,就可以排除任何立体视觉线索。这个房间看起来像个长方体,但在实际上它的一边很长。与正方形房间相比,它的一个墙角要高得多,也离我们远得多。当我在旧金山“探索者博物馆”(Exploratorium)通过小孔观看这样的房间时,我看见一些在房间内跑来跑去的小孩。在房子的一侧他们显得很高(因为这时他们离我很近),而在另一侧则显得很矮(这时他们离得很远)。当他们从一边跑到另一边时(实际上是从近处墙角跑到远处墙角,再跑回来),他们的大小会发生惊人的变化。我当然明白,孩子们是不可能通过这种方式改变身高的。但这一错觉是如此逼真,使我无法立刻摆脱它。每个孩子的表观大小是由墙的虚假透视作用产生的。与其他错觉类似,这一错觉很难通过“自上而下”(即大脑的最高水平对这一错觉形成基础的理解)的作用进行校正。

另一个有力的线索就是遮挡。即一个靠近你的物体部分地遮挡远处的物体。我们在图5中就已看到过这种情景。一个女孩的面孔位于窗玻璃的框架之后。利用这一线索,大脑就能推断出,被遮挡物的各个不同部分应当属于同一物体,就像本章开头我们讨论过的那样。

线条能产生两种与遮挡有关的神奇效果。图2所示的卡尼莎三角属于第一种。白色三角形的虚幻边界是由黑色缺损圆盘的直线边界的延伸形成的。另一种效应如图15所示。

这种情况的幻觉边界主要由于了组线段的端点排成了一条线。机场中的“线”出现的原因有多种,如物体(如衬衫)的图案或斑马的条纹以及阴影等。一个遮挡背景的物体经常会截断背景中的线。在这种情况下,线段端点产生的虚幻轮廓将会勾画出这一物体的轮廓,就像图15那种故意设计的图形那样。正如心理学家拉马参准(V.S.Ramachandran)所说:“虚幻轮廓的感觉可能比真正的轮廓还真实(对我们更重要)。”

另外一个距离线索是纹理的梯度变化。如图16所示。你只要看到这种草地的图,就会立刻产生草地逐渐离你而去的印象。这是由于,页面上的草叶自下而上逐渐变小的缘故。你的大脑不会将它看成是一面平坦而垂直的墙,在它的下面草长得比较高,而上面草长得比较矮:而是把它看成一个伸向远方的具有均匀高度的草坪。

还有一些深度线索。一个是物体的表观大小。一个熟悉的物体,当它离我们较远时它在视网膜上的像就会变小。因此,如果该物体的表观尺寸较小,大脑就认为它离我们较远。另一个深度线索是远处的风景通常看起来比较蓝。所有这些线索都被艺术家们所利用,特别是在文艺复兴时期透视现象被发现以后。卡那来特(Canaletto)的威尼斯风景画便是很好的例子。

让我们转向讨论深度信息的主要来源(1)。它通常被称作“体视”,依赖于双眼观察同一物体时景物图像的微小差异。19世纪中叶,物理学家查尔斯·惠特斯通爵士(Sir Charles Wheatstone)最早向人们清楚地演示,恰当呈现的双眼图像可以给人生动的深度印象。(怀特斯通还有一件趣事使人记忆犹新。有一次他在伦敦皇家学会等待发表星期五晚上演说时,因高度紧张而逃跑。从此以后,每个演讲者都要按惯例在演讲前被锁在一间小房子内等一刻钟。)怀特斯通还发明了体视镜(战后因设计简单而普及)。它使每只眼睛分别观察拍摄角度略有不同的照片成为可能。拍摄位置的差异就会产生并非严格相同的景观。大脑检测两个景观之间的差异(这在技术上称为“视差”),结果使照片上的场景显现出明显的深度感,似乎就出现在你的面前。

当你观察眼前较近的真实景物时,你可以通过闭上一只眼睛亲自体验一下什么是体视。对大多数人而言,此时的深度感并不像同时使用双眼时那么强。(当然,由于上面提到的其他深度线索的存在,即使闭上一只眼睛,你仍可具有较好的深度感。)另一个明显的例子就是建筑、城市、风景等的写生或摄影。在这种情况下,两只眼睛就能使大脑推断出画面是平面的。实际上,用单眼仍然可以获得较生动的深度感觉。只要你站在一个没有玻璃反光的位置,并用手挡住图画的框架。这些动作去除了图画表面的某些平面线索,使得艺术家在图画中用于表达深度信息的线索产生较强的效果。

离你较近的物体的体视最显著,因为此时双眼视差最大。显然,要使双眼看到同一物体的景象,物体差不多就要在你的正前方。它不能向一侧偏离太远,而使鼻子遮住一只眼的视线。靠捕食为生的动物如猫、狗等,通常双眼都在前方。这样它们就可以利用体视抓捕猎物。而对于其他动物,如兔子,双眼长在头的两侧更有好处,这样,它们就可以在宽广的视野内发现天敌。但与人类相比,它们的体视能力很有限,因为它们双眼的视野重叠很少。 name="a8" id="a8">

运动情况又怎样呢?视觉系统对运动感兴趣的原因是明显的。当你看电影时,尽管银幕上看到的是一系列快速呈现的静止画面,而你却具有运动物体生动的印象。这种现象称为“表观运动”。在这种相当人为的情况下,视觉系统可能会出现失误。汽车或马车轮子的辐条有时看起来会向相反方向转动。一般说来,它发生的原因已很清楚。这大体上是由于大脑把一幅图像中的一根辐条与下一幅图像中离它最近的那根辐条联系起来引起的。由于轮子在不停地转动,被联系在一起的可能并不是同一根辐条,而是其他邻近的一根。由于所有的辐条看起来完全一样,大脑很可能把相邻两幅图像中两根不同的辐条联系在一起。如果联系在一起的两根辐条所在的位置完全相同(相对于汽车),则轮子看起来就会是静止不动的。如果转速稍微放慢一点,则轮子的辐条看起来就会向后转动。特别是旧式电影中,这种现象时有发生。当汽车减速时,辐条看起来就改变方向(相对于汽车的运动)。心理学家们已经做了大量实验,试图确定获得好的表观运动所需要的条件。

另外一种运动效应是理发店标志牌错觉(barber’s pole illusion)。因为圆柱上有螺旋条纹,当它绕长轴旋转时,条纹看起来不是在转动而是在顺其长轴方向运动,通常是向上运动。(这将在第十一章中作充分讨论J因此,我们的运动知觉并不总是直接的。在这种情况下,你看到的并不是每个条纹的局域运动,而是大脑错误地把它想像为整个模式的全局运动。

大脑的运动知觉由两种主要过程进行处理。它们可以粗略地被称为“短程系统”和“长程系统”。前者发生在比后者较早的加工阶段。短程系统并不能识别物体,而仅能识别由视网膜接收并传递到大脑的光模式的变化。它可以抽提运动的“基元”,但并不知道是什么物体在运动。换句话说,作为初级的感觉,这种简单的运动信息是有用的。它是自动操作的,即不受注意的影响。

人们猜测,短程运动可以利用运动信息从背景中分离出图形并与运动后效应(有时称为“瀑布效应”)有关。(如果你注视瀑布一段时间,然后把注视点很快移到邻近的岩石,在很短的一段时间内,你就会看到岩石向上运动。)现在对此现象还有不同的看法。因为最近的实验显示,运动后效应可以受注意的影响。

长程运动系统似乎与物体运动的登记(register)有关。它不仅仅登记运动本身,而且还登记是什么物体从一个地方运动到另一个地方。长程运动系统受注意的影响。

让我们举一个(过分简单的)例子。一个红色方块在屏幕上闪烁很短的时间,再隔一段时间后,在离红方块不远的地方紧接着出现一个闪烁的蓝色三角形。如果时间、距离等参数选取得使长程系统占优势,那么观察者就会看到红方块变成蓝三角并从一个位置移到另一个位置的表观运动。另一方面,如果选择的参数主要激发短程系统(时间间隔和距离都很小),那么观察者将只看见运动而看不见运动的物体。他感受到运动但不知道什么在运动。在大多数情况下,两种系统在某种程度上可能同时起作用。只有精心设计的刺激才会仅仅激活一个系统。

* * *

大脑利用运动线索获得变化中的视环境的附加信息。我已经描述过,在某些情况下如何从运动恢复结构,还可以通过其他方式利用运动信息。一个正朝你眼睛跑过来的物体会产生一个逐渐膨胀的视网膜图像。如果一个屏幕上的物体突然增大,你就会感到该物体正向你冲过来(尽管屏幕还在同一距离)。这种视觉图像运动被称为“膨胀”。它产生的效果是如此鲜明,以至人们怀疑大脑中有一个特殊的部位对图像的膨胀加以响应。事实上这个部位已经被发现(见第十一章)。

视觉运动系统的另一个作用是指导你在环境中运动的方式。当你向前行走时,你的眼睛看着前方,你上下左右的视觉场景就会从你身边掠过。这种视网膜图像的运动被称作“视觉流”(visual flow),在飞机着陆时它对飞行员帮助极大,一个没有体视的单眼飞行员可以借助视觉流信息使飞机安全着陆。没有视觉流的地方是你正朝它运动的那一点。所有围绕该点的物体似乎都向远离这一点的方向运动,尽管它们的速度有所不同(如图17)。这种视觉信息帮助飞行员找到跑道上正确的着陆点。

颜色知觉也并非像看起来那样直截了当。基本的观点认为它与眼内不同类型的光感受器有关。每种光感受器只对有限波长范围内的光起反应。重要的是我们应当意识到,单个光感受器的反应怎么会不依赖于输入光子的波长。一个光感受器可能捕获一个光子,也可能捕获不到。如果确实捕获到,则不管光子的波长如何,其效果会完全相同。但它响应的概率却依赖于波长。某些波长激活它的概率很大,某些波长则很小。比如,它可以经常对“红”光子起反应,却很少对“绿”光子有响应。

对输入光子流的平均响应可能对应于敏感波段的少数几个光子,也可能对应于非敏感波段的许多光子;感受器无法分辨它们。初读这些内容时,这一切似乎相当复杂,但已有的经验告诉我们,如果眼睛只有一种类型的光感受器,你的大脑就会失去光的波长信息,因而只能看见黑白的世界。这种情况出现在特别昏暗的时候,这时,被称作“视锥”的一类光感受器不活动,只有“视杆”感受器起作用。这些全是一种类型的光感受器,对所有波长反应相同。这就是为什么在夜晚很暗的情况下,你在花园内看不到花的颜色的原因。

要获得颜色信息,就需要不只一种具有不同波长响应曲线的光感受器。它们的响应曲线是部分重叠的。但是,一个具有同一波长的光子流,对不同的光感受器引起不同程度的兴奋。大脑利用这些不同兴奋的比例,确定落在视网膜上某点光的“颜色”。

大家知道,大多数人具有三种视锥细胞(大致是短波、中波和长波锥细胞。它们常被称为蓝、绿、红视锥细胞)。但也有少数人缺少“红”视锥细胞,因此导致部分色盲。 name="a14" id="a14">他们在分辨红绿交通信号时可能会碰到困难。

***

这就是对为什么我们能看颜色所作的基本解释。但它还需要进行某些修正。在此,我仅想提一下所谓兰德效应(因偏振片的发明者埃德温·兰德(Edwin Land)而得名)。兰德以戏剧性的方式向我们演示,视野内某斑块的颜色并不仅仅依赖于从该斑块进入眼睛的光的波长,它还与从视场其他部分进入眼睛的光的波长有关。

为什么会这样呢?进入眼内的信息不仅取决于表面的反射特性(颜色),还与落到该表面的光的波长有关。因此,在阳光下和在烛光下,妇女们色彩缤纷的服装会有很大区别。因此,大脑主要感兴趣的不是反射率和照明光的组合,而是物体表面的颜色特性。大脑试图通过比较眼睛对视野中若干不同区域的响应来抽提出这种信息。要做到这一点,大脑利用了如下约束(假设),即在某一时刻,在该景物的各处,照明光的颜色是相同的。尽管在其他场合,它们可能是明显不同的,如果照明光是粉红色,它就使所有的东西程度不同地变为粉红色。因此,大脑就力图校正它。这就是为什么阳光下的红色纤维在人工照明下看起来依然是红色的原因。但是,正如我们知道的,它看上去并不完全相同,因为校正机制并非工作得尽善尽美。

下面我们稍微提一下另外一些视觉恒常性。一个物体看上去总是大致相同的,即便我们没有直视它,使得它落在了视网膜上的不同部位也是如此,如果我们在不同的距离观察一个物体,物体的视网膜图像可能变大或变小或产生一定的旋转。然而,我们同样将它看做是同一物体。我们将这些恒常性视为理所当然的事情。但简单的视觉机器却无法做到这一点,除非它具备发育成熟的大脑所具有的完成该任务的固有装置。大脑到底如何完成这些任务,我们仍然不十分清楚。

运动和颜色之间具有奇怪的相互关系。大脑的短程运动系统有些色盲,它主要观看黑白图像。利用演示很容易说明这一点。将仅有两种均匀亮度的颜色(比如红和绿)构成的运动模式投射到屏幕上。然后调节两种颜色的相对亮度,使它们对于观察者来说看起来具有相同的亮度。这一过程必须对每个人分别进行,因为你和我的色平衡点不会完全相同。 name="a16" id="a16">这一平衡条件被称为“等亮度”。

现在,如果你在屏幕上观看一个绿色背景上的红色运动物体,而且两种颜色调整为等亮度,那么其运动速度就显得比实际情况慢得多,甚至可能停止运动(特别是当你注视屏幕的一侧时,情况更是如此)。这是因为你大脑中的黑白系统将屏幕看成是均匀灰色(因为两种颜色是等亮度的),所以短程运动系统几乎得不到运动信息。

所有这些例子都说明,大脑可以从视觉场景的多个不同方面抽取有用的视觉信息。那么,如果外界提供的信息不完整,大脑如何处理呢?眼睛的盲点就是一个很好的例子。如我们在第三章中讲过的那样,你的每只眼睛中都有一个盲点,你的大脑会对它进行“填充”。因此,即使你闭上一只眼睛,也看不到视场中盲点处有一个洞。哲学家丹·丹尼特(Dan Dennett)不相信存在填充过程。在他的(意识的阐释)(Consciousness Explained)一书中,他正确地争辩说“信息的缺失不等于缺失的信息。” 他还说:“你要看见洞,大脑的某个地方就必须对反差作出响应:或是内外边缘之间的反差(但在这个位置,你的大脑没有完成该任务的装置),或是前后之间的反差。”因此,他认为不存在什么填充,只是缺少那里有洞的信息。

但是,这一论证是不充分的。因为他没能证明,盲点处的信息无法推论出来。他只是说明大脑可能没有进行这一推论。说大脑肯定没有完成这件事情的必需机制也是不正确的。对大脑的细心研究表明,确实具有某些神经细胞有可能完成这一任务(见第十一章)。

加利福尼亚州大学圣迭戈分校心理系的视觉心理学家拉马参准做了一个巧妙的实验来反驳丹尼特(每个人都喜欢证明哲学家是错的),他向被试者呈现一个类似油炸面包圈似的黄色环形图案(见图18b)。被试者必须使眼睛静止不动,并用单眼进行观察。拉马参准将黄色圆环放在被试者的视野内,使它的外沿落在盲斑之外(睁开的眼),而内侧则落在盲点之内(图18b)。此时被试者报告说,他看到的不是一个黄色圆环而是一个完全均匀的黄色回盘(图18c)。他的大脑填充了盲区,使一个粗的圆环变成一个均匀的圆盘。

为了强调这一结果,拉马参准又将其他几个类似的圆环放入被试者的视野中,当这些图形呈现之后(其中一个圆环围绕盲点,其他圆环放在别处)。被试者报告说,他不仅看到盲点区域的完整圆盘,而且看到圆盘立刻“跳出”(pop out)。这表明,被试者的注意立刻被圆盘所吸引,这和你睁开双眼观看黄色环组成的随机阵列中有一个实心圆盘时的情况完全一样。明显与圆环不同的圆盘会立刻跳出在你前面。正如拉马参准所说,你确实对盲斑进行了填充,而不是仅仅忽略了那里存在的东西。因为,被忽略的东西怎么能真正跳出来呢?

在盲点处看到的东西是不容易研究的,因为它偏离凝视中心15度。正如我前面说过的,那里的东西我们不能看得很清楚。拉马参准和英国心理学家理查德·格里高理(Richard Gregory)已经完成了一个称为“人造盲点”的实验。该盲点离凝视中心较近。(丹尼特曾在脚注中提到这一工作,但对他们的结果不甚满意。)更引人注目的是,拉马参准及其合作者对一个病人进行了检验。他的问题不是出在眼睛,而是在大脑的视区内有一小部分损伤。这样的病人不能如实看到视场中相应位置的东西。这一块区域是盲区。但毋庸置疑,只要放宽时间,他的大脑就会利用从周围得出的合理推测来填充它。

他们的实验结果可用图19说明。在阴极射线屏幕上有两条竖直的线段处于同一直线上。一条在盲斑之上,一条在下。几秒钟后,病人就会看到一条直线完全跨过间隙。一个病人还报告说,当屏幕上的线条去掉后,他“在线的填充部分看见一个非常生动的幻象”,其持续时间有好几秒,更令人惊奇的是,如果呈现给两个病人的是两条错开的竖直线(图19c所示),开始,他们看到的是两条错开的直线,但后来两条线就会相互“漂移”靠近,最后两条直线完全对齐。然后,大脑填充上它们的间隙,形成一条连续的直线(如图19d)。报告称,这些线的水平移动(记住,它们实际上是完全静止不动的)栩栩如生。两位病人对此现象深感惊讶,并表现出极大的兴趣。

其他的一些实验表明,并非视觉每个方面的填充都是同时进行的。形状、运动、纹理和颜色的填充可以在不同时间内完成。例冤五章注意和记忆如,当视场由许多运动的随机红点组成时,一个病人将颜色“渗入”到盲区几乎是立刻完成的,而在5秒钟以后才会形成运动圆点的动态模式。

需要注意的是,大脑中因伤害形成的盲斑与眼睛真正的盲斑两者所引起的结果具有重要的区别,对于后者,填充差不多是立刻完成的。在大脑损伤的情况,这个过程则需要若干秒。这大概是由于损伤失去了大脑中快速填充的部件。

填充可能并非是盲点所特有的过程。更可能的情况是,它以某种形式发生在正常大脑的多种水平。它使大脑能从仅有的部分信息中猜测出完整的图画。这是一种非常有用的能力。

现在,我们对视觉心理学的复杂性已有了大体的了解,显然,观看并非是一件简单的事情。这与我们仅凭日常经验作出的猜测有很大的差别。它的工作方式还没有被我们完全理解。它涉及许多我们不得不略去的实验和概念。下一章我们将涉足看的两个其他方面——注意和短时记忆,用来拓宽我们的研究领域。它们都与视觉意识有紧密的联系,而且还会引人不同视觉加工所需时间这样一个十分棘手的课题。

====================================

正如我在第一章所解释过的,如果过于简单地理解“和”这个词,这当然是正确的。

最近,加利福尼亚大学(伯克利)心理学家斯蒂芬·帕尔莫(Stephen Palmer)提出另 外两条律:共同区域(common region)和联结性(connectedness)。共同区域(或称包容性)意味着相同的知觉区域组合在一起。联结性是指视觉系统把均匀的、联结在一起的区域知觉为单一单元的强烈倾向。

这可能或多或少地依赖于估计信息内容时采用的是哪些“基元”(primitives)。

大脑如何利用视差是个值得重视的理论问题。比如,需要弄清楚,一只眼睛的图像中的哪个特征与另外一只眼睛的哪个特征相对应。这称为“对应问题”。最初认为,要解决这个问题,大脑首先要识别物体,在贝尔实验室工作的匈牙利心理学家贝拉·朱尔兹(Bela Julesz),用随机点立体图进行的精彩的实验清楚地显示,两图之间的“对应”可以在先于物体识别的、低水平的信息处理阶段实现。

一小部分人似乎缺少真正的立体视觉。

这种从背景分离图形的任务提出了一个困难的理论问题,因为大脑必须在不知道什么是图形的情况下进行图形背景分离。

严格他讲,我们大家都是色盲。因为除了像紫外线这一类我们不能看见的波长外。可以构造出任何数目的、在我们看来是完全相同的波长分布;而它们如果用一个合适的物理仪器去测量,实际上并不完全相同。除了少数情况有保留外,我们对任一波长分布的响应可以与仅仅三种波长的合适组合相匹配。这是早在19世纪就已确认的事实。按数学术语,颜色是三维的。

    name="a15" id="a15">即使对于同一观察者,位于注视线上的物体与位于视场外围的物体,它们的平衡点也可能稍有不同。

格式塔心理学

Sunday, March 12th, 2006

在某些领域内,心理学和视觉传达设计学具有共同的研究兴趣,视觉知觉便是其中之一。许多年以来,心理学家们一直想确定,在知觉过程中人的眼和脑是如何共同起作用的。作为设计师,对此也同样感兴趣,因为视觉表现,比如平面广告的设计,归根结底是给别人看的。

对知觉所进行的一整套心理学研究,以及由此而产生的理论,被称为格式塔心理学(完形心理学)。格式塔心理学的部分原理对设计是没有直接影响的。然而在视觉传达设计中,不论在理论还是在实践方面,许多格式塔理论及其研究成果都得到了应用。这些理论和研究述及了这样一个观念,即人们的审美观对整体与和谐具有一种基本的要求。简单地说,视觉形象首先是作为统一的整体被认知的,而后才以部分的形式被认知,也就是说,我们先“看见”一个构图的整体,然后才“看见”组成这一构图整体的各个部分。

格式塔心理学派断言:人们在观看时眼脑共同作用,并不是在一开始就区分一个形象的各个单一的组成部分,而是将各个部分组合起来,使之成为一个更易于理解的统一体。此外,他们坚持认为,在一个格式塔(即一个单一视场,或单一的参照系)内,眼睛的能力只能接受少数几个不相关联的整体单位。这种能力的强弱取决于这些整体单位的不同与相似,以及它们之间的相关位置。如果一个格式塔中包含了太多的互不相关的单位,眼脑就会试图将其简化,把各个单位加以组合,使之成为一个知觉上易于处理的整体。如果办不到这一点,整体形象将继续呈现为无序状态或混乱,从而无法被正确认知,简单地说,就是看不懂或无法接受。格式塔理论明确地提出:眼脑作用是一个不断组织、简化、统一的过程,正是通过这一过程,才产生出易于理解、协调的整体。

长期以来,设计师们认识到:表现作品的整体感与和谐感是十分重要的。他们根据直觉的观察和对自己的视觉表现的自觉评价,以及受众的反应得出结论:无论是设计师本人或是观者,都不欣赏那种混乱无序的形象。一个格式塔很差的形象即缺乏视觉整体感、和谐感的形象,产生的视觉效果是缺乏联系、细节零散而无整体性,破坏了人们的视觉安定感,给人的总的印象是“有毛病”。这样的视觉形象势必为人们所忽视,乃至于拒绝接受。

格式塔原理及应用-格式塔原理在构图中的应用形式:

1:删除

删除就是从构图形象中排除不重要的部分,只保留那些绝对必要的组成部分,从而达到视觉的简化。

在实际的设计创作过程中,必须留意在设计中是否添加了任何与你预期的表达相抵触的多余的东西。如果有,则应排除,以改进你设计上的视觉表达的格式塔。通过研究一些设计大师的作品,我们注意到,任何有效的,吸引人的视觉表达,并不需要太多复杂的形象。许多经典的设计作品在视觉表现上都是很简洁的。

2:贴近

当各个视觉单元一个挨着一个,彼此靠得很近的时候,可以用“贴近”这个术语来描绘这种状态,通常也把这种状态看作归类。以贴近而进行视觉归类的各种方法都是直截了当的,并且易于施行。设计师可以根据需要使用贴近手法创造出完美的格式塔。这是因为由贴近而产生近缘关系,运用近缘关系无论对少量的相同视觉单元还是大量不同的视觉单元进行归类都同样容易。

比如在印刷版面设计中,为了区分不同的内容,也经常采用近缘关系的方法来进行视觉归类。最简单的例子:在处理不同内容的图片和与之相关的说明文字时,只要将每一幅图片相应的文字段落与之贴近,在此不同的图文组合之间保持一定间距,无须指引符号,读者也不会搞错各个图片和文字段落之间的关系。报刊杂志的版面编排,字母与字母、词与词、行与行之间,也都运用了近缘关系,使版面整体分为若干贴近的栏块,成为若干个相关的视觉组合。

3:结合

在构图中,结合就是指单独的视觉单元完全联合在一起,无法分开。这可以使原来并不相干的视觉形象自然而然地关联起来,比如常用的一种设计手法–异形同构:把两种或几种不同的视觉形象结合在一起,在视觉表达上自然而然地从一个视觉语义延伸到另一个视觉语义

4:接触

接触是指单独的视觉单元无限贴近,以至于它们彼此粘连。这样在视觉上就形成了一个较大的、统一的整体。接触的形体有可能丧失原先单独的个性,变得性格模糊。就如在图案设计中相互接触的不同形状的单元形在视觉感受上是如此相近,完全溶为一体。

5:重合

重合是结合的一种特殊形式。如果所有的视觉单元在色调或纹理等方面都是不同的,那么,区分已被联结的原来各个视觉单元就越容易;相反,如果所有的视觉单元在色调或纹理等方面都是一样的,那么,原来各个视觉单元的轮廓线就会消失,从而形成一个单一的重合的形状。重合,能创造出一种不容置疑的统一感和秩序性。重合各个不同视觉形象的时候,如果我们看到这些视觉形象的总体外形具有一个共同的、统一的轮廓,那么这样的重合成功了。

6:格调与纹理

格调与纹理是由大量重复的单元构成的。两者的主要区别在于视觉单元的大小或规模,除此之外,它们基本上是一样的。格调是视觉上扩大了的纹理,而纹理则是在视觉上缩减了的格调。因此,在不需要明确区别的情况下,我们可以同时解释格调和纹理,
感知格调或纹理的视觉格式塔,总是基于视觉单元的大小和数量的多少。但在一定的场合,别的因素也可能起作用。例如,一个格式塔中视觉单元的总量就可以影响它的外观。当数量很大,以至不能明显地看出单独视觉单元时,这种现象就可能发生。比如透过窗户看到的不远处的树林是足够大的,可以构成一种格调;但是,如果在飞机上俯瞰一整片树林,恐怕就只能将其作为一种纹理来看了。

格调和纹理实际上没有严格的区分界限,当视觉单元大小及数量变到一定的量值范围,这种特性可以使格调显得像是一种纹理,也可以使纹理呈现为一种格调。或者,创造出一种格调之内的纹理,以至格调和纹理同时并存

7:闭合

有一种常见的视觉归类方法基于人类的一种完型心理:把局部形象当作一个整体的形象来感知。这种知觉上的特殊现象,称之为闭合。

当然,我们由一个形象的局部而辨认其整体的能力,是建立在我们头脑中留有对这一形象的整体与部分之间关系的认识的印象这一基础之上的。也就是说,如果某种形象即使在完整情况下我们都不认识,则可以肯定,在其缺乏许多部分时,我们依然不会认识。如果一个形象缺的部分太多,那么可识别的细节就不足以汇聚成为一个易于认知的整体形象。而假如一个形象的各局部离得太远,则知觉上需要补充的部分可能就太多了。在上述这些情况下,人的习惯知觉就会把各局部完全按其本来面目当作单独的单元来看待。

《艺术与错觉,图像再现的心理学研究》

Sunday, February 19th, 2006

来自:http://www.blueidea.com/bbs/newsdetail.asp?id=2462363

摘自寒假里刚看的一本书《艺术与错觉——图像再现的心理学研究》,作者E.H.贡布里希。希望大家有所收获。

德国医师、浪漫主义者卡尔-古斯塔夫-卡鲁斯(Carl Gustav Carus)实际上已走在李格尔前面,他把艺术史解释为从触觉到视觉的推移。“任何一个机体那些感官的发展都是从感觉,即从触觉开始。只有机体自身进化完善,才能出现更微妙的听觉和视觉。几乎与此相同,人类的艺术也是从雕塑开始的,……这就说明为什么绘画……总是较迟阶段的产物……而风景画……则需要发展到更高阶段才能出现。” P11

18世纪的大师们用暖棕色描绘前景,用种种因一般的冷蓝色描绘渐渐消失的远景并获得了一些极其可喜的成果。P30

我认为阿尔贝蒂(Leone Battista Alberti)关于投射在艺术起源中的作用的说法治的严肃对待。至少有一个领域可供我们核对并证实发现偶然的相似性对于原始人的心灵是多么重要,那就是个民族向夜空投射的物象。 P76

达芬奇……讨论了诸如云彩或浊水等“混乱的形状”所具备的激励心灵从事发明的能力。他甚至劝告艺术家避免谨小慎微的传统素描方法,因为迅疾、不整的素描会给画家提示性的可能性。P138

瓦萨里撰写的卢卡-德拉-罗比亚(Luca Della Robbia)传记中谈到:“.……艺术家应该重视这一点,因为经验表明一切远远移开的东西,无论是绘画、雕塑还是别的什么东西,它们魅力的草图[una bella bozza]要比精细的完工之作更优美、更有力…..” P140

那位伟大的法国批评家吕斯伯爵[Count Caylus]更加尖锐,明智地探讨了他和其他人为什么喜爱未经修饰、一挥而就的速写,喜爱仅仅的暗示,却不那么喜欢清晰的物象;感到自己“懂行”总是叫人愉快的。 P145

“等等原则”[etc.principle]使我们愿意采用的一种假设:看到一个系列中几个成员就看到了全体成员。……这类错觉最著名的是Fraser螺线,它根本不是螺线,而是一系列的同心圆。……绘画中自然主义错觉最伟大的倡导者达芬奇是有意使用模糊物象的创始人,亦即使用sfumato[渐隐法],或称纱遮形式[veiled form],这种技法是削减画布上的信息,以此来激发投射机制。 P159-160

招贴画的部分功能是,凭借未必有的事物引起人们的注意,然后通过延长读解过程把这种注意力进一步加强。 P170

心理学家已经发现,在缺乏其他线索的情况下,西方的读者已经接受了这样一种假定:光线是从高处及左侧照射过来的。这个位置最便于用右手绘画和写字,因而适用于大多数绘画。P198

古典和已废止的语言往往听起来比日常用语典雅……在语言中一直有一种倾向,有时人们不由自主地社会的、历史的和道德的标尺相互等同;把古代的语言归入高尚和克制的一流,把现代的语言归入粗俗和放纵的一流。P273

后来查的资料:《艺术与错觉——图画再现的心理学研究》,林夕、李本正、范景中译,浙江摄影出版社1987年11月版。还有一本关于心理学研究的《图像与眼睛——图画再现心理学的再研究》,范景中等译,浙江摄影出版社1989年一月版。

关于视觉思维问题

Sunday, January 15th, 2006

作者:傅世侠 北京大学科学与社会研究中心
来源:http://www.bjjy.net/subjects/physics/jxyj/dzqk/caiyj/gysjsw.htm

内容提要

作者认为,视觉思维及其概念是一个需要深入研究的问题。这是因为,一方面视觉思维概念与传统哲学或一般心理学的观念不符;另一方面,视觉思维却与思维的创造性密切关联。本文从对视觉思维的最初探索,视觉思维概念的明确提出和办公室,以及视觉思维的创造性和视觉思维概念的认识论意义等方面,提出问题,回顾历史,并作了初步探讨。同时提出了作者关于视觉思维创新功能的具体特征,以及深入研究的角度问题的看法。

一、关于视觉思维概念与传统观念不符的问题

1. 在哲学和心理学的传统观念中,“视觉思维”概念是不合理的。

首先,从传统心理学的观点来看“视觉杨维”概念的不合理性

所谓视觉,也即视知觉。大传统心理学中,一般认为,知觉(或感知觉)是对客观刺激物的直接反映,是人的心理过程中低层次的认知心理现象;而思维则是对客观事物的间接反映,具有概括性和抽象性的特征,而且具有解题功能,它是心理过程中高层次的认知心理现象。

所以,在心理学中,尽管一般都强调各种心理现象之间的联系,但知觉与思维之间的区别和界限也是一向分明的。因而知觉和思维一般被看成两种不同的对象来进行研究,从而区分出了“知觉心理学”与“思维心理学”两个不同的分支学科领域。

其次,从哲学认识论或方法论上看“视觉思维”概念的不合理性。

在古代西方哲学史上,一些先哲,如赫拉克利特、德谟克利特、柏拉图、亚里士多德等,都曾通过从不同角度强调感性与理性之间的相互渗透关系,而同时也肯定了感知觉与思维之间的联系。但从总体上看,在西方哲学史或认识论研究史上,感知觉与思维之间的划界仍然是很明确的。一般认为,知觉或感知觉属于获取经验知识的感性认识范畴,思维则属于理性认识范畴。前者是主体与客体进行信息交流的直接通道,是后者的源泉和基础;后者则是在前者提供的感性材料基础上,在头脑中进行再加工的产物,故而具有间接性、概括性和抽象性。

所以,在哲学上,知觉与思维这两个概念也是不容混淆的。也就是说,尽管也可以承认两者间的联系,但知觉就是知觉,而不可能是思维;反之,思维也只能是思维,而不能把它说成是知觉。因而必须从方法论原则上将它们加以严格的区分。

例如,哲学史上著名的唯理论和经验论之间的长期争论,从认识论上看,其主要原因即是两种不同的哲学派别各自片面地强调了感性认识的作用或理性认识的作用。而由之产生的这一长期的、反复的哲学论争,实际上既是反映了感性认识与理性认识之间所存在的原则性差异,同时也折射出了知觉与思维这两个基本概念在哲学认识论上的根本区别。

2. 知觉心理学、特别是创造性思维研究,打开了知觉与思维之间严格界限的最初缺口。

应该说,对知觉与思维之间严格界限最早有所突破的,是本世纪初期诞生于德国的格式塔心理学派的研究。

我们知道,格式塔心理学基本观点的形成,除了依赖于胡塞尔现象学的哲学基础外,起初主要就是根据其创始人韦特海默(M.Wertheimer)关于知觉的研究,其中最著名的是他关于“似动现象”(Phi-phenomenon)的知觉实验。所谓“似动”,即当两条直线按适当间隔时间先后出现时,人们会把它看成是一条正在移动着的线,而不是先后出现的两条静止的线。电影艺术正是利用这一知觉特点的典型例证。韦特海默认为,这种似动现象是人的视知觉的固有的特点。也就是说,人在视知觉过程中,总是会自然而然地有一种追求事物的结构整体性或守形性的特点,韦特海默即称之为“格式塔”(gestalt)。知觉到的格式塔不可分析还原为原来的各组成部分,也即各组成部分不是格式塔,或格式塔并不是各组成部分的简单加合。比如“似动”的还原就不是“动”,而只是两条静止的直线。所以,格式塔的内蕴总是大于它的部分、决定它的部分,而不是相反。

格式塔心理学所强调的这一基本观点,与对抗当时已盛行的构造主义心理学有关。构造主义心理学源于冯特(W.Wundt)的元素主义观点。冯物即试图将一切心理现象均分析还原为一些基本的感觉元素加以研究。而格式塔心理学认为,知觉的也即现象的经验,就是格式塔;格式塔不可能分析还原为基本的感觉元素,因而也不是所谓“感觉元素的联合”。基本这一点并通过进一步的实验研究,格式塔心理学提出了一系列知觉结构的组织原则(如邻近性、类似性、闭合性、完形趋向等),即人在知觉过程中用以组织模式塔的基本规律或法则。可见,格式塔心理学从一开始便已经对知觉研究的固有范围有所突破,特别是后来对创造性思维的研究,则实质上已经打破知觉与思维之间不可俞越的严格界限。

格式塔心理学关于创造性思维的研究主要也是韦特海默的工作。韦特海默认为,所谓创造性或产生式思维(productive thinking),从根本上说就是认识主体在知觉过程中,将“坏的格式塔”转变成为“好的格式塔”。例如,当教会了从未学过几何学的孩子求解长方形面积后,再要求他自己去求角平行四边形面积的问题。在反复观看图形过程中,他完全有可能“发现”平行四边形的两端看起来存在着“干扰”;进而还有可能“顿悟”到,只要把左端多余的部分转换成右端缺少的部分,该图形就会成为一个看行顺眼的长方形,于是问题便一下子得到解决。

韦特海默做了不少类似的教学实验,并认为如上述求解平行四边形面积的“发现”过程,也就是从“坏的格式塔”向“好的格式塔”转换的过程。他在分析这个“真正的、创造性的过程”时,指出其“运算和步骤”是:“对全局的重新组合,重新组织,密切吻合等等;发现和继续钻研内在联系和内在需要的因素;看到整个图形和看到整个情境之后,才采取步骤和明确的运算。……这些步骤和运算的内容、方向以及应用,是来自问题本身的需要。这样的过程不是几个步骤的总和,也不是几个运算的集合,而是从情境中发现空隙,从结构中发现问题,并设法补救,把坏的改好,找到奇妙的内在联系,由这些愿望而产生的一条思维线索。”

在韦特海默的这一研究中,知觉与思维之间的界限实际上已经开始打通。也就是说,当他在强调人们如何通过“观看”而对事物的内在规律性有所“发现”,或如何通过从“坏的格式塔”向“好的格式塔”转换而使问题得到解决时,便已很难对知觉(“观看”或“格式塔转换”)和思维(“发现”或“解题”)予以绝对区分了。

二、关于视觉思维概念界定的问题

1. “视觉思维”概念的明确提出。

格式塔心理学对知觉和创造性思维问题的研究,虽然已经初步打开了知觉和思维之间严格界限的缺口,但还并没有明确提出“视觉思维”的概念。较早且较详尽研究和阐明这一概念的,应数当代美国德裔艺术心理 学家鲁道夫·阿恩海姆(Rudolf Arnheim)。

阿恩海姆正是格式塔心理学的理论和方法研究艺术心理学问题。经进一步研究,他不仅继承和发展了韦特海默关于知觉和创造性思维的研究思想,而且从更高的角度或从更一般的意义上,探究了视知觉的理性功能。到50年代,他出版了《艺术与视知觉》(Art and Visual Perception)一书。作为一部艺术心理学著作,其中虽然尚未明确使用“视觉思维”概念,但却已提出了“一切知觉中都包含着思维,一切推理中都包含着直觉,一切观测中都包含着创造”的重要思想。

到60年代末,阿恩海姆关于视觉思维的一些基本思想便已形成,并在发表论文基础上出版了直接标题为《视觉思维》(Visual Thinking)的专著,在这部著作中,他不仅进一步阐述了视知觉的理性功能问题,而且还阐明了“视觉意象”(visual image)在一般思维活动、尤其是创造性思维活动中的重要作用和意义。这两方面的思想,即视知觉具备思维的理性功能,以及一切思维活动、特别是创造性思维活动离不开“视觉意象”的思想,可说是阿恩海姆关于“视觉思维”概念所作阐明的最基本的内容。

此外,阿恩海妈还提出了需要对“一般性的知觉思维”,即不仅对视觉思维进行认真研究的问题一但他也正确地认为,在人类认识活动中,最有效的还是“视觉思维”。不过,关于“一般性知觉思维”的提法,对于研讨知觉与思维之间的一般关系问题,或许更具有重要意义。

总的来说,阿恩海姆对视觉思维进行了颇为详尽的研究。而且,他主要是用大量的知觉实验和艺术(主要是绘画)实践的事实,以说明上述两个基本观点。从艺术理论研究角度看,其严谨、理性的科学态度、确实难能可贵。但从对“视觉思维”概念的阐释看,他似乎一直还未对这一概念本身给出过明确的定义。如果说也曾有过某种界定的话,那就是他说:“所谓视知觉,也就是视觉思维。”当然,在他这样说时并未反过来指明,所谓视觉思维也就是视知觉。对此,我们或许应该理解为,在阿恩海姆看来,“视觉思维”,概念的内涵和外延,比起“视知觉”来还是要深、广些。但关于这一点,显然还需要作更进一步的论证。

事实上,阿恩海姆在该著中,除了用较多的篇幅论述视知觉的理解能力、识别能力、解题能力等等外,对“视觉意象”的论述,便已不完全局限于视知觉范围。此外,他对抽象、语言、理论模型等也都给予了一定关注,尽管其苦点仍然是强调视觉思维乃至视觉意象的重要意义。

总之,阿恩海姆对视觉思维虽然作了多方面的理论阐释,但却并未使“视觉思维”比“视知觉的内蕴更为丰富,或者对“视觉思维”概念本身的内涵,用更为概括的语言明确地表述出来。这或许与其研究的着眼点或出发点,主要还是在艺术领域有关。

2. 对视觉思维概念的初步界定。

视觉思维问题的提出,一开始就与创造性思维的研究直接关联,如上述韦特海默的最初研究。所以,对这一概念的界定,很大程度上还将有赖于对创造性思维问题的深入研究。

事实上,在韦特海默以后,确有一些心理学家在相关研究中明确应用了视觉思维的概念。例如,心理测验研究先驱者之一的塞斯顿(L.Thurstone),在其“关于发明才能的科学研究”一文中指出,根据其多年心理测验和因素分析研究的结果看,已知与发明创造相关的七八种区别很大的因素,都与视觉思维有关。不过,这些心理学家只是根据实验研究的具体需要使用这一概念,而并未对这一概念的含义作出具体阐明。

另一位以创造性思维训练见长的美国心理学家麦金(R.H.McKim),则是在接受了阿恩海姆的理论观点之后,正式使用视觉思维概念的。并且,他还根据自己的研究对这一概念作出了其独特的概括和界定。麦金在斯坦福大学开设创造性思维训练课时,原计划对学生进行“设想构绘”的训练。后业他发现,所谓“设想构绘”,实际上既需要看,又需要相,还需要画。也就是说,它需要观看(vision)、想象(imagination)和构绘(composition)三方面能力的有机结合。麦金认为,这三方面的能力,其实都与视知觉活动有关。所以,要训练学生的设想构绘能力,也就是要训练学生在视知觉过程中掌握好这三者间的相互作用关系,或者说,就是要训练他们如何有效地将这三种相关的视觉活动和谐地统一起来。

那么,如何将这三种相关的视觉活动统一起来加以表述呢?这时,阿恩海姆的《视觉思维》一著已经出版。而且如麦金本人所说,正是在阿恩海姆的建议下,他便正式采用了“视觉思维”的概念来统一描述观看、想象和构绘三者间的相互作用。后来,麦金便专门出版了关于视觉思维训练的著作《体验视觉思维》一书。在这部著作中,麦金实质上也就是用观看、想象和构绘三者间的相互作用定义了“视觉思维”概念,只不过他是从思维训练的角度 表达出他的这一观点。

例如,麦金指出,“视觉思维借助三种视觉意象进行”:其是是“人们看到的”意象;其二是“我们用心灵之窗所想象的”;其三则是“我们的构绘,随意画成的东西或绘画作品”。而且,“虽然视觉思维可能主要出现在看的前前后后、或者仅仅出现在想象中,或者大量出现在使用铅笔和纸的时候,但是有经验的视觉思维者却能灵活地利用所有这三种意象,他们会发现观看、想象和构绘之间存在着相互作用”。

当然,麦金对视觉思维概念的这一表述,恐怕也还不能说就是对视觉思维概念的严格界定或定义。但在目前看来,他的这种表述除了含义明确外,最大特点就是富于操作性。所以,它至少可被看成是关于视觉思维概念的一种操作性定义来使用。

三、关于视觉思维的创造性问题

尽管迄今还不能说已经有了一臻认同的视觉思维概念定义,但阿恩海姆关于视觉思维实乃以视觉意象为运作单元且具有理性功能的视知觉,以及视觉意象为创造性思维所必需的观点,还是具有其论证的合理性的。实际上,以视觉意象为中介而认定视觉思维也就是一种具有创造性的思维,并非只是阿恩海姆的看法。在创造学研究中,这种观点早已是许多学者的共识。但麦金将视觉思维表述成观看、想象和构绘三者间的相互作用,尤其是他对学生的有效训练,则可说是认定视觉思维即为创造性思维的一个较有力的说明。

其实,要说明视觉思维的创造性,最简便的方式莫过于将视觉思维与非视觉思维相对照。这里所谓的非视觉思维,简言之,即是指以语词而非以意象为运作单元的思维,如一般所谓的“言语思维”或“逻辑思维”。关于“视觉思维”与“非视觉思维”在创造性上的差异问题,在上述阿恩海姆和麦金的著作中,可以说也都有论述。特别是麦金,出于其思维训练的需要,他还为此概括出一种具有启发性的3R’S的提法。

所谓3R’S,也即读、写、算方式(read/write/arithmatic style)。麦金认为,在教育领域,正是3R’S长年累月使受教育者在言语的或逻辑的思维能力方面不断得到加强,相应地视觉思维能力则日益受到削弱乃至衰退。读、写、算方式的根本特点,就是不能由认识主体去直接地感受到那种鲜活的视觉意象,主体所能利用的便只是一些间接获得的、已经条理化的或已纳入现成规范中的知识。在这种方式引导下的思维,便难以发挥主体的能动性去进行自由选择,也难以摆脱现成规范或已有程式而由主体去直接感受或体验事物的本来面目。所以,通过3R’S训练的思维,尽管在个体认知发展的一定阶段是不可缺少的,但若要在利用现成知识基础上,还能突破已有规范而去创造新事物,它就显然是不利的。

视觉思维恰恰相反。首先,由于视觉思维源起于直接感知,这本身就具有从不知或未知到知的探索性。其次,由于视觉思维的运作单元或思维工具是视觉意象,而非经过加工的语词或概念,所以它既灵活又易于操作,即如爱因斯坦所言,主体在头脑中完全可以对视觉意象进行“自由地再生和组合”。再次,由于视觉思维是在主体与客体直接交流中进行,因而主体还完全有可能在对客体的直接感受和体验过程中,使自己头脑里长期积累的经验知识突然间得到升华而产生某种顿司,也即获得某种直觉。我们知道,直觉虽然必须经过严格验证才有可能转化为真理性的认识,但它也确是启发思路、通向真理的一条现实的途径。

所以,我们有理由认为,视觉思维乃是一种与言语思维或逻辑思维不同的富于创造性的思维。概而言之,其创造性或其创新功能主要表现在三个方面:其一,它具有源于直接感知的探索性;其二,它具有运用视觉意象操作而利于发挥想象作用的灵活性;其三,它具有便于产生顿司或诱导直觉,也即唤醒主体的“无意识心理”(unconcious mind)的现实性。所谓唤醒主体的无意识心理,是指它有利于打通主体的自觉意识与无意识心理之间的屏障,从而使无语的或沉默的“无意识体验”,能够迅速转化为可以由自觉意识加以利用的现实和有效的知识。

关于知识问题,我国古代哲学思想中即有所谓意会胜于言传之说。英国著名心一学家和科学哲学家波兰尼(M.Polanyi)在关于科学知识的研究中指出,个体的知识系统实际上有两种类型,即便于与他人沟通或交流的“言传知识”(explicit knowledge),以及无法用言语与他人沟通的“意会知识”(tacit knowledge)。尽管人们往往倾向于重视“言传知识”,但任何人所拥有的“意会知识”,实际上都远多于他的“言传知识”。这也确是我们每个人都能亲身体验到的客观事实。我们这城所谓视觉思维便于诱导直觉或唤醒一个人的无意识心理,所强调的正是在视觉意象的灵活诱导下,而有利于使丰富的“意会知识”向“言传知识”转化或过渡的过程。应该说,所谓直觉也正是这种转化的一种现实的表达方式。

在视觉思维创造性的三方面特征中,如果说,前两个特征是作为信息搜索系统和信息加工系统起作用的话,那么,它们在现时代便差不多都有可能一定程度地为“电脑”的功能所取代。但其第三个特征则不然,也就是说,迄今为止,这一特征可能仍然只为人的视觉思维所独具。因为它所表征的既是人的认识的感性方面椫苯用娑韵质档氖又酰挥质侨说娜鲜兜睦硇苑矫鏃使意会知识向言传知识转化的思维顿悟或直觉;或者正是人的认识的感性和理性的交汇或融合。而这种思维特征,至少在目前似乎还很难预计可以为任何形式的机器系统的功能所取代。

四、关于视觉思维概念确立的认识论意义问题

假定我们承认视觉思维存在的合理性,并认为它确是一种富于创造性的思维,因而对于人的认识发展具有鞭特殊的重要作用,那么,视觉思维概念的确立也就应该是合理的。不过,即令如此,这一概念在哲学认识论上的意义究竟何在,显然还需要加以详尽的论证,尤其是它还涉及到与传统的哲学观念不符的问题。

但这需要进行实质性的研究。目前的情况似乎是,哪怕能提出需要进行深入研讨的问题之所在,或所应研究的问题范围为何,差不多就已经可看作是一种认识上的或观念上的进展。

在这一点上,阿恩海姆的看法也具有一定的启发性。从阿恩海姆的诸多论述中可以看到,他之所以研究视觉思维,正是因为人们长期以来对感知觉与思维、感性与理性,进而延伸为对艺术与科学的割裂,造成了通向真理之路的障碍,故而有意于填补因这种割裂而形成的鸿沟。在他看来,当艺术家们在运用视知觉进行艺术实践时,其实也就是在这种知觉活动中进行着对事物的理解、选择、概括和抽象;而当科学家们在进行科学创造时,同样也是在其科学思维或科学的理性活动中,有效地运用着自己的视觉意象。正是基于此,所以阿恩海姆如此鲜明地认为:“所谓视知觉,也就是视觉思维。”

换句话说,阿恩海姆关于视觉思维的一系列观点和论证,其深刻含义即是在于:知觉与思维之间本来并不存在鸿沟,鸿沟是由于人们在认识上的割裂所造成的。而且他还认为,其所以产生这种认识上的割裂,根源则在西方文明的偏见。

那么,我们如果要研究“视觉思维”概念在哲学认识论上的作用或地位,或是其认识论意义的问题,是否就可以从人类在认识史上究竟何以会形成这种割裂的问题而入手呢?显然,这不仅涉及到哲学史、科学史、艺术史等诸多方面,而且还涉及到东西方文化差异或跨文化研究的问题。但是,既然我们只能说出它所涉及的研究领域如何复杂多样,却不能有分析地指明该做什么或怎么做,那在实质上也就等于什么都没说。不过,它至少还是表明了我们目前所面对的“问题域”的边界还很模糊,因此,使这种尚处于模糊之中的边界领域能够逐渐有所廓清,或许便是当下我们所能做的。