克拉克语言学模型的实验研究

作者：如文来源：中华励志网　2011-07-24

（一）两术语和三术语问题

上述三个原理蕴涵着这样一种加工，即人们在演绎推理过程中是通过这种加工解决问题的。可以把这一加工过程分解为这样几个阶段：理解命题；理解提问；搜索提问中所要求的信息；构成答案。语言学模型的三个原理会在上述一个或几个阶段中影响这一加工的结果。因此，克拉克认为，两术语系列问题包含八种类型，它们由四种简单命题而每种命题又可以有两种不同的提问方式所构成。这八种问题是：

（1）A比B更好，谁最好？

（2）A比B更好，谁最坏？

（3）B比A更坏，谁最好？

（4）B比A更坏，谁最坏？

（5）A不如B坏，谁最好？

（6）A不如B坏，谁最坏？

（7）B不如A好，谁最好？

（8）B不如A好，谁最坏？

在理解命题和理解问题这两个阶段中，必须根据首位功能关系原理来构成“A是好的＋；B是好的”和“X是好的＋＋”这样的心理表征。在这些阶段和以后的阶段中，词汇标记原理预测，由于对“坏的”记忆编码比“好的”编码更复杂，所以对“A是好的＋，B是好的”基本串的编码和恢复，要比“B是坏的＋，A是坏的”基本串的编码和恢复要更快。在第三阶段，搜索提问中所要求的信息，被试执行提问中所包含的指令。一致性原理只在第三阶段起作用。当问题与命题具有一致性时，被试将花费更少的时间；假如被试需要重新对问题进行解释并对它重新进行标记，则需要花费更多的时间。

（二）实验一：两术语系列问题

像表4-10所示的四种两术语系列问题的命题，在表层结构和深层结构中都可以匹配。对于“A比B更好”（命题Ⅰ）和“A不如B坏”（命题Ⅰ′，）这两类命题，构成命题的两个术语之间在语义的表层结构中有着同样的顺序，即A在这两个命题中都是构成主语的项，B在两个命题中都是构成谓语的项，其术语间的关系都意指“在‘好’的维度上作‘更……’的限定”。ｚhlｚw.ｃom中华勵志网但是，命题Ⅰ与命题Ⅰ′在语义上并没有共同的深层结构。就像在表410中分析那栏所示的那样，命题Ⅰ是由含有“好”的基本串所激发的，而命题Ⅰ′则由含有“坏的”基本串所激发。在语义的深层结构中，命题Ⅰ是与命题Ⅱ′（即“B不如A好”）相似的。因此，这四种命题允许在语义的表层结构和深层结构中的次序作正交比较：Ⅰ与Ⅰ′、Ⅱ与Ⅱ′这两对命题之间在语义的表层结构中有相同次序，Ⅰ与Ⅱ′和Ⅱ与Ⅰ′这两对命题则在语义的深层结构上相似。根据语言学模型的三个原理，克拉克认为，各种命题类型的解题时间将主要受三种因素的影响，即命题的类型、提问的方式、深层结构的影响。

实验材料　用常用的由四个字母所构成的英国人的人名（如John）构成上述四类问题，每一类型又跟随两种不同的提问方式，这样就构成八种不同类别的问题。每种类别的问题各包含四例，则一共有32个问题。每个问题中的名字配对各不重复。用IBM微机以呈现卡片的方式来呈现每个问题，每次呈现一个问题。呈现方式如“如果皮特不如约翰坏，那么谁最好？”把32个问题分为四组，每组各含上述八种类别的每类各一道问题。每组问题中同类问题的次序随机排列成不同次序呈现给被试。其中第一组问题作练习之用。

被试　20名学习普通心理学课程的大学生。

实验程序　给被试某种信号后让他按键翻开一张卡片，要求他大声地阅读屏幕上呈现的问题，并且在保持正确的条件下尽可能快地作出回答。以百分之一秒为单位记录下被试从给出第一个信号到他答完的时间。被试以这种方式做完32个问题后，再让被试在不用作答的情况下重复这一程序。用第一阶段的时间减去第二阶段的时间的差作为被试对32个问题每个问题的解释时间。克拉克认为可以用这一程序来改正被试在阅读不同问题时可能有的阅读差异。

把每个被试在每类问题上耗时最长的那一个反应时间去掉后，再对剩下的两个进行分析。可以认为，克拉克认为这样可以消除由于注意力不集中或由其他因素而导致的偶然的很长解题时间的影响。在进行分析前也把回答不正确的问题去掉（在非练习问题中只有6%）。

实验结果　见表4-10。

表4-10 解决两术语系列问题的平均反应时间

问题的形式

分析

提问的形式

平均反应时间

最好？

最坏？

Ⅰ

A比B更好

A是好的

B是好的

0.61秒

0.68秒

0.64秒

Ⅱ

B比A更好

A是坏的

B是坏的

1.00秒

0.62秒

0.81秒

Ⅰ′

A不如B坏

A是坏的

B是坏的

1.73秒

1.58秒

1.66秒

Ⅱ′

B不如A坏

A是好的

B是好的

1.17秒

1.47秒

1.32秒

表4-10列出了两术语系列问题的平均反应时间。由于在此不可能有零时间或负反应时间，故用算术均数取代更常用的几何均数。这些反应时很明显是支持前述理论的预测的。

首先，首位功能关系原理预测反应时间将与深层结构有关，而不是与其表层结构有关。实验结果中，被试解答结构Ⅰ的问题的平均反应时间（在此为0.61秒），比他们解答结构Ⅱ的问题的反应时间（在此为1.00秒）更短。假如这种差异是由表层结构中的次序因素而导致的话，那么，被试在解答结构Ⅰ′问题的反应时间也应该比解答结构Ⅱ′问题的反应时间更短；而如果这种差异是由其基本字串的术语的意义因素所引起的话，那么被试解答结构Ⅱ′问题的反应时间就要比解答结构Ⅰ′问题的反应时间更短。但是，实验得到的数据显然支持笫二种假设：被试解答结构Ⅰ和结构Ⅱ′这两类问题的反应时间显著地比解答结构Ⅱ和结构Ⅰ′这两类问题的反应时间更短，其差异的统计检验值为F＝8.79，df＝1/19，P＜0.01，未发现显著的交互作用。首位功能关系原理预测反应时间与深层结构有关这一观点在此得到验证。

其次，词汇标记原理预测，解答以“好的”为基本串的问题的反应时间要比解答以“坏的”为基本串的问题的反应时间要更短。需注意，如果结果Ⅰ和Ⅱ′的解题反应时间相应地比Ⅱ和Ⅰ′更长的话，也支持首位功能关系原理；只要具有相似深层结构的问题在反应时间方向上一致地不同于另两个问题就支持首位功能关系原理。但这里的结果是很特殊的：总的来说，具有“好的”的问题，即结构Ⅰ和Ⅱ′，在反应时间上总是要比具有“坏的”的问题的反应时间短。这一结果支持词汇标记原理。

最后，一致性原理预测，所问的问题与其命题在基本字串上具有一致性的话，那么回答这类问题的反应时间要比回答两者间不具备一致性的问题的反应时间要更快。实验结果也支持这一原理的预测，结构Ⅰ和结构Ⅱ′这两种问题类型的基本字串的意义是“好的”，被试在解答这两类问题时，对提问时用“谁最好”提问的回答的反应时间比用“谁最坏”提问时的反应时间更短；相反，结构Ⅱ和结构Ⅰ′这两种问题类型的基本字串的意义是“坏的”，被试在解答这两类问题时，对用“谁最好”提问的回答的反应时间比用“谁最坏”提问时的反应时间更长（F＝11．32， df＝1/19， P＜0．05）。未发现其他的显著交互作用。用“谁最好”来进行提问时，较之于用“谁最坏”进行提问的回答反应时间，在以“好的”为基本字串的结构Ⅰ和Ⅱ′中的反应时间更短，而在以“坏的”为基本字串的结构Ⅱ和Ⅰ′中的反应时间要更长。

最后一点发现是，对那些用比较命题（比……更……）的问题要比对那些带有否定（不如……）的问题解决得更快，F＝18.65， df＝1/19， P＜0.001，未发现其他的显著交互作用。有人认为，在句法上否定等同要比比较更为复杂；在转换语法的最新版本中，否定等同至少需要多一次转换──即否定──来生成否定等同结构。从概念上说，“B不如A好”是“B不如A坏”的否定，也是与“B比A更好”的相同复杂水平的结构。由于在语义信息上多一点信息，故否定自身要多一点时间进行加工（Gough， 1965）。

（三）实验二：三术语系列问题

二术语系列问题对于大部分人来说通常都能解决。正如下面所要见到的那样，能解释这些问题难度的几个原理也能用于解释三术语系列的最难的问题。为了对三术语系列问题中的更大的存储难度作出解释，这里还需要加上另外一个假设。

三术语系列问题含有两个命题和一个提问，如“如果约翰比皮特好，并且约翰比迪克坏，那么谁最坏？”可以在使用更好、更坏、最好和最坏等词的16种问题类型中表述这三个术语（约翰、皮特和迪克）之间同样的等级次序。正如表411中所示，存在着四种基本的命题配对，我们把它们标为Ⅰ、Ⅱ、Ⅲ、Ⅳ。用这16种类型的问题，可以使这四种基本配对在任何一种次序中呈现，并且其提问既可以是“谁最好？”也可以是“谁最坏？”此外，当用“不如……坏”来替换“比……更好”时，还可以再加上16种可能的问题类型。在表4-11右边一半中列出了标为从Ⅰ′到Ⅳ′的四种基本命题配对。对于从类型Ⅰ到类型Ⅳ的问题，虽然在以前曾有过研究，但对从类型Ⅰ′到Ⅳ′的研究则没有过。为使问题更易理解，我们在此约定，A在问题中是最好的，C是最坏的，B则是处于中间位置的。

就像在表4-10中的问题那样，表4-11中的问题既可以是类似的表层次序匹配，也可以是类似的深层结构匹配。我们用成对的罗马数字来代表表层类似问题之间的匹配，例如类型Ⅰ和Ⅰ′。除关系项外其他是一致的。这例的关系（相应为“比……更好”和“不如……坏”）都意指“比……更好”的程度。然而，每对罗马数字的配对在深层结构上则是不同。基于问题类型Ⅰ的形容词是“好的”，而基于问题类型Ⅰ′的形容词则是“坏的”。ｚhlｚw.ｃom中华勵志网就这两类问题的基本字串的深层结构而言，Ⅰ和Ⅱ′是相似的。另外，Ⅱ和Ⅰ′、Ⅲ和Ⅳ′及Ⅳ和Ⅲ′也都是相似的。

表4-11 三术语系列问题的类别(略)

语言学模型的三个原理为同质命题（类型Ⅰ、Ⅱ、Ⅰ′和Ⅱ′）的问题提供了一系列的预测，如：

预测1：就像在二术语系列问题中那样，带有“好的”关系术语（Ⅰ和Ⅱ′）会比带有“坏的”的关系术语（Ⅱ和Ⅰ′）更容易解决；

预测2：同样地，提问与命题中的信息具有一致性的问题要比没有一致性的问题更容易解决，如在类型Ⅰ和类型Ⅱ′的问题中，用“谁最好”来提问比用“谁最坏”的提问更容易，在类型Ⅱ和类型Ⅰ’的问题中，则用“谁最坏”来提问比用“谁最好”的提问更容易。

这些原理对类型Ⅲ、类型Ⅳ、类型Ⅲ′、类型Ⅳ′──那些不同质的命题──的预测效果比另外四种类型的预测还要更好些。以类型Ⅲ的问题为例，它包含下列基本字串：A是好的，B是好的，B是坏的，C是坏的。对于“谁最好”的提问，其答案是A，这是个属于与问题“X是好的＋＋”的基本字串一致的术语；对于“谁最坏”的提问，其答案是C，这也是个满足一致性条件的提问。另一方面，类型Ⅳ的问题表明命题与问题是完全不同质的。对于“谁最好”的提问，答案是A，这是基本字串“A是坏的”的一部分；对于“谁最坏”的提问，其答案是C，但它又是基本字串“C是好的”的一部分。由于这种内部不一致，所以，类型Ⅳ的问题要比类型Ⅲ的问题更难。在它们的深层结构中，类型Ⅲ′与类型Ⅳ是相似的，类型Ⅳ′与类型Ⅲ是相似的。由于同样的原因，内部不一致的类型Ⅲ′问题要比内部具有一致性的类型Ⅳ′问题更难解决。

实验材料　用表4-11中所列的32种问题类型的每一种构成三个问题（共96个问题）。问题中使用的术语是常见的由4个字母组成的男人姓名。没有一对名字会在多于一个问题中重复出现。此外，还有4个练习问题，每个都包含一个比较命题和一个否定等同命题。

被试　13名必修普通心理学课程的大学生。

实验程序　在IBM微机中以下列形式呈现每个问题：

如果约翰不如皮特好；

并且约翰不如迪克坏；

那么，谁最好？

迪克、皮特、约翰。

把这些问题排列成四组。前一组是练习题，后三组每组都包含32种问题的每一种问题。在问题组内，问题呈现次序随不同被试而随机不同。后三组问题中跟随提问的名字次序在各组之间和各类问题之间是平衡的。被试在某个键上按一下即打开一个问题。要求他自己默读问题，并在满足精确性的条件下尽快产生答案，以百分秒的精度记录从他按笫一个键到他按下答案止的反应时间。被试一共要解决104个问题，每个问题之间稍有些停顿。被试发现在这种复杂问题上，大声读出来会中断其思路。因此，在下面的分析中，解题时间包含了读题目的时间。假如读题目会对被试的反应时间有影响的话，它也只对含有“更好”的句子有影响，因为在英文中，better（更好）含两个字节，而worse（更坏）只有一个字节。就像在实验一中那样，每个被试对每类问题的回答所用时间最多的那一次不记入成绩，对问题作错误回答的解题时间也记入成绩（只占答案的7%）。

实验结果　见表4-12。

表4-12 被试在实验二中的几何平均解题时间表（略)

克拉克认为，他所提出的语言学模型的各种预测在表4-11的几何平均解题时间中得到了证实。

根据首位功能关系原理和词汇标记原理的预测，总的来说，被试在解答类型Ⅰ和类型Ⅱ’的问题时，相应地要比解答类型Ⅱ和类型Ⅰ′的问题更快。表4-11中列出的解题时间证实了这一预测。被试解答类型Ⅰ问题的总的平均反应时间为5.49秒，比解答类型Ⅱ的问题时的总的平均反应时间5.91秒确实更快。被试解答类型Ⅱ′问题的总平均反应时间为6．22秒，比解答类型Ⅰ′的问题时的总平均反应时间6.59秒也更快。用统计方法对这些差异进行检验后的检验值为F＝5.38，df＝1/12，P＜0.05，表明其差异在统计学上具有显著意义。未发现有显著的交互作用（是在解题时间的对数上实施方差分析的）。

根据首位功能关系原理和一致性原理的预测，总的来说，被试在解答类型Ⅲ和类型Ⅳ’的问题时，相应地要比解答类型Ⅳ和类型Ⅲ′的问题更快。这一预测在此也得到了证实。被试解答类型Ⅲ问题的总平均反应时间是5.33秒，比解答类型Ⅳ′的问题时的总平均反应时间6.19秒确实更快。被试解答类型Ⅳ问题的总平均反应时间为5.63秒，比解答类型Ⅲ′的问题时的总平均反应时间6.52秒也更快。用统计方法对这些差异进行检验后的检验值为F＝4.92，df=1/12，P＜0.05，表明其差异在统计学上具有显著意义。未发现有显著的交互作用。

首位功能关系原理和一致性原理这两个原理还预测，当用“谁最好”进行提问时，被试对类型Ⅰ和类型Ⅱ′的问题解决要比用“谁最坏”进行提问时更快。当用“谁最坏”进行提问时，被试对类型Ⅱ和类型Ⅰ′的问题解决要比用“谁最坏”进行提问时更快。实验结果支持这一预测。当用“谁最好”进行提问时，被试对类型Ⅰ的问题解决在第一例中是5.42秒，在第一例中是4.98秒，比相应用“谁最坏”提问时的6.10秒和5.52秒确实更快（其他问题上对两种不同提问方式的不同反应时间的对比，请读者自己在表4-12中阅读）。对这些差异的统计检验值为F＝9.73，df＝1/52，P＜0.005，表明其差异在统计学上具有显著意义。未发现显著交互作用。比较问题（从Ⅰ～Ⅳ）要比否定等同问题（从Ⅰ′～Ⅳ′）的解题时间更短，F＝25.06，df＝1/12，P＜0.001，。在此，再次表明深层结构要比表层结构术语次序相对来说更重要。

克拉克认为，在他于1969年所实施的另一个实验结果的方差分析中更进一步证实了这些结果。在那个实验中，他让100名被试解决在此设计的32个问题。另外再加上了32个在形式逻辑上推不出结论的问题，要求被试在10秒内解决每个问题。结果表明，被试未能在10秒钟内正确解决的那些题目中，其犯错误的人次分布与表4-11中的解题时间的分布几乎是一致的：被试犯错误的次数更多的试题也就是在本实验要花更多时间去解决的试题。

综上所述，受乔姆斯基理论的影响，克拉克在对线性三段论推理进行研究时提出了语言学模型。这一模型包括三个基本原理。

首位功能关系原理倾向于用深层结构中的基本字符串来解释人们在线性三段论推理中的心理表征问题，认为基本字符串等同于以命题为基础。其中的基本观点是，一个前提的两个逻辑项分别由命题来表征。例如，像“约翰比皮特好”这样的比较句，对其编码是为指明约翰和皮特两人都好，但约翰更好。因此，其表征基础是“约翰是好的＋，皮特是好的”，其中，“＋”是权重符号，表明两者之间原有的逻辑关系是前者表征的权重较之后者大；而“皮特比约翰更差”这一命题会被表征为“皮特是差的＋，约翰是差的”。ｚhlｚw.ｃom中华勵志网

词汇标记原理认为，具有两极性的形容词的许多配对都是不对称的。一个形容词可以有一个中性的无标记含义，也可以有一个与之对立的有标记的含义。所谓形容词的两极性配对，是指一个形容词有与之对立的另一个形容词存在，如好—坏、高—矮、长—短、深—浅等。所谓无标记的形容词是指像上述好、高、长、深这类形容词，它们是中性的，只传达在量表上的相对位置，无标记的形容词常是一个维量的名称，如高度，长度等。所谓有标记的形容词是指像坏、矮、短、浅等这类形容词，在使用时它们不是中性的，而是包含有某种绝对信息。例如，如果我们说“约翰好吗？”，这仅仅是说约翰在好—坏范围中处于什么位置，但如果我们说“约翰坏吗？”，这就蕴涵着我们认为约翰是坏的。这种有标记—无标记的关系在很多（但不是所有）两极配对的情况下都会发生。克拉克的语言学标记原理认为，较之于有标记的形容词，如果表征的基础是无标记的，则更容易从语义记忆中恢复信息。例如，“A比B更好”要比“B比A更差”加工得更快。

一致性原理则认为，前提与问题的一致性如何会对问题解决有影响，也就是说，如果所要回答的问题与前提的表征一致时，问题可更快地得到解决；不一致时则要更慢得到解决。例如，当前提为“杰克比吉姆高，约翰比吉姆矮”，如果所提的问题是“谁最高”，那么，回答这一问题要比回答“谁最矮”要更快。

点击显示

天天励志正能量

第1/2页

返回心理健康栏目