文档库 最新最全的文档下载
当前位置:文档库 › 第6章 长时记忆2012_1

第6章 长时记忆2012_1

深度学习系列(5):长短时记忆网络(LSTM)

循环神经?网络(RNN )在实际应?用中很难处理理?长距离依赖的问题。 有的时候,我们仅仅需要知道先前的信息来完成预测任务。例例如,我们有?一个语?言模型?用来基于先前的词来预测下?一个词,?比如我们预测“the clouds are in the sky”最后的词的时候,我们不不需要任何其他的上下?文,很显然下?一个词就是sky 。在这种情况下,相关的信息与需要预测的词位置之间的间隔很?小,?而RNN 可以学会使?用较近距离的信息。 但是到了了?一个更更加复杂的场景,假设我们试着预测“I grew up in France......I speak ?uent French”中最后的词,从这句句话的信息来看,下?一个词很有可能是?一种语?言的名字,但具体到是哪种语?言,我们就需要在与之距离较远的“I grew up in France”中得到。这说明相关信息与当前预测位置之间的间隔就肯定变得相当的?大。 不不幸的是,在这个间隔不不断增?大时,RNN 会丧失学习到连接如此远的信息的能?力力。 深度学习系列列(5):?长短时记忆?网络(LSTM ) ?一、?长期依赖问题(Long-Term Dependencies )

当然,在理理论上,RNN绝对可以处理理这样的?长期依赖问题。?人们可以通过调参来解决,但是在实践中,RNN肯定不不能够成功学习到这些知识。Bengio, et al. (1994)等?人对该问题进?行行了了深?入的研究,它们发现?一些使训练RNN变得?非常困难的相当根本的原因。 既然找到了了问题的原因,那我们就能解决它。从问题的定位到解决,科学家们?大概花了了7、8年年的时间。终于有?一天,Hochreiter和Schmidhuber两位科学家发明出?长短时记忆?网络,?一举解决了了这个问题。 ?二、LSTM的核?心思想 Long Short Term?网络,?一般就叫做LSTM,是?一种特殊的RNN变体,它可以学习?长期依赖信息。LSTM由Hochreiter和Schmidhuber在1997年年提出,并在近期被Alex Graves进?行行了了改良和推?广。在很多问题上,LSTM都取得了了相当巨?大的成功,并得到了了?广泛的使?用。 LSTM通过刻意的设计来避免?长期依赖问题。记住?长期的信息在实践中是LSTM的默认属性,?而?非需要付出很?大的代价才能获得的能?力力! 所有的RNN都具有?一种重复神经?网络模块的链式的形式。在标准的RNN中,这个重复的模块只有?一个?非常简单的结构,例例如?一个tanh层。 LSTM同样是这样的结构,但是其中重复的模块拥有?一个不不同的结构。不不同于单?一神经?网络层,

语言研究新视角_工作记忆的理论模型及启示

语言研究新视角* ———工作记忆的理论模型及启示 肖晓燕王继红 (厦门大学,厦门361005;麦考瑞大学,悉尼2109) 提要:工作记忆是认知心理学和认知神经学的重要理论概念,它对语言等复杂认知行为的研究具有重大理论意义。通过与短时记忆概念的对比,本文阐述工作记忆概念的具体含义,梳理欧洲和北美具有代表性的、与语言研究密切相关的四种工作记忆理论模型和两种广为采用的研究方法,分析工作记忆对语言习得、言语理解以及传译等语言研究领域带来的重要启示。 关键词:工作记忆;短时记忆;模型;方法;语言研究 中图分类号:H319.3文献标识码:A文章编号:1000-0100(2011)04-0086-5 A Working Memory Perspective on Language Research —Models and Implications Xiao Xiao-yan Wang Ji-hong (Xiamen University,Xiamen361005,China;Macquarie University,Sydney2109,Australia)Working memory(WM)is a key theoretical concept from cognitive psychology and cognitive neuroscience.It has a great deal to offer research into complex cognitive behaviors such as language.This paper clarifies the concept of WM through compari-son with the better known concept of short-term memory,and presents a critical review of four influential WM models which are highly relevant to language research and two common research methodologies.The paper also provides an analysis of the implica-tions of WM theories for research into various fields concerning language,including language acquisition,language comprehen-sion,and interpreting(both spoken and signed). Key words:working memory;short-term memory;models;methodologies;language research 1引言 工作记忆(working memory)是认知心理学和认知神经学中非常重要的理论概念,也是认知科学中最为活跃的研究领域之一。工作记忆的概念最早由心理学家Mill-er等人(1960)提出,随着Baddeley&Hitch(1974)的工作记忆三成分模型而闻名于世。Baddeley(2002:85)将工作记忆定义为“一个或者一系列用来临时储存和操纵信息(以便完成当前认知任务)的系统”。工作记忆是人类智力活动的核心,它对言语理解、决策推理、心算加工等复杂认知活动的完成起着决定性的作用。 由于语言是人类独一无二的高级智能活动,认知心理学大量关于工作记忆的研究都围绕工作记忆与言语活动的关系展开,特别是言语理解(崔耀1997:1-5,陈平文2007:9-12)。随着认知科学的发展,语言研究界也开始大量借用其理论概念、模型和研究方法进行跨学科理论和实证研究。工作记忆是与语言研究最为密切相关的理论体系之一,可以为语言研究的诸多领域,尤其是语言习得(language acquisition)、言语理解(language compre-hension)以及传译(interpreting)等的研究提供重要的理论框架、研究思路以及研究方法。鉴于语言研究界对工作记忆的认识还远不够深入,甚至存在一些误区(如目前仍有教科书和文章将短时记忆与工作记忆混为一谈),本文作者希望通过与短时记忆的对比,澄清工作记忆的根本含义与性质;同时,作者从欧洲和北美影响较大的工作记忆理论模型中选择了其中4种与语言研究密切相关的理 2011年第4期总第161期 外语学刊 FOREIGN LANGUAGE RESEARCH 2011,No.4 Serial No.161 *本文系国家社科基金项目“手语翻译理论建构”(08CYY005)的阶段性成果。

工作记忆研究的现状

工作记忆研究的现状 [摘要]:有关记忆的研究由来已久,90年代又兴起了对于工作记忆的研究热潮。通过对工作记忆与短时记忆的对比,工作记忆研究方法的现状与观点的叙述以及工作记忆的理论模型的介绍和理论问题的探讨,简要回顾有关工作记忆研究的发展和理论趋向。 [关键词]:工作记忆;语音回路;视空初步加工;中枢执行系统; 有关记忆的研究由来已久,20世纪90年代又兴起了工作记忆研究的热潮,本文主要通过对工作记忆与短时记忆的对比、工作记忆研究方法的现状与观点的叙述以及工作记忆的理论模型的介绍和理论问题的探讨,简要回顾有关工作记忆研究的发展和理论趋向。 一、工作记忆与短时记忆 1974年,Baddeley和Hitch在模拟短时记忆障碍的实验基础上,从两种记忆存储库理论中的短时记忆的概念出发,提出了工作记忆的三系统概念,用“工作记忆”代替了原来“短时记忆”的概念。Baddeley认为工作记忆指的是一种系统,它为复杂的任务比如言语理解、学习和推理等提供临时的储存空间和加工时所必需的信息,工作记忆系统能同时储存和加工信息,这和短时记忆概念仅强调储存功能是不同的。工作记忆分成三个子成分,分别是中枢执行系统、视觉空间初步加工系统和语音回路。 但是直到今天很多教科书都还依旧将工作记忆等同于短时记忆(如张春兴的《现代心理学》等等)。虽然短时记忆与工作记忆的含义以及概念有相通的地方,但是短时记忆与工作记忆是不同的两个概念,并且对于这两个概念应该从机能的角度和构成的角度两个方面加以区分。 第一,从机能的角度加以区分。 如果从机能的角度考虑工作记忆,它所保持、存储的信息是以后复杂的认知活动中不可缺少的,并且基于这种存储基础上的处理与加工是以后复杂的认知活动的前提条件。举一个例子,比如说心算中的记忆就是一种工作记忆。而短时记忆的机能仅仅是起到对信息的存储作用,其存储的信息未必一定是下一步认知活动所要运用到的信息,比如说我们要打电话,所查到的一个电话号码,我们拨过这个电话以后就忘了。如果仅从对信息的存储这一角度考虑,工作记忆与短时记忆是相通的,但是在机能方面工作记忆比短时记忆,多了一个前期的加工功能。 第二,从构成的角度加以区分。 与机能的角度不同的是,工作记忆与短时记忆在系统结构,构成水平上的区分是相当复杂的。工作记忆系统与短时记忆系统到底是两个完全独立的系统,还是短时记忆系统包含工作记忆系统,还是反之,这一直都是人们争论的话题。但是支持工作记忆系统包含短时记忆系统的人要相对多一些。Baddeley & Logie于2002年、Cowan于1999年的研究都支持这种观点。用Engle的话说就是,工作记忆系统是由“短时记忆”和“控制加工机能”两个部分构成的。但是必须指出的是这里的“短时记忆”指的是“短时记忆存储库”。 按照两种记忆存储库理论的观点,短时记忆的存储仅仅靠“短时记忆存储库”这一个单一的功能是无法实现的。要想实现短时记忆的机能,“控制加工机能”是不可缺少的重要部分。从这个观点出发“工作记忆”与“短时记忆”在组成结构上并没有大的差别,都是由“短时记忆”和“控制加工机能”所构成的。但是“工作记忆”与“短时记忆”在组成结构的差别

长短时记忆神经网络模型(LSTM)简介

5.1.1 LSTM模型概述 长短时记忆网络是一种深度学习方法,目前是机器学习领域中应用最广泛的模型,并在科技领域有了众多应用。在2015年,谷歌通过LSTM模型大幅提升了安卓手机和其他设备中语音识别的能力,之后谷歌使用LSTM 的范围更加广泛,它可以自动回复电子邮件,生成图像字幕,同时显著地提高了谷歌翻译的质量;苹果的iPhone 也在QucikType和Siri中使用了LSTM;微软不仅将LSTM用于语音识别,还将这一技术用于虚拟对话形象生成和编写程序代码等等[56]。 LSTM算法全称为Long short-term memory,最早由Sepp Hochreiter和Jürgen Schmidhuber于1997年提出[57],是一种特定形式的循环神经网络(RNN,Recurrent neural network,),而循环神经网络是一系列能够处理序列数据的神经网络的总称。RNN在处理时间序列上距离较远的节点时会发生梯度膨胀和梯度消失的问题,为了解决RNN的这个问题,研究人员提出基于门限的RNN(Gated RNN),而LSTM就是门限RNN中应用最广泛的一种,LSTM通过增加输入门(Input Gate),输出门(Ouput Gate)和遗忘门(Forget Gate),使得神经网络的权重能够自我更新,在网络模型参数固定的情况下,不同时刻的权重尺度可以动态改变,从而能够避免梯度消失或者梯度膨胀的问题。LSTM的结构中每个时刻的隐层包含了多个记忆单元(Memory Blocks),每个单元(Block)包含了多个记忆细胞(Memory Cell),每个记忆细胞包含一个细胞(Cell)和三个门(Gate)[58],一个基础的LSTM结构示例如图5- 1所示:

时间序列分析

1.1时间序列定义: 时间序列是指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列. 构成要素:现象所属的时间,反映现象发展水平的指标数值.要素一:时间t;要素二:指标数值。 1.2时间序列的成分: 一个时间序列中往往由几种成分组成,通常假定是四种独立的成分——趋势T、循环C、季节S和不规则I。 T 趋势通常是长期因素影响的结果,如人口总量的变化、方法的变化等。 C任何时间间隔超过一年的,环绕趋势线的上、下波动,都可归结为时间序列的循环成分。S许多时间序列往往显示出在一年内有规则的运动,这通常由季节因素引起,因此称为季节成分。目前,可以称之为“季节性的周期”,年或者季节或者月份。 I时间序列的不规则成分是剩余的因素,它用来说明在分离了趋势、循环和季节成分后,时间序列值的偏差。不规则成分是由那些影响时间序列的短期的、不可预期的和不重复出现的因素引起的。它是随机的、无法预测的。 四个组成部分与观测值的关系可以用乘法模型或者加法模型或者综合。 1.3预测方法的选择与评估 方法P216 三种预测方法:移动平均法、加权移动平均法和指数平滑法。因为每一种方法的都是要“消除”由时间序列的不规则成分所引起的随机波动,所以它们被称为平滑方法。平滑方法对稳定的时间序列——即没有明显的趋势、循环和季节影响的时间序列——是合适的,这时平滑方法很适应时间序列的水平变化。但当有明显的趋势、循环和季节变差时,平滑方法将不能很好地起作用。 移动平均法使用时间序列中最近几个时期数据值的平均数作为下一个时期的预测值。移动平均数的计算公式如下: 指数平滑法模型: 式中Ft+1——t+1期时间序列的预测值; Yt——t期时间序列的实际值; Ft——t期时间序列的预测值; α——平滑常数(0≤α≤1)。 均方误差是常用的(MSE) 标准误差定义为各测量值误差的平方和的平均值的平方根。 设n个测量值的误差为ε1、ε2……εn,则这组测量值的标准误差σ等于:

记忆模型

一、记忆模型 1、多重存储模型的特点、内容 多重存储模型,记忆由三种记忆存储构成,即感觉记忆、短时记忆和长时记忆。由于特别强调短时记忆和长时记忆分开存储,所以,该模型有时也称作双重记忆模型。外部环境中的刺激,首先进入感觉记忆。感觉记忆是一个大容量存储系统,它记录个体所感觉到的所有信息。需要说明的是,视觉感觉记忆和听觉感觉记忆研究较多。感觉记忆中的信息很快被传递到短时记忆,短时记忆只包含一小部分信息。短时记忆中的记忆很脆弱。除非得到重复否则大约30秒之内便会从记忆中丢失。长时记忆有一个非常大的容量。除了几分钟以上的记忆之外,长时记忆好包含几十年以前的记忆。长时记忆中的记忆相对永久,丢失的可能性相对要小。 按照Atkinson和Shiffrin的假设,短时记忆中的材料按听觉或声音特性编码,而长时记忆中的材料按语义和意义特性编码。 2、工作记忆是我们完成认知任务时,对信息进行暂存储和操作的一个记忆系统。工作记忆不单单是一个被动的存储器。相反,对信息操作的强调意味着,工作记忆更象是一个工作台。在这个工作台上,材料持续地得到处理、结合和转化 3、产生效应是指被试在产生条件下的回忆成绩更好。许多实验都观察到这种效应。实验以英文单词为材料,并且使用了两组被试。一组被试完成产生任务,另一组被试完成大声朗读任务。结果发现,产生任务条件下,被试后来的回忆成绩更好,即出现了产生效应。 4、自我参照效应是指当人们尽力将信息和自己相联系时,回忆出的信息更多。实验要求被试从词的物理特性、听觉特性、语义特性或自我参照等四个角度,对词表进行加工。当人们联系自身加工或考虑一个词时,该词的记忆效果最好。在自我参照研究中,同不能用到自己身上的词相比,人们更可能回忆出能用到自己身上的词。 5、Tulving的记忆模型则把注意力集中在记忆中所存储的材料的性质上。Tulving(1972)认为,情节记忆中存储着关于事件发生时间以及事件之间关系的信息。情节记忆不仅储存着过去发生的事件,还储存着将来发生的事件以及记忆测验上的项目表。 语义记忆是指被组织起来的一般知识,它包括相当稳定的知识结构,包括关于词的知识,也包括许多不容易用词来表达的我们所知道的东西。 程序性记忆是关于如何做某事或关于刺激和反应之间联系的知识。程序性知识经常难以用语言来描述,从发展的角度看,程序性知识在婴儿期最先发展,接着是语义知识,最后才是情节记忆。 二、外显记忆和内隐记忆 1、外显记忆任务要求对先前经历进行有意识回忆。象自由回忆、线索回忆和再认这样的传统记忆测验,都属于外显记忆任务。它们有一个共同特征,即它们都需要外显地参照特定的学习情节,都需要对特定的学习情节进行有意识回忆。 2、内隐记忆任务不要求人们对先前经历进行有意识回忆,而只是要求人们完成一种知觉任务或一种认知任务。典型地,这些任务看起来与先前学习过的任何材料都无关。任务的指导语中也丝毫不提“记得”或“回忆”这样的字样。常用的内隐记忆任务包括词干补全、残词补全、指明几个刺激中自己所偏爱的那一个、词汇判断和知觉辩认。共同特征是在这些任务中,特定学习情节中所编码的信息,无需后来有意识的或深思熟虑的回忆,而是通过先前学习情节中所获得的信息对后来作业的促进作用,表达出来。 3、纯粹暴光效应是指被试对原来不熟悉,但现在通过暴露而熟悉了的刺激的偏爱,因此也称偏爱效应。因为在实际的测验期间并没有提及先前的学习情节,所以,纯粹暴露效应,在性质上,属于内隐记忆任务。 4、目击者证词的可信度的影响因素 心理学家从以下方面提出目击者证词的可信度。当人们识别面孔时,当人们在所目击的事件发生之后接受了误导性的信息时,当人们对从未发生的事件产生虚假记忆时,记忆的不精确性都会出现。面孔识别的准确性受很多因素的影响,人们通常对属于自己种族的面孔记忆得更好,如果事发时目击者对嫌疑犯面孔的注意受到其他刺激的干扰,记忆的准确性也会下降倒摄抑制是记忆研究中的一个重要概念,它是指因为最近学过的新材料的干扰,人们回忆旧材料有困难。倒摄抑制也会导致目击者不精确的记忆。 5、Loftus等人的幻灯片实验,说明什么? 研究者向被试呈现一系列幻灯片。一辆跑车在一个交叉路口停下来,然后转弯,撞上一个行人。一半被试所看的幻灯片上交叉路口处又准许其他车辆先行的标志。另一半被试则在交叉路口处看到停车标志。呈现时间20分钟~一周,被试回答一些关于交通事故的细节问题。一个关键问题,或者包含于幻灯片中细节一致的信息,或者包含不一致的信息,或者不提及这种细节。回答完问题后,被试看到两张幻灯片,一张上面又准许其他车辆先行的标志,另一张上面有停车标志。被试的任务是选出他们先前看过的幻灯片。结果发现,同接受一致和中性两种信息的被试相比,接受了不一致信息的被试,再认的准确率要低。这说明,事后的误导性信息,会导致不精确的记忆。

工作记忆广度理论争议的实验研究

1 问题的提出 工作记忆概念源于对短时记忆系统特性的研究。Hebb 于1949年在他的经典著作《行为的组织》中提出了长时记忆和短时记忆的区分。长时记忆涉及神经系统持久的改变,而他把短时记忆归结为暂时的电活动。Baddeley 和Hitch [1]提出原来应视为单一的短时记忆系统分成三个成分。Baddeley 把工作记忆的模型设想为,中央执行系统(central execu -tive ),以及语音环路(phonological loop )和视觉空间缓存器(visuo-spatial sketchpad )的两个子系统[2]。虽然工作记忆的概念是从短时记忆的研究中提出来的,但它与短时记忆有所不同,被定义为一种对信息进行暂时性加工和储存能力有限的系统,在语篇理 解、问题解决、推理和学习等高级认知活动中起着重 要的作用。 工作记忆广度任务要求被试同时进行存储和加工,如Daneman 和Carpenter [3]创建阅读广度任务,要求被试大声朗读句子(要求加工),同时被试要试图记忆每个句子的句尾词,最后回忆这些词(要求存储)。其它的工作记忆广度任务与阅读广度任务相类似,要求被试在保持目标项(如词、数字、空间方向等)的同时操作认知加工(如简单数学计算或心理旋转)。传统的短时记忆任务(如词语广度或数字广度)仅强调被动的存储,而工作记忆广度任务强调双重的任务需要(同时加工与存储),因而更贴近复杂认知任务(如语言理解、问题解决)的特点。阅读广度和 工作记忆广度理论争议的实验研究 杨奇伟 (遵义师范学院教科系,贵州遵义563002) 摘要:通过对西北大学英语和汉语言文学两个专业159名三年级大学生进行英、汉语阅读广度和数字工作记忆广度的测量,文章探讨了工作记忆广度理论中资源分享模型和任务转换假说的争议以及领域通用性和领域特异性的争议。结果不支持任务转换假说,支持资源分享模型。结果同时还表明工作记忆具有一定程度的领域通用性和领域特异性。 关键词:阅读广度;数字工作记忆广度;任务转换假说;资源分享模型中图分类号:G442 文献标识码:A 文章编号:1009-3583(2009)-04-0059-05 An Experimental Research on the Theoretical Issues Regarding Working Memory YANG Qi-wei (Department of Education Science,Zunyi Normal College,Zunyi 563002,China ) Abstract :Through testing Chinese and English reading span of 159juniors,this research aimed to validate hypotheses concerning the nature of individual difference tapped by working memory span tasks.The task-switching hypothesis was not supported by the fact that Chinese reading span was not influenced by the changing of sentence length.All data could be explained by resource-sharing model.The results also revealed both domain generality and domain specificity of work -ing memory. Key words :reading span ;digital working memory span ;task-switching hypothesis resource-sharing model _________________________________________收稿日期:2009-03-20 基金项目:遵义师范学院社会科学基金项目资助(2007014) 作者简介:杨奇伟,男,河南息县人,心理学研究生毕业,遵义师范学院教科系教师,主要从事实验心理学研究。 第11卷第4期 2009年8月遵义师范学院学报 Journal of Zunyi Normal College Vol.11,No.4Aug.2009 59

短时记忆的编码

短时记忆的编码 张新娟 山西师范大学教师教育学院心理系10150201 学号1015020137 摘要基于减法反应时的基本范式,在Posner的经典实验基础上稍作修改,通过测40名大学生被试对短时记忆信息的编码情况,旨在验证“短时记忆中存在视觉与听觉两种编码机制”这一结论,同时掌握反应时测量技术在认知研究中的应用;结论,短时记忆编码有视觉编码也有听觉编码。 关键词短时记忆听觉编码视觉编码减法反应时范式注意 1引言 在认知心理学中,减法反应时既可用于研究某一个信息加工阶段或特征,也可用于研究一系列连续的加工阶段。20世纪60年代以来,根据记忆实验中对错误回忆的分析,最初研究者认为人的短时记忆信息如字母是以听觉形式来表征的,即有听觉编码。但70年代波斯纳等(Posner)的实验却表明,这种信息可以有视觉编码。现在一般认为先出现视觉编码,它保持一个短暂的瞬间,然后出现听觉编码。Posner等应用减法反应时实验清楚地说明,某些短时记忆信息可以有视觉编码和听觉编码两个连续的阶段,这是认知心理学上的重大发现。通过测定被试对短时记忆信息的编码,掌握反应时测量技术在认知研究中的应用。探讨短时记忆的信息编码方式和编码过程。 2研究方法 2.1 被试 山西师范大学心理系1002班学生40名,自愿参加实验。 2.2仪器和材料 仪器:PsyTech-EP2009型心理实验台。 材料:材料:英文字母大写A、B和小写a、b 的不同组合,其中AA(6次)、BB(6次)。Aa (6次)、Bb (6次)、AB(3次)、BA(3次),Ab(3次)、Ba (3次)共36次(72次则重复呈现2遍)。 2.3 实验程序 双击桌面“心仪心理实验平台”图标,弹出登录窗口。对首次登录者请先注册用户;对已做过实验者用已有用户名和密码登录。双击“电脑实验”,打开PsyTech-EP2009型心理实验台主界面。选中左侧实验列表中的“平均差误法测定线段长度的差别阈限”,右边呈现实

时间序列模型stata 基本命令汇总..

时间序列模型 结构模型虽然有助于人们理解变量之间的影响关系,但模型的预测精度比较低。在一些大规模的联立方程中,情况更是如此。而早期的单变量时间序列模型有较少的参数却可以得到非常精确的预测,因此随着Box and Jenkins(1984)等奠基性的研究,时间序列方法得到迅速发展。从单变量时间序列到多元时间序列模型,从平稳过程到非平稳过程,时间序列分析方法被广泛应用于经济、气象和过程控制等领域。本章将介绍如下时间序列分析方法,ARIMA模型、ARCH族模型、VAR模型、VEC模型、单位根检验及协整检验等。 一、基本命令 1.1时间序列数据的处理 1)声明时间序列:tsset 命令 use gnp96.dta, clear list in 1/20 gen Lgnp = L.gnp tsset date list in 1/20 gen Lgnp = L.gnp 2)检查是否有断点:tsreport, report use gnp96.dta, clear tsset date tsreport, report drop in 10/10 list in 1/12 tsreport, report tsreport, report list /*列出存在断点的样本信息*/ 3)填充缺漏值:tsfill tsfill tsreport, report list list in 1/12 4)追加样本:tsappend use gnp96.dta, clear tsset date list in -10/-1 sum tsappend , add(5) /*追加5个观察值*/ list in -10/-1 sum

阅读理解中的长时工作记忆_崔耀

·综述· 阅读理解中的长时工作记忆① 崔 耀 中国科学院心理研究所(北京100012) [摘要]工作记忆是阅读理解研究中经常要涉及到的问题,然而它的性质还需要进一步的探讨。Ericsso n &Kint sch根据大量相关研究,于1995年提出了长时工作记忆的概念,并对阅读理解中长时记忆 的信息提取和存储进行了详细的分析。长时工作记忆的核心是,人们从事非常熟练的认知活动 时,长时记忆中的一部分信息提取和存储具有短时记忆信息加工的性质;工作记忆应该包括短时 工作记忆和长时工作记忆两部分。其他一些研究者也提出了长时记忆中信息的快速提取和存储 问题。 关键词 阅读理解,工作记忆,长时工作记忆 有关阅读理解的研究中人们一致认为,工作记忆是影响对语言材料进行加工以及心理表征形成的一个重要因素。为了探讨阅读过程中短时记忆的性质,Baddeley&H itch于1974年提出了工作记忆的模型,并由此引发了大量关于工作记忆系统的研究。然而,这些研究大部分是针对该模型的两个子系统的作用而进行的,对中央执行部分(Central Ex ecutiv e)的研究较少,特别是忽视了对信息加工中长时记忆中信息提取和存储动态特性的研究[1]。长期以来,工作记忆一直被看成是对认知加工中任何一个环节上的信息进行的暂时存储。在这种认识的指导之下,在讨论中央执行部分的作用时,人们设计了各种方法对这种暂时存储的容量进行测量。在阅读研究中,最有影响的是Danem an&Carpenter于1980年提出的阅读广度(readin span)的测量方法,以及有关阅读广度与阅读能力之间关系的研究[2]。随着人们对工作记忆研究的深入,中央执行部分的作用和机制逐渐成为注意的焦点。长时工作记忆概念引入了对工作记忆的新解释,也对阅读理解过程中的信息提取和存储进行了详细的分析。 1长时工作记忆机制 Ericsson&Kintsch[3]认为,如果把工作记忆看成是对认知加工中任何一个环节上的信息进行的暂时存储,并用这种定义和相应的机制来解释所有工作记忆现象,就会出现两个问题:(1)目前的各种工作记忆容量的测量方法是否能够用来解释专家,或人们从事非常熟练的认知活动时,所表现出的非常宽广的工作记忆容量?(2)短暂存储的工作记忆是否能够解 ①本文于1996年8月22日收到。

记忆的编码与提取

写在最前面的 实验的分类 (1)回忆类实验这类实验共有三种:系列回忆、自由回忆和对偶回忆 (2)再认类实验这类实验有两种基本程序。 第一是“是/否”式的实验,这是一种“二择一”程序。 第二是“迫选再认”的实验,这是一种“多择一”程序。 一.记忆研究记忆实验仪器和材料 1.计算机 目前使用最广泛的仪器。按照实验程序要求编写好软件程序,,可以方便快捷地对文字和图形等材料的呈现时间、间隔时间实行控制,并且可以自动记录被试的口头反应、按键反应,这样被试在记忆测验中的正误反应、反应时都可被记录下来。 2.速示器 也是研究记忆的常用仪器。其基本构造是一个长方形的不透光的箱子,箱子的一头放置刺激项目片,另一头是观察窗,被试在这里接受刺激项目,且箱内灯光照明时间是可以控制的。现代较先进的速示器是由几个箱子连接组成,每个箱子都是一个视野,分别先后或同时将不同的刺激项目呈现在一个平面上。 记忆实验选用的材料是相当广泛的。一般说来,凡是人们在生活中能感受到的东西都可以作为实验材料,但是实际上由于实验室的条件限制和为了进行实验的方便,在实验中所使用的材料一般要符合以下标准: ①材料对每个被试者来说,在熟悉程度上应是相等的。这样才能保证所有被试者从同一基线开始学习,测出的效果才能归之于实验条件的作用。 ②材料在数量上或意义上可以分为相等的单位。这样既便于记分,又便于对实验结果作数量化的分析。当然,这也不是绝对的,倘若以掌握全部材料所需要的时间或尝试的次数作为记分标准的话,就无需把材料分成相等的单位。 ③材料应为被试者在较短的时间内就可以学会和掌握的。若一次使用的材料过多、费时过长,势必会影响实验的效果,同时让被试这么长时间留在实验室中也是不可能的。 根据上述标准,在记忆实验中可选用的材料还是很多的。这些材料概括起来有二大类:言语材料和非言语材料。言语材料又可分为无意义的和有意义的两类。 无意义音节是言语材料中的一种,言语材料是指音节、字母、单词、句子、诗歌、散文和数字等。其中音节、字母和某种条件下的数字都属于无意义的言语材料。 有意义的记忆研究材料的内容和种类十分广泛,可以是句子、诗歌、散文、词汇到图形、音乐等,很难尽述。研究者使用有意义材料从事记忆研究时,一点也不比使用无意义材料容易。 将有意义材料分解成容易归类的或便于定量的子单位,这些子单位可以是“意群”、“韵律”、“音节”、“词性”、“长度”等等。 其他刺激材料,如图形材料,设计时要考虑“复杂性”、“抽象性”和“相似性”这三个因素。前人的经验表明:被试者面对要求其学习、记忆的图形刺激所做的“意义搜索”过程,要比我们通常认为的“留下感觉印象”的过程复杂得多。由于这个原因,实验者为了取得有效的结论,选择刺激材料的任务就显得很艰巨。 二、除了“图片材料”外,其他比较特殊并具有典型性的材料还有许多,如听觉记忆材料、嗅觉记忆材料、动部分报告法 三、部分报告法 方法学每前进一步,我们便仿佛上升了一级阶梯。50年代,斯珀灵(Sperling,1960)成功

长时工作记忆理论概述

长时工作记忆理论概述 摘要:长时工作记忆理论是专家记忆理论的一种,本文简要回顾了该理论发展 的历程,研究现状,并对其缺点进行了分析。长时工作记忆的核心是,人们从事 非常熟练的认知活动时,长时记忆中的一部分信息提取和存储具有短时记忆信息 加工的性质;工作记忆应该包括短时工作记忆和长时工作记忆两部分。 关键词:长时工作记忆;理论;概述 一、长时工作记忆理论研究现状 长时工作记忆理论自1995 年提出以来,得到了很多心理学家的认同,并作了 一些相关性研究,主要是对长时工作记忆理论进行了验证。涉及了很多领域:人 机交互、体育专长(足球)、神经生理学、人类学等,这些研究都验证长时工作 记忆理论。 二、长时工作记忆理论的提出及其形成机制 继Baddeley 和Hitch 于1974 年提出工作记忆模型之后,许多研究者开展了有 关工作记忆系统的研究。然而,这些研究中大部分是针对该模型的两个子系统的 作用而进行的。后来,人们才开始重视对中央执行系统的研究。特别是对信息加 工中长时记忆中信息提取和存储动态特性的研究。 (一)长期以来,工作记忆一直被看成是对认知加工中任何一个环节上的信 息进行的暂时储存。但是Ericsson 和Kintsch 于1995 年指出,如果用这种定义和 相应的机制来解释所有的工作记忆现象。就会出现两个问题:一是目前的各种工 作记忆容量的测量方法是否能够用来解释专家或人们从事非常熟练的认知活动时,所表现出的非常宽广的工作记忆容量?二是短暂存储的工作记忆是否能够解释非 常熟练的认知活动被中断后,无需很大的努力即可迅速恢复的现象?他们指出, 工作记忆是认知加工过程中随信息的不断变化而形成的一种连续的工作状态,其 中除了暂时存储信息的短时工作记忆外,还存在另外一种机制,即基于长时记忆的、操作者可以熟练使用的长时工作记忆。长时工作记忆中的信息可以稳定地、 较长期地保留,同时又可通过短时工作记忆中的提取线索,建立一个短暂的提取 通路。 (二)以往的记忆研究中,许多都是采用被试不熟悉的实验材料和实验任务,并以此为基础假定了长时记忆中存储的信息若要进入工作记忆,必须经过一个搜 索的过程,这被当作长时记忆的一个显著的特性。长时记忆中的信息被激活后, 才能进入工作记忆。专家在从事特定活动的认知过程中,研究者们认为,专家可 以熟练掌握某种与特定任务相关的特殊能力,从而在进行此项任务时,使自己的 工作记忆能力得到扩充。如,象棋大师们在棋子位置记忆实验后,即使不提供任 何线索,甚至增加分心操作,或不给任何提示突然提问,其对棋子位置的记忆成 绩与实验时完全一致,而且其正确性与棋师的水平相关。 (三)长时工作记忆的形成必须具备三个条件: 首先,被试所从事的认知任务必须是他非常熟悉的。只有如此,他才能为进 一步加工,快速地提取相应的程序; 其次,被试对认知的材料必须是非常熟悉的。只有如此,他才能在提取和存 储某类信息时,确定相关的知识和模式; 最后,被试必须能够将存储在长时记忆中的信息与适当的提取线索联系起来,这种联系能够在回忆活动中激活相应的提取线索,进而形成与对某种信息进行编 码时相对应的条件,使这种信息能够从长时记忆中提取出来。

影响长时记忆的因素

影响长时记忆的因素 长时记忆即是指信息经过充分的和有一定深度的加工后,在头脑中长时间保留下来的记忆。所谓的长时间涉及的范围较广,指一分钟以上,甚至数年乃至终生,是一种长久性的存储。长时记忆对于我们每个人的工作学习和生活都是非常记忆的,长时记忆不好必将给我们的日常工作学习和生活带来极大的不方便,既然长时记忆如此重要,那就值得在下文粗略地探讨一下影响长时记忆的因素。 影响长时记忆的因素分为主观因素和客观因素。主观因素即是有关记忆主体的因素,有三个,首先是明确的记忆目的,正确的学习态度和动机是优质的识记效果的决定性因素。凡不能记忆主体对识记材料不感兴趣,正在进行识记活动是不需要的没有明确目的,那么这段识记材料中包含再多的有价值的内容或信息,往往也会被很快速遗忘,或者出现记忆误差导致记忆提取失败。相反,则遗忘得较慢。其次,记忆时对材料理解得程度,这对记忆的效果也有着重要的影响。因此,加强对识记材料理解是使材料长久保持的关键。要做到这一点,首先对本来有意义联系的材料,尽量用已有的知识经验去理解,采用意义识记。其次是赋予无意义联系的材料以人为的意义,即把无意义联系材料意义化,进行主观组织、再编码,这样会有助于储存和保持。无论识记什么样的材料都需要进行编码和智力加工,这样才有益于长时间储存。所谓加工,就是将材料加以整合,把新材料纳入已有的知识结构之中,或把材料作为合并单元,而组合为某个新的知识框架,这种过程称为组织加工。对识记材料可以用多种方式组织加工,有兴趣的可以阅读《长期记忆影响你的一生》这本书,里面介绍了很多的好方法,这里就不展开了。最后是识记的方法。因为记忆规律可以具体到每个人,因为生理特点、生活经历不同,可能导致有不同的记忆习惯、记忆方式、记忆特点。例如,绝大部分的人分散学习比集中学习优越。一般来说,对一个12个音节的音节组集中学习需要育读68次才能达到正确背诵,而分散学习只要35次就够了。然而又小部分的人由于对分散记忆的抗拒,可能超过了35次都学不好这个音节并且产生极大的消极情绪。规律对于自然人改造世界的行为,只能起一个催化的作用,如果与每个人的记忆特点相吻合,那么就如顺水扬帆,一日千里;如果与个人记忆特点相悖,记忆效果则会大打折扣。因此,要根据每个人的不同特点,寻找到属于自己的记忆方式。 影响长时记忆的客观因素主要有三个。首先是时间因素,学习后经过的时间越长,保持越少,遗忘越多,但遗忘的速度不是均衡的。德国心理学家艾宾浩斯(Hermann Ebbinghaus)对遗忘现象做了系统的研究,他用无意义的音节作为记忆的材料,把实验数据绘制成一条曲线,称为艾宾浩斯记忆曲线。这条曲线一般称为艾宾浩斯记忆曲线,也称艾宾浩斯保持曲线,它的纵坐标代表保持量。曲线表明了遗忘发展的一条规律:遗忘的进程不是均衡的,不是固定的一天丢掉几个,转天又丢几个的,而是在记忆的最初阶段遗忘的速度很快,后来就逐渐减慢了,到了相当长的时候后,几乎就不再遗忘了,这就是遗忘的发展规律,即“先快后慢“的原则。观察这条遗忘曲线,我们很容易地可以回想起在曾经的学习中就有具体真实的例子,白天在课堂学得的知识在一天后,如不抓紧复习,就只记得不到1/4了,而要是隔不久就复习一次,那么随着时间的推移遗忘的速度减慢,遗忘的数量也就减少,很多知识像是九九乘法表就再也没有忘记过了。这里所谓遗忘就是我们对于曾经记忆过的东西不能再认起来,也不能回忆起来,或者是错误的再认和错误的回忆,这些都是遗忘。其次是识记材料的系列位置,一般而言,

工作记忆

工作记忆理论背景 记忆三级加工模型受到挑战: ?它的基本假设是,长时记忆是材料在短时记忆中保持时间长度的直接函数。但研究表明,仅仅在STM中复述的信息并不能保证进入长时记忆,由此产生了 加工水平说,认为记忆痕迹的持久性是加工深度的函数。 ?它的基本假设是STM对学习来说是关键的工作记忆系统,那么STM受损将带来学习困难。然而,Shallice和Warrington(1970年)发现,STM有缺陷的病 人虽然数字记忆的广度有所下降,但仍能进行正常的长时学习,且在日常生活 中的认知技能也没有什么损害。 工作记忆的提出 1974年,Baddeley巴德莱和Hitch辛奇在模拟短时记忆障碍的实验基础上提出了工作记忆的三系统概念,用“工作记忆”代替了原来“短时记忆”的概念。 Baddeley认为工作记忆指的是一种系统,它为复杂的任务比如言语理解、学习和推理等提供临时的储存空间和加工时所必需的信息,工作记忆系统能同时储存和加工信息,这和短时记忆概念仅强调储存功能是不同的。另外工作记忆模型认为STM不是一个单独的系统,二是一个由很多独立成分组成的复杂系统。 基本观点: 工作记忆(Working Memory, WM)是一个容量有限的系统,它用于暂时存储和操纵加工信息,以完成复杂任务。它是由英国心理学家Baddeley等人于1974年提出的一个记忆模型。 Baddeley提出的工作记忆包括三个部分 1、基于语音的语音环。负责以声音为主的基础信息的存储与控制。 2、视觉空间模板。负责加工视觉和空间信息。 3、中央执行系统。是工作记忆模型的核心,负责各子系统之间以及 它们与长时记忆的联系,也负责注意资源的协调和策略的选择与计 划。 工作记忆的三个组成部分 语音回路:语音回路和短时记忆大部分是重叠的,这是一个包含着语音形式的信息的容量有限的系统,主要用于言语复述,负责以声音为基础的刺激信息的存储与控制。包含两个成分:保持语音信息一两秒的记忆存储;另一个是对声音的调节与控制过程。 视觉空间模板:是一个容量有限的系统,主要用于暂时存储视觉的和空间的信息。 中枢执行系统:是一个容量有限的系统,它类似于注意,主要负责自语音回路及视觉空间初步加工系统这两个系统与长时记忆之间进行联系,同时还负责信息加工策略的选择与计划。主要的工作有选择注意、任务管理、计划、监控以及编码等。 工作记忆理论的发展 Baddeley等人在原来工作记忆模型的三成分外提出工作记忆的第四种成分——情境缓冲器(The Episodic Buffer)的概念,情境缓冲器也是在中央处理器的控制之下的。 情境缓冲器是一个能用多种维度代码存储信息的系统,为语音环、视觉空间模板和长时记忆之间的提取提供一个暂时信息整合的平台。每一个系统都包括了一系列不同的编

长时记忆的编码方式

长时记忆的编码方式 在学习记忆种类过程中,最为重要的一个分类就是按照保存时间长短来分类。其中考点最多的应为长时记忆即信息在记忆中储存时间超过1分钟以上,直至几天、几周或数年,甚至终身不忘。 编码方式:以意义编码为主,有两种方式,被称为信息的双重编码,即语义编码和表象编码。其实还有一种就是表象和语义的双重编码说,接下来我们一一展开讲解。 1、表象编码:表象编码是以视觉、听觉、嗅味觉、触摸觉等心理图象或映象形式对事物的意义编码。例如,对教科书,既可用一种典型的常见的教科书的心理图象对它编码,又可用更抽象、更概括的语义对它编码。主要加工处理非言语的对象和事件的知觉信息。 2、语义编码:语义编码是通过词语对信息进行加工,按意义、系统分类或把言语材料用自己的语言形式加以组织和概括,找出材料的基本论点、论据、逻辑结构,按语义特征编码。例如,看一篇文章或听一个报告,最终保留下来的是它的意义。语义网络的示例如图1所示。 语义编码是意义编码的形式之一,也是长时记忆最主要的编码方式。它是按语言发生的顺序以系统方式来表征信息

的,包括言语听觉和言语运动两个方面的信息。语义编码的特征是串行加工,是按节点和线有意义的联系。长时记忆中的所有信息都是按照一个节点和许多关系而编码的,语义成分间的联系,即概念、事件和情节的信息可以用语义网络的形式来表示。 3、双重编码说 1975年,美国心理学家佩沃提出长时记忆中的双重编码说。他认为,识记一件具体事物,可出现表象和语义的双重编码。比如,一块手表,我们既可以用一块有特定形状的手表的心理图像去表征它,又可以用更抽象、更概括的意义来描述它——“手表是一种计时工具”。前者是表象编码,后者是语义编码。 人们记一件具体事物时,除了记起它的视觉图像外,总是从中汲取其意义。这充分证明,双重编码是客观存在的。表象和语义是既相平行又相联系的认知系统,它们可以分别由有关刺激所激活,然而,两类信息又可以互相转换。不过识记那些抽象的概念、思想,就很难用表象编码去表征它,如“公平”、“真理”等,只能用语义编码、理解并分析其意义,领会其实质才便于记忆。 信息由短时记忆转入长时记忆时是如何被加工的,采用什么方式编码,这与材料本身的性质及主体的个性特点有很大关系。

相关文档
相关文档 最新文档