文档库 最新最全的文档下载
当前位置:文档库 › paper

paper

paper
paper

面向大规模英语口语考试的自动语法评分技术研究

丁克玉1,3,李兆远1,3,刘飞1,3,陈小平1,3,胡国平2,3,陈志刚2,3

(1.中国科学技术大学计算机学院多智能体系统实验室 230027)

(2.科大讯飞研究院 230088)

(3.安徽省语音及语言技术工程实验室 230088)

摘 要:本文首次在面向大规模英语口语考试的自动评分技术中引入语法评测,并在基于人工转写数据集的基础上取得了较好结果。为准确评价考生的语法水平,分别采用非词汇化概率上下文无关文法的语法分析、词汇化概率上下文无关文法的语法分析和中心词驱动的统计语法分析三种技术对句子进行分析,提取语法得分作为特征。

同时,针对英语口语的特点,引入短语重复数和语法树高度等特征。使用上述这些特征,分别建立线性回归模型和决策树预测模型以获得语法评测分。在128份真实考试现场采集的复述题数据集人工转写结果上,最终完成的系统达到了专家精细语法评分91%的性能。

关键词:计算机辅助语言学习;语法评价;统计自然语言处理;评分特征

1.引言

如何实现英语口语考试的自动阅卷是近年来计算机辅助教育领域的一个研究热点,出现了一些基于计算机和网络技术的英语口语机考系统[1],如上海外语教育出版社的口语机考系统、蓝鸽的系统、科大讯飞公司的英语口语机考系统等。英语口语考试一般包括朗读题、复述题、看图说话等题型。其中复述题型的考试形式是让考生看或听一段短文,然后隐去短文,要求考生在规定的时间内将此文的大致意思表述出来。考生的表述可以不照搬原文,只要复述覆盖了短文的主要内容并且复述本身比较通顺、清晰易懂即可。复述题型的自动评分技术最近逐渐成为研究的热点,并且取得一定的成果[1]。

现行的复述题型主要考察音素后验概率、语速、关键词覆盖率、文本覆盖率等特征,但是没有考虑语法信息。语法是语言的重要组成部分,如果一个自动评分系统不能评价考生的语法水平,那么这个评测系统就很难成为一个完整的系统。例如,考生可以重复背诵复述题中的某些关键词来欺骗系统并获取高分。因为在没有语法评测的情况下,以往采用的音素后验概率、语速、关键词覆盖率等特征不能发现考生在重复背诵复述题中的某些关键词,并且还会由于关键词覆盖率特征失常,以致给出更高的分数。

针对上述问题,本文首次提出在复述题评分系统中引入语法评分技术。语法的评测可以很容易地检查出“重复背诵单词”等现象,因而可以进一步提高复述题自动评分系统的性能。

由于复述题自动评分是面向大规模口语考试的需求,考试现场的情况是同一考场安排几十名考生同时考试,因此答题的录音中往往会有旁边其他考生的语音干扰。为了准确给出考生的语法评测信息,避免语音干扰等原因造成识别率较低的影响,本文采用的数据是对中国科学技术大学英语口语期末考试128份复述题的现场录音进行人工转写后的数据,其中每个考生的每一句话都由专家做了细致打分。

本文面向语法评测的技术需求,首先使用统计自然语言处理和线性拟合、决策树等技术搭建语法评测平台,结合复述题口语考试的特点,尝试提取合适的特征来刻画考生的语法水平,最终完成的语法评测模型达到了专家语法精细评分91%的性能。

本文主要内容安排如下:第二节介绍自动语法评测技术,第三节介绍数据集和评分标准,第四节详细介绍自动语法评分系统的实现,第五节报告实验设计及结果,第六节给出结论。

2自动语法评测技术

为了评价考生的语法水平,本文采取扣分制的办法,错误越多或者越严重,扣分也就越多。通过比较不同考生语法得分的高低来判断其语法水平的高低。

虽然现在已经有很多种语法分析器,但相关工

作的重点主要在于如何生成比较合理的语法结构,也就是对于任意给定的一句话,给出一个比较准确的语法分析树。本文利用已有的各种parser相关技术,结合语法评测的需求,将各种特征有机的结合形成能够反应考生语法水平的语法得分。

语法的好坏在人工评分中具有很大的影响,当考生语法水平很差时可能成为评分的主要特征,而要得到一篇文章的语法得分,首先应该得到文章中每个句子的语法得分,因此对单个句子的语法评分是本文研究的重点。

首先,引入自然语言处理技术,对单个句子进行分析。为此,本文分别采用Stanford大学的非词汇化概率上下文无关文法的语法分析(Unlexicalized Probabilistic Context Free Grammar Parser)[2]、Stanford大学的词汇化概率上下文无关文法的语法分析(Factored Probabilistic Context Free Grammar Parser)[3]和MIT的中心词驱动的统计语法分析(Head-Driven Statistical Parser)[4]对句子进行分析,得到其相应的语法特征,并在这些特征的基础上增加更多的能够反映语法信息的特征。

然后,引入数据挖掘技术,采用多元线性回归映射和决策树的方法在相关已人工评分数据库上建立从机器评分到专家评分的映射模型,最终实现语法的自动评分。

根据上述分析,结合口语考试的特点,本文搭建了如图1所示的自动语法评分流程。

图1. 自动语法评分系统流程

3自动语法评分标准以及实验数据集

3.1人工评分标准

本文所采用的人工评分标准是由专家设定的,打分采用五分制,具体评分标准如表1所示。3.2 数据集介绍

本文实验所采用的测试数据均来自中国科学技术大学英语口语期末考试的现场录制的复述题的语

表1:人工语法评分参考标准

分数描述

5分没有语法错误

4分基本上没有语法错误,或者语法错误不明显。

3分有少量语法错误,没有重大语法错误,不影响句子意思的表达。

2分语法错误较多,时态混乱,轻微影响句子意思的表达。

1分语法错误很多,有重大语法错误,但还能听懂句子的意思。

0分语法错误非常多,有较多重大语法错误,因为语法原因造成无法理解句子的意思。

料数据,共128人,复述题共覆盖6篇不同的文本。本文将128份数据进行了语音对应文本的人工转写,然后又进行了人工切分。人工切分就是将人工转写文本中的句子切分出来。共切分出2227个句子,每个切分的句子都有对应的2位专家背靠背的精细打分,专家打分颗粒度为1分。

在这个包含128个样本的数据集上,两个专家精细评分的相关度及分差分布如表2和图2所示。这里分差定义为同一样本的两个评分差值的绝对值,平均分差则指评分集上2227个句子的平均值。

图2. 数据集上2位专家人工评分分差分布图

表2. 评分集人工打分性能表

相关度平均分差

专家精细评分0.738 0.4

4自动语法评分的实现

4.1 主要特征抽取

4.1.1非词汇化概率上下文无关文法

非词汇化概率上下文无关文法[2](Unlexicalized Probabilistic Context Free Grammar )是最早也是最常用的句法分析模型,它是上下文无关文法(CFG )的扩展。

概率上下文无关文法 (PCFG) 可以看作是一种加权的CFG ,即给CFG 每个规则分配一个权值。整个语法树的权值,就是语法树上所有使用的语法规则的权值的乘积。这里所分配的权值就是概率,此外,也可以赋对数概率,如果使用对数概率,整个语法树的值就是全部使用规则的值的和,这样有助于简化计算。

PCFG 的每个语法规则可看作是一个条件概率,因为上下文无关文法的性质使得规则的扩展只需要局部信息,一般只需要父结点的非终结符。例如,规则就可以表示为P(a|A)=0.5。

[0.5]A a →PCFG 中语法规则的概率数据可以通过训练得到。训练的数据一般是由人工标注的语法树集合。训练算法的原理就是计数,例如,概率:

()

()()

C X A p X A C X →→=

(1)

C(X|A)是在训练集当中出现的规则()的数目,而C(X)则表示在训练集中看到规则头部为X 的规则数目。

X A →PCFG 的分析过程与非概率型上下文无关文法相同,也是从非终结符号s 开始扩展。通过概率型上下文无关文法赋予每棵分析树一个概率,当有多种结构分析树时,可以利用概率来选择句子的分析结果

,即,分析树T 的概率就是生

成T 所用到的所有产生式的条件概率的乘积:

T )(max arg T P T T

=∏∈=

)

()()(T D r r P T P (2)

其中,r 是产生式,D (T )表示用于生成分析树

T 的有序产生式集合。为计算方便,实际运用中往往取对数后把乘法变成加法。

PCFG 给出了一种概率型的自然语言句法分析模型,具有一定消除歧义的能力,PCFG 的最大特点是上下文无关,PCFG 的文法规则容易推导,而且PCFG 不考虑上下文,可以一定程度上避免数据稀疏

的问题,对于开放领域的自然语言分析来说具有较好的鲁棒性。

PCFG 中的语法规则都是从实际的语料库中得来的,例如,语言数据联盟(Linguistic Data Consortium )发布的宾州树库(Penn Treebank ),包括Brown 语料库的语法树,规模有100万单词,语料主要来自华尔街杂志(Wall Street Journal )。给定一个树库,一个非终极符号的每一个展开的概率都可以通过展开发生的次数来计算,然后将其归一化,就可以得到一部概率上下文无关语法。换句话说这些语法规则的概率都反映了规则本身被人接受的程度,也可以说是该规则的优劣,所以用PCFG 来分析句子的语法结构的后,最后整颗语法树的得分是每条规则的得分加起来的和,因为每一条规则都能反映出其自身语法的优劣,那么求和后得到概率之和就能表示出整个句子的优劣。把这个概率和定义为PCFG 语法得分。

但是,也不能忽视单词的常见程度对PCFG 整颗语法树得分造成的影响。从前面的分析可知,如果对一个单词进行词性标注的话,标注后的概率是和这个单词本身有紧密联系的。例如,假如在语料库中苹果(apple )出现了1000次,而胡桃(walnut )出现了100次,胡桃和苹果都对应一个规则NN →apple ;NN →walnut 。而以NN 开头的规则假设有10000个,那么由(1)式可以知道NN →apple 的概率为0.1而NN →walnut 的概率为0.01。最终会影响整颗语法树的语法得分。而单从语法的角度来说apple 和walnut 都是名词,不能因为一个常见另外一个不常见而影响最后的语法评分。根据这个分析本文又定义了修改的PCFG 语法得分,这个得分消除了单词的频率对语法分的影响。

依据以上分析,本文在调用了Stanford-Parser 的相关函数的基础上,实现了PCFG 语法得分和修改的PCFG 语法打分的算法,计算出这两个语法得分将它们作为两维特征用来进行语法评测。

4.1.2词汇化概率上下文无关语法 虽然概率上下文无关语法有一定的消除歧义的能力,但是概率上下文无关语法并不是完美无缺的,它还存在着结构依存和词汇依存的问题[5]。 首先,在非词汇化概率上下文无关语法中,每一条规则都是独立的,对规则左部的非终结符号进行重写时,不依赖于其他的非终结符号,所以规则可以相乘。但是在英语中,节点上规则的转写与节点在树形图中的位置是有关的。根据Francies (1999)的调查,在Switchboard 语料库中,陈述句的主语有31021个,其中91%的主语是代词,只有9%的主语

是其他词。于此相反,在7489个宾语中,只有34%是代词,而66%是其他词。所以大部分的主语是代词,大部分的宾语是非代词。这样的语言事实是对概率上下文无关语法的严重挑战,因为概率上下文无关语法不能处理这样的语言现象。 其次,非词汇化概率上下文无关文法还存在词汇依存问题,这里以PP 附着为例来说明。在英语句子中,介词短语PP 可以做中心动词短语VP 的状语,也可以做它前面名词短语NP 的修饰语,究竟是附着于VP ,还是附着于NP ,这就是所谓的“PP-附着”(PP-attachment )问题。 例如,在句子Chinese government sent soldiers into Sichuan province 中,介词短语(PP )“into Sichuan province ”或者附着于名词短语(NP )“soldiers ”,或者附着于动词短语(VP )“sent ”。这里存在PP-附着问题:

NP → NP PP (PP 附着于NP ) VP → VP PP (PP 附着于VP ) PP-附着的判定要在这两个规则之间选择,选择的依据在于训练语料库,NP 附着和VP 附着的统计结果如表3所示。从表中可以看出,“PP 附着于NP ”始终处于优先的地位。因此应该选择PP 附着于NP ,也就是选择PP “into Sichuan province ”附着于NP “soldiers ”。但是很明显在这个例子中PP “into Sichuan province ”应该附着于VP “sent ”。概率上下文无关语法显然不能处理这样的词汇依存问题。

表3.PP 附着情况统计

语料库 PP 附着于NP PP 附着于VP AP Newswire

67%

33% WSJ&IBM manuals 52%

48%

根据以上分析,本文引入词汇化概率上下文无关文法来弥补非词汇化概率上下文无关文法的缺陷。词汇化概率上下文无关文法与非词汇化概率上下文无关文法最大的区别在于其语法采用的是一种词汇语法(Lexical Grammar ),有的也称为概率词汇化上下文无关语法(Probabilistic Lexicalized Context

Free Grammar )。分析树的每一个结点在非词汇化分析树的基础上都会加标单词甚至是语法规则。本文引入了两种词汇化概率上下文无关文法,一个是基于因素的词汇化概率上下文无关文法[3],另一个是中心词驱动的词汇化概率上下文无关文法[4]。 在中心词驱动的分析树中,分析树的每一个结点都要标注该节点的中心词(head )。例如,句子

“Chinese government sent soldiers into Sichuan province ”的分析树如图3所示。这样能解决非词汇化概率上下文无关文法解决不了的问题,因为词汇化语法规则能够看到单词,也就是获得更多的信息,这样会使得词汇化语法规则的数目要比非词汇化上下文无关文法多得多。

图3:中心词驱动句子分析图

例如上面提到的“Chinese government sent soldiers into Sichuan province ”这个句子的PP-附着问题,可以有如下的规则:

VP(sent)→VBD(sent)NP(soldiers)PP(into) [1*10

10?] VP(sent)→VBD(sent)NP(army)PP(into) [6*1010?] VP(sent) →VBD(sent)NP(people)PP(into) [8*1010?] 如果把VP(sent)重写为VBD NP PP ,就可以正确分析这个句子,如果把VP(sent)重写为VBD NP ,就会得到错误的分析。但是VP(sent)→VBD NP 根本

不会在语料库中出现,因为这时动词sent 要求指明动作到达的位置,这就是看到单词带来的好处。所以PP-附着问题也得以解决。 典型的语法分析所生成的模型有三种语法结构,如图4(a )是一个简单的短语结构语法树T ,可以表示句法单元;(b )是一个依赖语法树D ,可以表示单词之间的选择关系;(c )是一个词汇化的语法树L ,在这棵树上不仅有语法规则,而且每个顶点上还有中心词的词性信息。

图4 三种语法结构的语法分析树

词汇化的语法树可以看作由一个简单的短语结构语法树T 和一个依赖语法树D 所组成的二元组

L=(T,D)。因此,词汇化概率上下文无关文法的语法分析(Lexicalized PCFG parsing)就可以看作是计算这些二元组概率P(T,D)。

所以,生成模型可以分解为两个因素P(T,D)=P(T)P(D)。分解后,P(T)相当于非词汇化的概率模型,P(D)是一个词汇化的依赖模型。这样两个模型就可以分别使用两种不同方法中最精确的两个模型,对语法结构做出更准确的分析。

根据以上分析,本文在调用Stanford-Parser和COLLINS-PARSER相关函数的基础上修改实现了词汇化概率上下文无关文法对句子的自动评分,并作为新的两维特征加入到总体评价句子语法优劣的集合中去。

4.2其他特征的提取

4.2.1语法分析树的高度

对大量的句子进行语法分析后,发现这样一个情况:在单词数大致相同的情况下,树的高度越低,该句子语法得分往往越高。基于这样一个假设,本文抽取了“语法分析树的高度”作为一维特征。经过实验的检验,该特征对提升预测的精确度是有帮助的。

4.2.2短语重复数

本文研究的对象是口语考试,口语考试的方式是现场口语答题,答题的过程中往往有大量的重复现象。重复的可能是一个单词,也可能是一个词组。少量的重复是可以接受的,但是过多的重复则会扣分。重复越多,说明考生对这句话不是很确定,很有可能出现错误,因此本文对每句话统计其中重复短语的个数,以此来表示句子语法的优劣。

4.2.3消除单词and的影响

在口语考试中,考生往往在两句话的衔接之间大量运用单词and,当一句话说完同时没有想好下一句的时候,很多考生选择了说单词and,这样就造成了单词and在句子开头大量的存在。同时这个单词and并不是该句子的必要组成部分。人工在进行评分的时候是允许出现这种情况的,一般不扣分或者扣分较少。但是在进行自动语法评分的时候,and的非法出现往往会造成很严重的扣分,所以本文提取此特征用来消除and带来的不利影响。

4.2.4 单词数与语法分的归一化

本文中所有的语法评分均采取扣分制,也就是说语法错误越多、越严重,那么扣分也就越多。最后得分最高的就是那些扣分最少的,意味着语法水平越高。虽然这样使得语法评价可以量化,但是也会造成一个问题:说得越多,扣分多的可能行就越大。为了解决这个问题本文引入了单词数这一特征,并对语法分进行归一化处理。

语法分归一化后的分数NorSyntaticScore是用句子已经得到的语法分SyntaticeScore除以该句子的单词CountNum个数。

SyntaticeScore

NorSyntaticScore

CountNum

= (3) 5.实验和结果

5.1评分特征信息

根据以上的分析,本文一共抽取了13维评分特征,它们与专家精细语法评分的相关度如表4所示。

之所以选择这些特征,是因为它们要么能直接刻画考生的语法水平,要么是间接为这项目服务,还有的特征代表的信息与前面的特征信息具有较强的互补性,实验证明这13维特征如果去掉其中的某一维,都会对最后的自动评分结果造成较大的不利影响。

表4:各维评分特征的相关度

各维评分特征

和专家评分

的相关度

PCFG得分0.461

修改的PCFG得分0.541

Head-driven得分0.493

修改的Factored PCFG得分0.489

语法分析树的高度-0.407

短语重复数-0.409

单词个数-0.410

删除句首and后PCFG得分-0.033 删除句首and后修改的PCFG得分-0.030

删除句首and后Factored PCFG得分-0.056

归一化后PCFG得分-0.112

归一化后修改的PCFG得分-0.023

归一化后Factored PCFG得分-0.060

5.2决策树实验

决策树方法的主要目的是构造精度高、规模小的决策树[6]。本文采用1984年Breiman提出的决策树构建算法——CART算法,其基本原理是通过对由测试变量和目标变量构成的训练数据集的循环分析,形成二叉树形式的决策树结构。CART算法采用经济学中的基尼系数(Gini Index)作为选择最佳测试变量和分割阈值的准则。基尼系数的定义如下:

=

?

=

J

j

h

j

p

GiniIndex)

/

(

12 (4)

)

()()/(h n h n h j p j =

(5)

∑=J

j

h j p 1)/( (6)

式中:p(j/h)是从训练样本集中随机抽取一个样本,当某一测试变量值为h时属于第j类的概率;

为训练样本中测试变量值为h时属于第j类的

样本个数;为训练样本中该测试变量值为h的样本个数,j为类别个数。

()j n h ()j n h 利用决策树对数据进行分类和预测遵循两大步骤:

1)首先对训练数据进行学习,构建一棵决策树; 2)然后利用生成的决策树的分类规则对测试样本进行分类 。

但按照上述过程生成的完整决策树往往会出现“过度拟合”现象:决策树越复杂,节点就越多,每个节点所包含的训练实例个数就越少,则支持每个节点的实例个数就越少,可能导致随后错误率较大。叶子树越多,每个叶子仅有少数的事例,这样的叶子比拥有许多事例的叶子更容易出现分类错误,更易受噪声影响。 但也并非节点越少错误率就越低。这就需要在树的大小与正确率之间寻求一个平衡。因此有必要对树的结构进行剪裁。

CART 算法使用后剪枝,首先生成一个最大的决策树,然后对其进行剪枝。剪枝算法用独立于训练样本集的测试样本集对子树的分类错误进行计算,分类错误最小的树作为最佳分类模型。若样本集太少,CART 算法采用交叉确定的剪枝方法。

本文利用独立于训练样本的数据对得到的决策树进行剪裁。最终得到的结果是一棵规模大小和正确率之间比较平衡的最优二叉树。

根据所选取的训练样本,采用CART 算法进行计算分析,最终选择的测试变量为13个,即13维,特征目标变量为10个(0,0.5—4.5,5)。一共有2215个训练样本,将数据分成6份,用4份作为训练数据,1份用来剪裁,1份用来测试,共循环进行了30次评测。对每次评测统计预测语法分与人工语法分的相关度,最终结果为,最低的相关度为0.52,最高的为0.7,平均相关度为0.63,达到专家评分性能的85%。

实验结果相关度具体的分布如图5所示。

图5 实验相关度分布图

决策树具体评分性能如图6所示,决策树评分与人工评分性能对比如表5所示。

图6:决策树评分性能图

表5:决策树评分与人工评分性能对比 相关度

相对专家性能

平均分差

专家之间 评分性能 0.74 ------ 0.4 机器评分性能

0.63 0.85 0.52

5.3线性回归实验 本文把预测的语法分与专家分的相关度定义为G ,把每一维特征给出的语法分与专家分的相关度定义为(113)i x i ≤≤,那么利用这13维特征,自动给出最佳语法分的问题就变成了一个线性回归问题。

13132211..._x c x c x c G Max +++= (7)

123131c c c c +++=L (8)

0i c 1≤≤ (9)

表达式(7)是目标函数,表达式(8)、(9)是约束函数。在所有的2215个训练样本上,考虑到每个考生复述一篇文章大概在10句话左右,所以将数据分成200份,其中一份用来测试,其余的用做训

练数据,进行交叉验证,最终结果为,预测语法分与人工语法分的相关度为0.67,达到专家评分性能的91%。

线性回归评分性能如图7所示,线性回归预测语法分与人工评分性能对比如表6所示。

图7:线性回归评分性能图

表6:线性回归预测语法分与人工评分性能对比 相关度

相对专家性能

平均分差 专家之间 评分性能 0.74 ------ 0.4 机器评分性能

0.67 0.91

0.5

6 结论

本文首次在面向大规模英语口语考试的复述题自动评分技术中引入了语法评价体系,利用非词汇化概率上下文无关文法和词汇化概率上下文无关文法等相关技术准确评价了考生的语法水平,并结合口语考试的实际特点,共抽取了13维特征。在此基础上用决策树和线性回归的方法实现了语法自动评分功能。自动语法评分在128份中国科学技术大学期末考试现场采集的数据集合人工转写结果上达到了专家精细评分91%的性能,对以往没有引入语法评测体系的自动评测系统在可靠性和功能性上有所帮助。 目前,本文采用的语料数据为书面内容,和平时使用的口语表达方式有一定距离,如果能针对口语定制自己的语料库,将对口语语法自动评分带来很大的好处,这将是今后探索的方向之一。

参考文献

[1] 严可,胡国平,等.面向大规模英语口语机考的复述题自动评分技术 [J]. 清华大学学报(自然科学版), 2009, 49(S1): 1356~1362.

[2] Klein D, Manning C D. Accurate unlexicalized parsing [A]. Proceedings of the 41st Annual Meeting on Association for Computational Linguistics [C]. Sapporo, Japan: Association for

Computational Linguistics, 2003. 423-430.

[3] Klein D, Manning C. Fast exact inference with a factored model for natural language parsing [J]. Advances in Neural Information Processing Systems, 2003, 3~10.

[4] Collins M. Head-driven statistical models for natural language parsing [J]. Computational linguistics, 2003, 29(4): 589~637.

[5] 冯志伟. 自然语言处理中的概率算法 [J]. 当代语言学, 2005, 7(002): 166~178.

[6] Breiman L. Classification and regression trees [M]. Chapman & Hall/CRC, 1984.

论文模板fullpapertemplate

Paper Title (use style: paper title) Subtitle as needed (paper subtitle) Authors Name/s per 1st Affiliation (Author) line 1 (of Affiliation): dept. name of organization line 2: name of organization, acronyms acceptable line 3: City, Country line 4: e-mail address if desired Authors Name/s per 2nd Affiliation (Author) line 1 (of Affiliation): dept. name of organization line 2: name of organization, acronyms acceptable line 3: City, Country line 4: e-mail address if desired Abstract—This electronic document is a “live” template. The various components of your paper [title, text, heads, etc.] are already defined on the style sheet, as illustrated by the portions given in this document. (Abstract) Keywords-component; formatting; style; styling; insert (key words) I.I NTRODUCTION (H EADING 1) This template, created in MS Word 2000 and saved as ―Word 97-2000 & 6.0/95 –RTF‖ for the PC, provides authors with most of the formatting specifications needed for preparing electronic versions of their papers. All standard paper components have been specified for three reasons: (1) ease of use when formatting individual papers, (2) automatic compliance to electronic requirements that facilitate the concurrent or later production of electronic products, and (3) conformity of style throughout a conference proceedings. Margins, column widths, line spacing, and type styles are built-in; examples of the type styles are provided throughout this document and are identified in italic type, within parentheses, following the example. Some components, such as multi-leveled equations, graphics, and tables are not prescribed, although the various table text styles are provided. The formatter will need to create these components, incorporating the applicable criteria that follow. II.E ASE OF U SE A.Selecting a Template (Heading 2) First, confirm that you have the correct template for your paper size. This template has been tailored for output on the A4 paper size. If you are using US letter-sized paper, please close this file and download the file for ―MSW US ltr format‖. B.Maintaining the Integrity of the Specifications The template is used to format your paper and style the text. All margins, column widths, line spaces, and text fonts are prescribed; please do not alter them. You may note peculiarities. For example, the head margin in this template measures proportionately more than is customary. This measurement and others are deliberate, using specifications that anticipate your paper as one part of the entire proceedings, and not as an independent document. Please do not revise any of the current designations. III.P REPARE Y OUR P APER B EFORE S TYLING Before you begin to format your paper, first write and save the content as a separate text file. Keep your text and graphic files separate until after the text has been formatted and styled. Do not use hard tabs, and limit use of hard returns to only one return at the end of a paragraph. Do not add any kind of pagination anywhere in the paper. Do not number text heads-the template will do that for you. Finally, complete content and organizational editing before formatting. Please take note of the following items when proofreading spelling and grammar:

英语学术论文常用句型 总结版

英语学术论文常用句型 Beginning 1. In this paper, we focus on the need for 2. This paper proceeds as follow. 3. The structure of the paper is as follows. 4. In this paper, we shall first briefly introduce fuzzy sets and related concepts 5. To begin with we will provide a brief background on the Introduction 1. This will be followed by a description of the fuzzy nature of the problem and a detailed presentation of how the required membership functions are defined. 2. Details on xx and xx are discussed in later sections. 3. In the next section, after a statement of the basic problem, various situations in volving possibility knowledge are investigated: first, an entirely possibility model is p roposed; then the cases of a fuzzy service time with stochastic arrivals and non fuz zy service rule is studied; lastly, fuzzy service rule are considered. Review 1. This review is followed by an introduction. 2. A brief summary of some of the relevant concepts in xxx and xxx is presented i n Section 2. 3. In the next section, a brief review of the .... is given. 4. In the next section, a short review of ... is given with special regard to ... 5. Section 2 reviews relevant research related to xx. 6. Section 1.1 briefly surveys the motivation for a methodology of action, while 1.2 looks at the difficulties posed by the complexity of systems and outlines the need f or development of possibility methods. Body 1. Section 1 defines the notion of robustness, and argues for its importance. 2. Section 1 devoted to the basic aspects of the FLC decision making logic. 3. Section 2 gives the background of the problem which includes xxx 4. Section 2 discusses some problems with and approaches to, natural language un derstanding. 5. Section 2 explains how flexibility which often ... can be expressed in terms of fu zzy time window 6. Section 3 discusses the aspects of fuzzy set theory that are used in the ... 7. Section 3 describes the system itself in a general way, including the ….. and als o discusses how to evaluate system performance. 8. Section 3 describes a new measure of xx. 9. Section 3 demonstrates the use of fuzzy possibility theory in the analysis of xx.

纸张的种类(英文)

岳阳林纸股份有限公司产品标签复印纸 copy paper 环保复印纸 environmental copy paper 全木浆笔记本纸100% wood pulp notebook paper 笔记本纸 notebook paper 环保笔记本纸 environmental notebook paper 全木浆胶版纸 100% wood pulp offset paper 颜料整饰胶版纸 pigment offset paper 环保胶版纸 environmental offset paper 轻型胶版纸 Light weight offset paper 典雅纯质纸Elegant pure quality paper 胶印书刊纸 Offset book paper 颜料整饰胶版纸B pigment offset paper B 环保书刊纸environmental book paper 精制量涂布纸 fine light weight coating paper 低定量铜板纸 light weight art paper 雅光铜板纸 matt coated paper 新闻纸 newsprint paper 超市广告纸 supermarket poster paper 工业淋膜原纸 industrial membrane lamination paper 铸涂原纸 cast coated base paper 热敏原纸 thermal base paper 铜板原纸 art base paper 无碳复写原纸 carbonless copy base paper 格拉辛原纸 glassine base paper 食品包装纸 food packaging paper 高白胶版纸 high white offset paper 数码印刷纸 digital printing paper 数码快印纸 digital fast printing paper 数码轻型纸 digital light paper

论文常用句型[1](1)

如何指出当前研究的不足以及有目的地引导出自己的研究的重要性通常在叙述了前人成果之后,用However来引导不足,比如However, little information.. little attention... little work... little data little research or few studies few investigations... few researchers... few attempts... or no none of these studies has (have) been less done on ... focused on attempted to conducted investigated studied (with respect to) Previous research (studies, records) has (have) failed to consider ignored misinterpreted neglected to overestimated, underestimated misleaded thus, these previus results are inconclisive, misleading, unsatisfactory, questionable, controversial.. Uncertainties (discrepancies) still exist ... 这种引导一般提出一种新方法,或者一种新方向。如果研究的方法以及方向和前人一样,可以通过下面的方式强调自己工作的作用:However, data is still scarce rare less accurate there is still dearth of We need to aim to have to provide more documents

paper的用法和短语例句

paper的用法和短语例句 paper有纸;文件;报纸;论文;票据等意思,那么你知道paper的用法吗?下面跟着小编一起来学习一下,希望对大家的学习有所帮助! paper的用法: paper的用法1:paper的基本意思是纸,通常用作物质名词,不可数。如表示可数性,则须借助于单位词。一小张纸是a piece of paper; 一大张标准尺寸的纸是a sheet of paper。paper作写过字的纸解时,是可数名词,有复数形式。 paper的用法2:paper也可作报纸文件证件试卷论文等解,可用复数形式。 paper的用法3:paper的基本意思是用纸贴或用纸覆盖,引申可表示隐瞒,掩饰。 paper的用法4:用作及物动词,后接名词或代词作宾语。 paper的常用短语: 用作名词(n.) on paper 用作动词(v.) paper over (v.+prep.) paper的用法例句: 1. He wiped away the blood with a paper napkin. 他用纸巾将血迹擦去。

2. Under the newspaper, atop a sheet of paper, lay an envelope. 在报纸下面的一张纸上放着一个信封。 3. Stein rolled up the paper bag with the money inside. 斯坦把装了钱的纸袋卷了起来。 4. Randall would just now be getting the Sunday paper. 兰德尔这个时候应该正在拿周日的报纸。 5. Theres always tons of scrap paper in Dads office. 爸爸的办公室里总有大量的废纸。 6. She tore off two sections of paper towel and folded them lengthwise. 她撕下两格纸巾,然后纵向对折。 7. The paper is openly critical of the strong-arm president. 该报纸对这位铁腕总统进行公开的批评。 8. A crumpled scrap of paper was found in her handbag. 在她的手提包里发现了一张皱巴巴的小纸片。 9. The new copiers only copy onto one side of the paper. 新复印机只能单面复印。 10. I used to edit the college paper in the old days. 以前我曾经做过大学校报的主编。 11. The papersprice rise will encourage readers to desert in even greater numbers.

Paper 格式要求

强大且简练的英文论文格式! —————————————————————————————————————————————————————————————————————————————————————————————来自撒撒的迷妹分享 一、论文的题目要求 1、论文题目以最恰当、最简明的词语反映论文中最重要的特定内容的逻辑组合,并有助于选定关键词和编制目录 2、论文题目不能用缩略词、首字母缩略词、字符、代号和公式等 3、论文题目一般不超过20个字 4、论文题目语义未尽可用副标题补充说明 二、论文摘要的要求 应具有独立性和自含性,是一篇完整的短文,它说明论文的主要思想、结构框架,或研究工作的目的、实验方法、结果和最终结论 三、论文的关键词 每篇论文必须选中3--5个中、英文关键词,以显著的字符另起一行,排在其对应摘要的左下方,中文关键词尽可能用《汉语主题词表》等词表提到的规范词 四、论文的字体及字号格式 1、英文统一使用Microsoft Word软件中的Times New Roman字体,所用中文使用“宋体”字体 2、内封大标题使用“粗体三号字”,内封其他信息使用“粗体四号字” 3、正文大标题使用“粗体小三号字”,章节标题使用“粗体四号字” 4、正文使用字体为Times New Roma,大小为12 font(也就是小四)“小四号字”,正文中成段的引文使用“五号字” 5、行距为1.5 或2倍行距,段与段之间需要空一行 6、对齐方式为左对齐或者两侧对齐(总之,左起必须顶格) 7、Reference(参考文献)必须另起一页,且不计入文章字数 注意:写论文中最好都别写简写啦!就像雅思考试哦筒子们!!还有我加红色的地方,是我总会忘记的emmmmmm常识啊!!!!

多种分配方式并存_利益关系多样化_社会思想日益多样化_就要搞思想多元化_请对上述观点作出评析

问题:在现实生活中,有人提出,发展社会主义市场经济,社会主义经济成分多样化,指导思想可以多元化,也有人提出,多种分配方式并存,利益关系多样化,社会思想日益多样化,就要搞思想多元化,请对上述观点作出评析。 就目前而言,多种所有制并存,多种利益主体的存在,肯定会出现多种思想观念和价值取向。但是,所有制形式的多样化,并不等于指导思想就要多元化。事实上,自从人类进入阶级社会以后,大多数时候经济成分都是多样的。比如,在资本主义社会,私人资本主义经济占主导地位,但在相当长时期中有封建地主经济与它并存。即使当今资本主义发达国家,也同时存在小作坊、手工业者、自由职业者、个人土地所有者,公营性的“国有企业”,外国公司,特别是股份制的出现,使所有制形式更是复杂化多样化。然而,尽管所有制形式多种多样,但占主导地位的所有制并没有变,始终是资本主义私有制,因而占主导地位的价值观始终是资本主义价值观。同样,我国发展社会主义市场经济,经济成分多样化,但并没有改变我国公有制经济占主体的地位,没有也不能改变中国特色社会主义的发展方向和道路,这就决定了我国意识形态领域只能以马克思主义为指导。 但是,要看到,利益关系多样化也是很多国家、很多社会的一个普遍现象。比如,美国可以说是利益集团很多的国家,资产阶级、农场主阶级、工人阶级是最基本的阶级,这些阶级又分为大、中、小不同的阶层;此外,还存在大量的诸如管理人员、教师、律师、医生等社会阶层。不同的阶级、阶层具有不同的社会地位,形成不同的利益集团。尽管利益多样,不同利益集团之间及其内部都有激烈的斗争、冲突、较量,但占主导地位的是资产阶级。资产阶级作为统治阶级,不会容许不符合其利益的思想占主导。在我国,虽然利益关系日益多样化,各阶层、各群体的具体利益有所不同,但无论各方面的具体利益如何多样,全体人民的根本利益总体上是一致的,这就必然要求有一个统一的指导思想。在当代中国,只有当代中国发展着的马克思主义,而没有别的什么主义或主张,能够最广泛地代表广大人民的根本利益,能够引领社会发展进步,这理所当然应当成为我们的指导思想。 指导思想不能搞多元化,坚持以马克思主义为指导,就要回答为什么在意识形态领域指导思想只能是一元的,而不能搞多元化。实际上,古今中外,任何国家和社会,不管社会形态多么不同,不管社会思想多么复杂,但在意识形态领域,占支配地位的思想总是统治阶级的思想,或者说指导思想都是一元的。 我们强调以马克思主义为指导,不搞指导思想多元化,与各个历史时代统治阶级思想占统治地位有一个根本的不同,就是马克思主义作为我们的思想武器,不仅仅因为它反映了我国经济基础的要求,而且它来自于实践,同时是为实践检验所证明了的客观真理。

英文翻译WorldwidePaperCompany

Worldwide Paper Company 案例分析:国际纸业公司 (WPC) Blue Ridge Mill is the subordinate factory of Worldwide Paper Company. In December 2006, Bob Prescott, the controller for the Blue Ridge Mill, was consideringthe addition of a new on-site Longwood wood yard. The addition would have two primarybenefits: to eliminate the need to purchase short wood from an outside supplier and create theopportunity to sell short wood on the open market as a new market forWorldwide PaperCompany.Now the new wood yard would allow the Blue Ridge Mill not only to reduceits operating costs but also to increase its revenue. The proposed wood yard utilized newtechnology that allowed tree length logs, called long wood, to be processed directly, whereas thecurrent process required short wood, which had to be purchased from another mill. Thisnearby mill, owned by a competitor, had excess capacity that allowed it to produce more shortwood than it needed for its own pulp production. The excess was sold to several different mills,including the Blue Ridge Mill. Thus adding the new long wood equipment would mean that Prescott would no longer need to use the Shenandoah Mill as a short wood supplier and that theBlue Ridge Mill would instead compete with the Shenandoah Mill by selling on the short woodmarket.The question for Prescott was whether these expected benefits were enough to justifythe $18 million capital outlay plus the incremental investments in working capital over the sixyear life of the investment. Construction would start within a few months, and the investment outlay would be spentover two calendar years: $16 million in 2007 and the remaining $2 million in 2008. When thenew wood yard began operating in 2008, it would significantly reduce the operating costs of themill. These operating saving would come mostly from the differencethe cost of producingshort wood on-site versus buying it on the open market and were estimated to be $2.0 million for2008 and $3.5 million per year thereafter.Prescott also planned on taking advantage of the excess production capacity afforded bythe new facility by selling short wood on the open market as soon as possible. For 2008, heexpected to show revenues of approximately $4 million, as the facility came on line and began tobread into the new market. He expected short wood sales to reach $10 million in 2009 andcontinue as the $10 million level through 2013. Prescott estimated that the cost of goods sold(before including depreciation expenses) would be 75% of revenues, and SG&Awould be 5% ofrevenues. In addition to the capital outlay of $18 million, the increased revenue would necessitatehigher levels of inventories and accounts receivable. The total working capital would average10% of annual revenues. Therefore the amount of working capital investment each year wouldequal 10% of incremental sales of the year. At the end of the life of the equipment, in 2013, allthe net working capital on the books would be recoverable at cost, whereas only 10% or $1.8million (before taxes) of the capital investment would be recoverable. Taxes would be paid at 40% rate, and depreciation was calculated on a straight-line basisover the six-year life, with zero salvage. WPC accountants had told Prescott that depreciationcharges could not begin until 2008, when all the $1.8 million had been spent, and the machinerywas in

发表论文格式paper format

论文要求与格式 ◆按国际惯例,提交论文摘要时,每人限第一作者一篇。 ◆除特邀代表外,其他代表提交的论文要求须是未公开发表过的非综述性文章。 ◆论文须用A4纸,激光打印。每篇论文含图、表在内最多不应超过6页。国内作者须同 时提交中文稿。另请提交论文稿件的WORD文档软盘,或以E-mail附件的形式发至: HE2003@https://www.wendangku.net/doc/8a18657363.html, ◆论文格式: 论文题目—作者姓名—作者单位、地址和邮政编码—摘要—正文—致谢—参考文献 ◆具体格式要求: 1. 全文单倍行距,两端对齐。 2. 摘要、关键词、致谢、参考文献及一级、二级标题首行无缩进。 3. 正文首行缩进2字符。 4. 全文字体均用Times New Roman,字体、字号如下: —题目: 黑体,14 p —作者姓名: 黑体,10 p ,居中 中文姓名翻译格式为(例如):“张家强”→“Jiaqiang Zhang” —地址:白体,斜体,9 p —摘要:“Abstract”:黑体, 9 p 内容:白体,9 p —关键词: “keywords”:黑体, 9 p 内容:白体,9 p —一级标题:黑体,12 p,编号为“1,2,3,……” —二级标题:黑体,10.5 p,编号为“1.1,1.2,…;2.1,2.2,…;……” —正文:白体,10.5 p —致谢:“Acknowledgements”:黑体, 10 p ,致谢内容:白体,10 p 。例如: Acknowledgements:The authors gratefully acknowledge …… —参考文献:“References”:黑体, 9 p ,参考文献内容:白体,8 p,编号为1. 2. 3. ……。例如:References 1.Mu shuqin, et al.. The groundwater trends in the decade of Changchun city in Jilin province, Beijing: Science Publisher. 1992 (图书格式) 2. O’Hannesin S.F. and Gillham R.W. Long-term performan ce of an in situ “iron wall” for remediation of VOCs. Groungwater, 36(1):164~170. 1998(期刊格式) 3. McRae C.W.T., Blowes D.W., Ptacek C. J. Laboratory-scale investigation of remediation of As and Se using iron oxides. Proc. Sixth Symposium and Exhibition on Groundwater and Soil Remediation, March 18~21, Montreal, QC. 167~168. 1997(论文集格式)—图题:白体,8 p —表题:黑体,8 p —公式:10.5 p —比号:2∶3

SCI写作句型

SCI写作方法(一) 1. Introduction: 1.1. 如何指出当前研究的不足并有目的地引导出自己研究的重要性 1.1.1.在叙述前人成果之后,用However来引导不足,提出一种新方法或新方向。 如:However, ①little information (little attention/little work/little data/little research……)has been done on/focused on/attempted to conducted/investigated/studied。 ②few studies (few investigations/few researchers/few attempts……) have been done on/focused on/attempted to conducted/investigated/studied。 ③no/none of these studies has been done on/focused on/attempted to conducted/investigated/studied)。 ④no/none of these studies has been with respect to 如:Previous research (studies, records) has (have) failed to consider/ ignored/ misinterpreted/ neglected to/overestimated/underestimated/misled. Thus, these previous results are inconclusive/misleading/unsatisfactory/questionable/ controversial. Uncertainties (discrepancies) still exist…… 1.1. 2. 研究方法和方向与前人一样时,可通过以下方式强调自己工作 However, data is still scarce (rare, less accurate) or there is still dearth of…… We need to (aim to, have to) provide more documents (data, records, studies, increase the dataset). Further studies are still necessary (essential)…… 强调自己研究的重要性,一般还要在However之前介绍与自己研究问题相反或相关的问题。比如:(1)时间问题;(2)研究手段问题;(3)研究区域问题;(4)不确定性;(5)提出自己的假设来验证。 如果你研究的问题在时间上比较新,你可大量提及时间较老问题的研究及重要性,然后(However)表明“对时间尺度比较新的问题研究不足”; 如果你的是一种新的研究手段或研究方向,你可提出当前流行的方法及其物质性质,然后(However)说对你所研究的方向方法研究甚少; 如果研究涉及区域问题,就先总结相邻区域或其它区域的研究,然后(However)强调这一区域的研究不足; 虽然前人对某一问题研究很多,但目前有两种或更多种观点,这种uncertanties或ambiguities值得进一步澄清;

format of a research paper introduction论文的标准格式

Writing a Research Paper Introduction – A step-by-step reference The introduction is the first chapter of a research paper. It starts from the research proposal stage, but it is critical to understand the difference between the introduction of a research proposal and that of a research paper. At the proposal stage, the introduction is presented in a future tense expressing the intensions and expectations of the researcher, whereas that of the research paper is in the past tense, revealing what actually happened. A research paper Introduction plays an essential role of preparing the reader’s mind to follow the paper as it unveils the problem, the researcher’s intervention, intentions and expectations. Sections of a research paper introduction The introduction constituents and sequence m ajorly depend on the type of research and format undertaken. ?Background: Reveals an identified and well defined problem, exploring its history and nature with reference to the existing literature. It should indicate the root of the problem, its extent, the affected, previous investigations, etc.; highlighting the research paper introduction in general, and ensuring proper perception of the situation at hand. ?Statement of the problem: Is the core of the issue/problem and must be clearly defined. It states exactly what the problem is, justifying that the study narrows or bridges the gap between what it is and what it ought to be. ?Purpose of the study: Is derived from the statem ent of the problem. It states why one decides to study the problem and the role of his/her research to solve the problem. ?Objectives of the study: These constitute the targets a researcher intends to achieve. They act as a yardstick for the research exercise and must be specific, m easurable and achievable. ?Research questions: These are research guiding questions generated from objectives. The researcher needs to answer them as part of the investigation. ?Hypotheses: These are guiding predictions of the outcom e of the study. Basing on research questions, an assumption derived form existing theories,

相关文档