文档库 最新最全的文档下载
当前位置:文档库 › 汉语词典快速查询算法研究

汉语词典快速查询算法研究

汉语词典快速查询算法研究
汉语词典快速查询算法研究

汉语词典快速查询算法研究

李江波周强陈祖舜

(清华大学智能技术与系统国家重点实验室北京100084)

E-mail: jiangbo@https://www.wendangku.net/doc/4a11336632.html,

摘要:汉语词典查询是中文信息处理系统的重要基础部分,对系统效率有重要的影响。本文对汉语词典查询算法研究作了简要回顾,设计实现了基于双数组TRIE机制的汉语词典查询算法,并提出了基于双编码机制的词典查询算法。最后对两种词典查询机制进行了实验分析。

关键词:汉语词典查询;双数组TRIE;双编码;中文信息处理。

一、引言

在汉语信息处理系统中,汉语词典查询是一个重要的基础环节,在整个处理过程中都需要频繁地访问词典以获得汉语词语知识,因而汉语词典的快速查询是整个处理系统效率的关键所在。针对词典查询方法,前人作了大量工作,并形成了许多汉语词典组织结构和相应的查询算法。

早期的词典组织构造主要是基于传统Hash方法,文献[1]中采用的方法就是一个典型应用,这种方法的关键技术是Hash函数的设计,采用合理的方式来调节数据块的分配,控制分布的均匀性,减少冲突,提高空间利用率,由于涉及到磁盘读取,这种方法在速度上存在较大局限。

文献[2]指出了三种典型的词典查询方法:整词二分法、TRIE索引树法、逐字二分法。以下分别对这三种方法作简要介绍:(1)基于整词二分的词典机制:整词二分方法的词典结构分为词典正文、词索引表、首字散列表等三级。通过首字散列表的哈希定位和词索引表,很容易确定指定词在词典正文中的可能位置范围,进而在词典正文中通过整词二分进行定位。这种算法的数据结构简单、占用空间小,构建及维护也简单易行,但由于采用全词匹配的查询过程,效率较为低下。(2)基于TRIE索引树的词典机制:TRIE索引树是一种以树的多重链表形式表示的键树,基于TRIE索引树的词典机制由首字散列表和TRIE索引树结点两部分组成。TRIE索引树的优点是分词应用中,在对被切分语句的一次扫描过程中,不需预知待查询词的长度,沿着树链逐字匹配即可;缺点是它的构造和维护比较复杂,而且都是单词树枝,浪费了一定的空间。(3)基于逐字二分法的查询机制:基于逐字二分法的查询机制是对前两种词典机制的改进方案,一方面,从组织结构上,逐字二分与整词二分的词典结构完全一样;另一方面,逐字二分吸收了TRIE索引树的查询优势,即采用的是“逐字匹配”,而不是整词二分的“全词匹配”,这就一定程度地提高了匹配的效率。但由于采用的仍是整词二分的词典结构,使效率的提高受到很大的局限。

文献[3]中提出了基于双字哈希机制的词典查询方法,该方法主要结合了词典中的多字词条(3字词以上)数量少,使用频度低的特点,对基于TRIE索引树的词典机制做出了改进,把TRIE索引树的深度限制为2。其三层结构分别是首字哈希索引,次字哈希索引,剩余字串组。这种查询机制相当于使2字词以下的短词用TRIE索引树机制实现,3字词以上的长词的剩余部分用线性表组织,从而避免了深度搜索,一定程度上提高了查询性能。

此外,文献[4]中提出了一种基于PA TRICIA tree的汉语词典查询机制,这种方法首先使用词条的内码来作为一个关键词位串,然后通过位串比较构造出PATRICIA tree树,树的每个内部节点包括三个数据项:比较位、左指针、右指针,树的叶子节点代表一个词条。查询时根据内部节点选择后继路径,直到叶子节点,该方法的优点是引入了位比较,但是因为树的构造过程是基于内码而非字的,所以不可避免地导致树的深度大大增加,从而造成了效率

降低和空间浪费。

本文设计实现了基于双数组Trie(Double-Array Trie)原理的汉语查询词典;提出并实现了一种基于双编码机制的词典查询机制;最后对改进二分法,双数组Trie(Double-Array Trie),双编码方法三种方法进行了性能上的比较。下面的第二章介绍双数组Trie (Double-Array Trie)的数据结构和具体实现,第三章介绍双编码方法的编码思想和具体查询方式,第四章是对双编码思想进行的性能分析,第五章是对三种方法进行性能实验分析,第六章为全文的总结。

二、双数组Trie(Double-Array Trie)的数据结构与具体实现

Trie树是搜索树的一种,来自英文单词"Re trie val"的简写,可以建立有效的数据检索组织结构。Trie树本质上是一个确定的有限状态自动机(DFA),每个节点代表自动机的一个状态,根据变量的不同,进行状态转移,当到达结束状态或者无法转移的时候,完成查询。传统上的DFA一般用转换表方式来实现,表的列代表自动机的不同状态,行代表转换变量,但是对于词典查询来说,转换表的问题是数据稀疏导致严重地的空间浪费,其空间复杂度为O(n2)。Trie树的另一种实现方式是使用链表节点,这种方式在空间复杂度上降低为O(n),但是问题在于数据结构复杂,查询效率较低[5]。

为了让Trie实用的实现算法在空占用间较少的同时还要保证查询的效率,前人提出了一种用4个线性数组表示DFA的方法,并进一步提出了用3个线性数组表示Trie树的方式。在此基础上,文献[6]做出了进一步改进,用2个线性数组来进行Trie树的表示,即双数组Trie(Double-Array Trie)[7]。

双数组Trie(Double-Array Trie)由两个整数数组构成,一个是base[],另一个是check[]。设数组下标为i ,如果base[i],check[i]均为0,表示该位置为空。如果base[i]为负值,表示该状态为词语。Check[i]表示该状态的前一状态,t=base[i]+a, check[t]=i 。对于汉字词典,采用相同的思想。先把双数组的1-6768放置6768个常用汉字。对于每一个汉字,确定一个base 值,使得对于所有以该汉字开头的词,在双数组中都能放下。例如,现在要确定“阿”字的base值,假设以“阿”开头的词的第二个字序列码依次为a1,a2,a3……an,我们必须找到一个值i,使得base[i+a1],check[i+a1],base[i+a2],check[i+a2]……base[i+an],check[i+an]均为0。一旦找到了这个i,“阿”的base值就确定为i。对于第二个字,第三个字也是类似。

双数组构造完成以后,查询起来极为方便。待查词有几个字,就将汉字分别转换为对应的序列码,然后作几次加法,即可查到相应的词语,无须折半查找。由于汉语中常用词平均长度不到3个字,因此双数组查询算法的效率是极高的。

下面举例说明双数组Trie(Double-Array Trie)的构造过程和查询过程。假定词表中只有“啊,阿根廷,阿胶,阿拉伯,阿拉伯人,埃及”这几个词,用Trie树可以表示为:

我们首先对词表中所有出现的10个汉字进行编码:啊-1,阿-2,唉-3,根-4,胶-5,拉-6,及-7,廷-8,伯-9,人-10。然后在此基础上构建双数组Trie(Double-Array Trie),经过四次遍历,将所有的词语放入双数组中,然后还要遍历一遍词表,修改base值。因为我们用负的base值表示该位置为词语。如果状态i对应某一个词,而且Base[i]=0,那么令Base[i]=(-1)*i,如果Base[i]的值不是0,那么令Base[i]=(-1)*Base[i]。得到双数组如下:

用上述方法生成的双数组,将“啊”,“阿”,“埃”,“阿根”,“阿拉”,“阿胶”,“埃及”,“阿拉伯”,“阿拉伯人”,“阿根廷”均视为状态。每个状态均对应于数组的一个下标。例如设“阿根”的下标为i=8,那么check[i]的内容是“阿”的下标,而base[i]是“阿根廷”的下标的基值。“廷”的序列码为x=8,那么“阿根廷”的下标为base[i]+x=base[8]+8=12。

查询时相当于从一个状态找到另一个状态。例如查询“阿根廷”,先根据“阿”的序列码b=2,找到状态“阿”的下标2,再根据“根”的序列码d=4找到“阿根”的下标base[b]+d=8,同时根据check[base[b]+d]=b,表明“阿根”是某个词的一部分,可以继续查询。然后再找到状态“阿根廷”。它的下标为y=12,此时base[y]<0,check[y]=base[b]+d=8,表明“阿根廷”在词表中,查询完毕。

最后对双数组Trie(Double-Array Trie)机制词典进行空间复杂度分析:该词典机制主要增加的辅助成分是双数组结构,约120,000个状态,另外考虑到实际应用中,还需要获得词条的下标,所以把双数组调整为三数组,共需要空间为,120,000*3*4=1,440,000字节;另外,主词典需要空间为50,000*113=5,650,000字节。总共占用空间:7,090,000字节。

三、双编码机制的词典查询算法

1.双编码的基本思想,

GB-2312编码的常用汉字共有6768个,每个汉字都可以从唯一地从区位码映射到1-6768间的一个序列码,从而每个汉字串都可以唯一地映射到一个数字串,这样对于词语的查询可以转化为基于数字串的查询。双编码的查询思想就是首先将汉字区位码转换成序列码,从而使汉字序列转换成数码序列;然后将汉字序列对应的数码序列转换成数偶码(代表两个有理数)。将整个词表全部转换成数偶码表,排好序,供检索用。

从数码序列到数偶码的转换主要是采用了欧几里德算法(辗转相除法)的思想[8],保证了从数码序列和数偶码之间转换的唯一性,同时还达到了一定程度上数据压缩的目的。具体的转换算法如下:

(1)从序列码到数偶码的编码:

假定输入数据序列存放在数组Seq[]中,其长度为n. 其中a i

(i=1,2,…,n)是汉字符的序码。P,Q是一对输出整数,代表一个既约有理数P/Q, 是

输入数据序列的编码,叫数偶码。编码过程如下:

赋初值:X0=0, Y0=1, X1=1, Y1=0

递归求解:X i=Seq[i-2]*X i-1+X i-2i >1

Y i=Seq[i-2]*Y i-1+Y i-2i >1

获得数偶码:P= X n+1

Q=Y n+1

(2)从数偶码到序列码的解码算法:

输入数据是整数偶. 输出数据是它所代表的汉字(对应的序码)的序列,放

在Out[]中,该序列的长度为n。解码过程如下:

为变量赋初始值:M0=Q X0=P

循环辗转相除,将相除的结果保存进入数组Out[],直到M i为零,递归公

式如下:

Out[i]= (int)X i/M i

M i+1=X i-Out[i]* M i

X i+1=M i

2.索引机制的建立

对整个词典进行编码之后,每个词语就对应着一对数偶码,其特点是随着词语的长度增加,数值会变得很大,所以必须建立相应索引,在这一点上本文进行了相应的多次探索,最后选择了分段索引方式。

具体来说就是对P值小于0xFFFFFF的词语和大于0xFFFFFF的词语分别建立索引,这样做的原因是:

1)首先0xFFFFFF基本上是二字词与三字词的分界线,我们对使用的容量为49500条

的词典进行统计,其中的单字词语有1650条,双字词语有31838条,共33488条,占67.65%。考虑到在具体应用中,多字词语不仅所占比例较小,而且它们出现的频

率要远低于双字词和单字词,所以查询算法应该保证短词的查询速度更快。

2)另一方面,经过统计,在词典中,P码小于0xFFFFFF的词语个数为34243,而所

有词语个数为49500,这样0xFFFFFF以下的P码的数值分布更为密集,所以我们

应该对两段分别采用不同的机制构建索引。

为了建立从双码到词语位置的Hash机制,我们还需要尽可能地保证唯一性,让每个生成的索引值尽量对应唯一的一个词语位置。

查询的具体实现函数如下:

QuerryWord(char* Word)

{

首先对Word编码,生成数偶码P和Q;

If (P<0xFFFFFF)

{

采用P码后五个字节作为索引Index;

调整P码,将其剩余部分作为比较数字;

If (索引Index没有对应词)

返回;

Else if (索引Index对应唯一的一个词)

If (验证匹配)

完成查询,返回;

Else 说明该词不存在,返回;

Else //索引值对应的词语不唯一

从I=pos位置开始分别进行验证,或者找到查询词,或者未查到返回}

If (P > 0xFFFFFF)

原理类似

}

以一个具体查询的例子来说明具体查询过程:假设给定某一词语“祖国”,进行查询,首先将字串“祖国”根据内码转换为序列码存入Seq[ ]数组,“祖”对应3736,国对应“936”,然后将序列数组转化为数偶码P, Q,其中P=0x356A59; Q=0x3A9,则索引Ind=0x56A59,经过查找,Index1[Ind].mark=0,Index1[Ind].pos=14593,查找到WordsList[14592],经过验证WordsList[14592].Valuep=P>>20,而且WordsList[14592].Valueq=Q,则表明已经查询到了相应的词语,返回WordsList[14592]

(P,Q

3.双编码方法性能分析

采用如上的哈希机制之后,可以保证较低的冲突概率。经过分析,对于P值<0xFFFFFF 的哈希表,同一索引值对应一个词的比例占97.15%,同一索引值对应两个词的比例占2.77%;对于P值>0xFFFFFF的哈希表,同一索引值对应一个词的比例占88.31%,同一索引值对应两个词的比例占10.58%,同一索引值对应三个词的比例为1.02%。考虑到查询词中双字词约占76%,所以我们可以说,双编码的冲突概率很低,对于一个汉字串,经过编码后,基本上就能通过哈希表一次查到对应的词。

我们对双编码的机制进行相应的空间复杂度分析:主词典50000*113=5650000字节,索引(0xFFFFF+0xFFFF)*3=3342430字节,总共占用空间:8,992,330字节。从上面分析可以发现,双编码机制的查询效率主要是通过牺牲空间来获取的,我们针对词表分别分段构建的大小为0xFFFFF和0xFFFF的两个数组,被利用的索引值有46779个,其利用率为4.19%,利用率比较低,但考虑到大数组占用的内存空间(如上示,约3.3M)相对于当前计算机的性能而言已经不是什么问题,所以该方法是可行的。

四、实验分析

为对双数组Trie(Double-Array Trie)查询算法和双数组查询算法作性能评测,我们选择了逐字二分法作为性能比较的参照算法。关于逐字二分法的原理,请参考本文的引言部分以及相关的引用文献。

为模拟真实语境,实验主要是在切分的人民日报半年语料库的基础上进行的,分别在相同的硬件环境下,用三种查询机制对语料库中出现的所有词进行查询。实验分为三步:首先进行数据统计分析;然后对三种查询机制进行速度比较;最后对每一种查询机制的各个环节小于0xFFFFFF 大于0xFFFFFF

都进行了速度上的分解分析。

1.在速度评测之前,我们首先对语料库和三种算法的动态性能进行了相应的统计分析,作为问题分析的参考:

1)在人民日报语料库基础上对词典中的49500个词语进行统计。其中单字词2595个,

在训练预料中出现2062393次,比例为;双字词31838个,在训练语料中共出现

2860757次;三字词7858个,在训练语料中共出现165044次;四字词7209个,共

出现62829次。可见真实语境中单字词和双字词的出现频率远高于长词。

2)在人民日报半年切分预料库的基础上,我们对三种查询方法的动态性能分别进行了

统计。对双编码机制的词典查询,经过统计分析发现,平均每次查询需要54.143

次数值运算、1次字符串长度运算、16.548次读取数组运算;对双数组Trie

(Double-Array Trie)机制的词典查询,经过统计分析发现,平均每次查询需要30.44

次数值运算、1次字符串长度运算、1.857次读取数组运算;对逐字二分法机制的词

典查询,经过统计分析发现,平均每次查询需要38.244次数值运算、8.268次数组

读取运算、4.268次字符串比较运算、1次字符串copy运算。

从上面的统计信息可以看出:双数组Trie(Double-Array Trie)机制的词典查询从算

法复杂度上来说是最快的方法,双编码机制的词典查询在数值运算和读取数组运算

上复杂度较高,逐字二分法机制的词典查询则因为增加了字符串比较、copy运算增

加了算法复杂度。

2.接下来三种查询算法的实验测试比较

种新的想法,查询过程完全基于数值运算,避免了字符串比较运算,相对改进二分法性能有所提高。

3.对三种方法进行各个时间环节的分解分析

双编码机制的各个环节时间分析:

从上面可以看出双编码机制查询的主要性能瓶颈是之一是内码到序列码的转换过程,经过分析,我认为这个地方的性能较低主要是因为生成序列数组,并进行了数据传递。另一个瓶颈是读取索引数组,因为我们为了保证索引的唯一性,作了一个较大的索引,这样在读取数组的时候,性能较低。

从上面的分析可以看出,双数组Trie(Double-Array Trie)方法的各个环节时间消耗跟处理词语数目成正比,第一个字处理对应所有的词语处理,第二个字处理对应二字词以上的词语处理,如此类推。处理的主要方式是从当前字生成序列码,并通过加法来进行状态转移。

改进二分法机制的主要时间耗费在二分查找匹配词语的过程中,因为要进行若干次字符串比较工作。

4.综合评价

双数组Trie(Double-Array Trie)机制的词典查询算法中,若待查词长度为N,则将汉字分别转换为对应的序列码,经过N次加法,即可查到相应的词语,无须折半查找。另外由于汉语中常用词平均长度不到3个字,因此双数组查询算法的效率是极高的。这种方法缺点在于:构造调整过程中,每个状态都依赖于其他状态,所以当在词典中插入或删除词语的时候,往往需要对双数组结构进行全局调整,灵活性能较差。

双编码机制的词典查询算法,基本思想是把汉字词语转换到数码的层次上,然后进行词典组织和词语查询。这种算法的优势在于避免了传统查询中的字符串操作,在哈希机制上更为灵活,有较大的改进空间;同时词典组织的方式是传统的线性表,调整起来十分方便;另外,在本算法中突出体现了短词优先的特性,提高了查询效率。这种算法的缺点在于,汉字词语转化到数码的压缩率还不够大,导致生成的数偶码较大,随着词语长度的增加,可能导致溢出,必须引入大数机制;另外,进行词典组织的时候需要构建一个较大的数组,限制了查询效率的提高。

五、结语

本文在双数组Trie(Double-Array Trie)数据结构的基础上,实现了一种基于汉语的词典查询算法,它只需要进行若干次加法运算就可以完成查询,速度上相对其它词典查询机制有了明显的提高,同时相同前缀的词语在词典中也有逻辑上的关系,因此在分词中可以有很好的应用。它的缺点是构造过程复杂,插入删除每一条词语都会引发对整个词典的调整,因此,最好应用于实时性要求较高的封闭式词典中。

本文还提出了双编码机制的汉语词典查询算法,该算法的特点是,通过算术编码,可以

把任意字符串转化为有理数,从而一切查询工作可以基于有理数来进行,避免了二分法的字符串比较,在效率上有所提高,而且词典以线性表组织,调整起来也比较容易。这种方法的缺点是从字符串转化到有理数的过程较复杂,同时生成的有理数过大,建立索引难度比较大,既要尽可能地避免数据稀疏,同时还不能让索引过大,本文通过实验探索,找到了比较合适的索引机制。本词典相对改进二分法词典,性能有了较大的提高。这种算法改进的余地还比较大,可以在数码生成环节,哈希机制等环节作近一步的改进,可以应用于词语长度较小,对速度要求较高的开放式词典中。

参考文献

[1] 王秀坤,李政,简幼良,刘剑基. 基于Hash方法的机器翻译词典的组织与构造. 大连理工大学学报,

1996,(3)

[2] 孙茂松,左正平,黄昌宁. 汉语自动分词词典机制的实验研究. 中文信息学报,2000,(1)

[3] 李庆虎,陈玉健,孙家广. 一种中文分词词典新机制———双字哈希机制. 中文信息学报,2003,(4)

[4] 杨文峰,陈光英,李星. 基于PATRICIA tree的汉语自动分词词典机制. 中文信息学报,2001,(3)

[5] 严蔚敏,吴伟民. 数据结构. 北京:清华大学出版社,1992

[6] Aoe,J.An Efficient Digital Search Algorithm by Using a Double-Array Structure.IEEE Transactions on

Software Engineering. 1989,(9)

[7]Theppitak Karoonboonyanan. An Implementation of Double-Array Trie.

https://www.wendangku.net/doc/4a11336632.html,/thep/da trie/da trie.html

[8] 欧几里德算法. https://www.wendangku.net/doc/4a11336632.html,/nhxi/suanfa/main.htm

An Study on Rapid Algorithm for Chinese Dictionary Query

LI Jiang-bo ZHOU Qiang CHEN Zu-shun

The State Key Laboratory of Intelligent Technology and Systems,

Department of Computer Science and Technology, Tsinghua University. Beijing 100084

E-mail: jiangbo@https://www.wendangku.net/doc/4a11336632.html,

Abstract: The dictionary mechanism is the basic component of Chinese information processing systems, and its efficiency will greatly affect the performances of those systems. In this paper, we review the Algorithms for Chinese dictionary query, design and implement a Chinese dictionary based on Double-Array TRIE mechanism, present a new Chinese dictionary based on Double Coding mechanism. In the end of the Paper , we give the experiment result and conclusion of the two Dictionary query mechanism.

Keywords: Chinese Dictionary Query; Double-Array TRIE; Chinese information processing

现代汉语词典词语汇总之令狐文艳创作

现代汉语词典第六版难读难写词语汇总 令狐文艳 1-300页【柯老师整理】 1.吖嗪ā qín是含有一个或几个氮原子的不饱和六节杂环化合物的总称。 2. 阿訇āhōng今为由清真寺经堂大学或经学院“穿衣”毕业,具有较高宗教学识的宗教人员的通称。 3. 腌臜ā za是一种地方口语,意为不干净,肮脏的意思。用以形容环境、物件等的杂乱不堪、恶臭不洁净等。后引申可用为形容行为、动作等的龌龊,有悖道德良知的层面;也用于心理不爽快等的形容抒发。 4. 哀矜āijīn哀怜;怜悯 5. 娭毑āi jiě 1、祖母;2、尊称老年妇女。 6. 欸乃ǎinǎi1.象声词。摇橹声。2.象声词。棹歌,划船时歌唱之声。 7. 嗳气ài qì指气从胃中上逆。胃出而作声,多见于饱食之后。 8. 嗳酸ǎi suān胃酸从胃里涌到嘴里,指吐酸水。 9. 僾尼ài ní部分哈尼族人的自称。主要居住在云南省西双版纳傣族自治州。 10叆叇àidài 指浓云遮日。 11. 安厝ān cuò停放灵柩待葬或浅埋以待正式安葬。 12氨纶ān lún氨纶是聚氨基甲酸酯纤维的简称,是一种弹性

纤维。 13媕娿ān ē亦作"媕阿"。亦作"媕妸"。亦作"媕婀"。不能决定的样子。 14鹌鹑(ān chún)是雉科中体形较小的一种。野生鹌鹑尾短翅长而尖,上体有黑色和棕色斑相间杂,具有浅黄色羽干纹,下体灰白色,颊和喉部赤褐色,嘴沿灰色,谢淡黄色。 15鮟鱇ān kāng,俗称结巴鱼、哈蟆鱼、海哈蟆、琵琶鱼等,一般生活在热带和亚热带浅海水域。我国有黄鮟鱇和黑鮟鱇两种,黄鮟鱇分布于黄渤海及东海北部,黑鮟鱇多见于东海和南海。 16鞍韂ān chàn马鞍子和垫在马鞍子下面的东西。 17吧嗒bādā象声词,表示一种双音的声响 18疤瘌 bā la也叫疤拉,伤口或疮平复以后留下的痕迹:疮疤。 19拔擢bá zhuó:提拔、挑选人员使担任更重要的职务。 20菝葜bá qiā也称金刚藤,百合科菝葜属,多年生藤本落叶攀附植物。 21跋前疐后bá qián zhì hòu跋:踩;疐:被绊倒。本指狼向前进就踩住了自己的颈肉,向后退又会被自己的尾巴绊倒。比喻进退两难。同“跋胡疐尾”。 22白垩bái’è(名)石灰岩的一种,主要成分是碳酸钙(CaCO3)。是有古生物的残骸集聚形成的。白色,质软,分布很广,用作粉刷材料等。 23白镪bái qiǎng古代当作货币的银子。

现代汉语词典第六版新增3091词语

【A】【挨班儿】【矮化】【矮行星】【爱搭不理】【爱克斯刀】【爱理不理】【碍于】【安监】【安拉】【安慰剂】【安于】【氨纶】【暗地】【暗河】【暗下里】【黯然神伤】【凹镜】 【B】【八音】【霸王条款】【白板】【白道1】【白脸】【白名单】【白杆】【白寿】【白昼见鬼】【百搭】【百废待举】【百废俱兴】【百分百】【百战百胜】【百折不回】【摆渡车】【摆擂】【摆样子】【拜金主义】【拜票】【版权法】【板儿寸】【办结】【半决赛】【半路夫妻】【半日制】 【半数】 【扮靓】 【傍大款】 【保鲜膜】 【保险单】 【保险套】 【褓姆】 【报备】 【抱枕】 【保质期】 【豹子胆】 【暴堵】 【暴狱】 【暴走】 【爆仓】 【爆炒】1 【爆粗】 【爆粗口】 【卑鄙龌龊】 【背包客】 【背囊】 【背囊客】 【北京人】 【北漂】 【贝司】 【贝斯】 【背地】 【背投】 【被动吸烟】 【被告人】 【被叫】 【被迫】 【奔儿头】 【本邦菜】 【本着】 【绷弓】 【必将】 【逼供信】 【闭庭】 【闭眼】 【闭嘴】 【贲临】 【碧玺】 【觱栗】 【壁葬】 【边检】 【编委】 【编舞】 【鞭辟近里】 【变形金刚】 【便当】 【便宜从事】 【辩证施治】 【标本兼治】 【标间】 【标识】 【标准工资】 【标准间】 【标准像】 【飙高】 【飙歌】 【飙戏】 【别看】 【别说是】 【冰场】 【兵役制】 【饼屋】 【并称】 【并非】 【病急乱投医】 【病媒】 【病险】 【播客】 【播迁】 【舶来】 【博客】 【博文】 【博弈论】 【跛脚鸭】 【补编1】 【补编2】 【补气】 【补阙】 【捕快】 【不带】 【不得(de)】 【不敌】 【不点儿】 【不贰】 【不复】1 【不复】2 【不干胶】 【不敢】 【不攻自破】 【不关】 【不归路】 【不果】 【不教而诛】 【不觉】 【不开眼】 【不可或缺】 【不可胜数】 【不名一钱】 【不期而然】 【不求有功, 但求无过】 【不疼不痒】 【不痛不痒】 【不枉】 【不温不火】 【不瘟不火】 【不虚此行】 【不粘锅】 【步测】 【C】 【才赋】 【才俊】 【才貌】 【财产税】 【财神爷】 【彩点】 【彩调】 【彩铃】 【彩屏】 【采邑】 【菜鸟】 【菜籽】 【菜籽油】 【参事】 【餐券】 【餐叙】 【残奥会】 【残旧】 【残片】 【残渣】 【蚕蛹】 【灿灿】 【苍哑】 【草根】 【草就】 【插播1】 【茶道】 【茶寿】 【茶歇】 【茶叙】 【茶余酒后】 【查结】 【差一点儿】 【拆封】 【掺沙子】 【馋虫】 【产床】 【产能】 【产权证】 【产业链】 【颤颤巍巍】 【颤颤悠悠】 【颤悠悠】 【刬除】 【长存】 【长鸣】 【长三角】 【长蛇阵】 【长谈】 【长效】 【长痛不如短 痛】 【肠梗阻】 【常时】 【惝恍】 【唱多】 【唱空】 【唱衰】 【抄底】 【超尘出俗】

现代汉语词典词语汇总讲解

现代汉语词典第六版难读难写词语汇总 1-300页【柯老师整理】1. 吖嗪ā qín是含有一个或几个氮原子的不饱和六节杂环化合物的总称。 2. 阿訇āhōng今为由清真寺经堂大学或经学院“穿衣”毕业,具有较高宗教学识的宗教人员的通称。 3. 腌臜ā za是一种地方口语,意为不干净,肮脏的意思。用以形容环境、物件等的杂乱不堪、恶臭不洁净等。后引申可用为形容行为、动作等的龌龊,有悖道德良知的层面;也用于心理不爽快等的形容抒发。 4. 哀矜āijīn哀怜;怜悯 5. 娭毑āi jiě1、祖母;2、尊称老年妇女。 6. 欸乃ǎinǎi1.象声词。摇橹声。2.象声词。棹歌,划船时歌唱之声。 7. 嗳气ài qì指气从胃中上逆。胃出而作声,多见于饱食之后。 8. 嗳酸ǎi suān胃酸从胃里涌到嘴里,指吐酸水。9. 僾尼ài ní部分哈尼族 人的自称。主要居住在 云南省西双版纳傣族 自治州。 10叆叇àidài 指浓云遮 日。 11. 安厝ān cuò停放灵 柩待葬或浅埋以待正式 安葬。 12氨纶ān lún氨纶是聚 氨基甲酸酯纤维的简 称,是一种弹性纤维。 13媕娿ān ē亦作"媕阿 "。亦作"媕妸"。亦作" 媕婀"。不能决定的样 子。 14鹌鹑(ān chún)是雉 科中体形较小的一种。 野生鹌鹑尾短翅长而 尖,上体有黑色和棕色 斑相间杂,具有浅黄色 羽干纹,下体灰白色, 颊和喉部赤褐色,嘴沿 灰色,谢淡黄色。 15鮟鱇ān kāng,俗称结 巴鱼、哈蟆鱼、海哈蟆、 琵琶鱼等,一般生活在 热带和亚热带浅海水 域。我国有黄鮟鱇和黑 鮟鱇两种,黄鮟鱇分布于黄渤 海及东海北部,黑鮟鱇多见于 东海和南海。 16鞍韂ān chàn马鞍子和垫在 马鞍子下面的东西。 17吧嗒bādā象声词,表示一种 双音的声响 18疤瘌bāla也叫疤拉,伤口 或疮平复以后留下的痕迹:疮 疤。 19拔擢bázhuó:提拔、挑选 人员使担任更重要的职务。 20菝葜bá qiā也称金刚藤,百 合科菝葜属,多年生藤本落叶 攀附植物。 21跋前疐后báqián zhìhòu 跋:踩;疐:被绊倒。本指狼 向前进就踩住了自己的颈肉, 向后退又会被自己的尾巴绊 倒。比喻进退两难。同“跋胡 疐尾”。 22白垩bái’è(名)石灰岩 的一种,主要成分是碳酸钙 (CaCO3)。是有古生物的残骸 集聚形成的。白色,质软,分 布很广,用作粉刷材料等。 23白镪bái qiǎng古代当作货币 的银子。 24白鹇bái xián,又名白雉。

现代汉语词典

引言 《现代汉语词典》(下简称《现汉》)是人们日常生活中最常使用的一部工具书,具有极广的流传面和极高的权威性。它所收纳的词条在很大程度上反映着现代汉语的词汇构成与概貌。但是,词汇是语言系统中最为灵活的一个部分,它活跃于社会的各个领域和层面,总是处于不断的发展之中。作为一部收词具有全面性、选择性,编纂具有规范性的语文性辞典,《现汉》在规范词汇的同时,必须呈现出不断的变化,与时代和环境相契合,引导人们正确地认识和使用语言文字。音译外来词作为其中一大板块,对整部词典有着不可或缺的重要意义,随着时代的发展,与西方民族接触的增多,“从20世纪80年代开始,汉语借用外来词呈现出新趋势”。①《现汉》作为目前影响最大的、读者覆盖面最广的、享有最高声誉的中型汉语语文词典,它在收录音译外来词方面的规范性、实用性和时代性不容置疑。尽管外来词问题早已受到学术界的重视,迄今也有了不少高质量的研究成果,比较重要的论文有刘中富先生的《关于<现代汉语词典>收释外来词的几个问题》和许建中先生的《<现代汉语词典>中的音译外来词》,以及孙国秀的《05版<现代汉语词典>与02版<现代汉语词典>外来词对比分析》,针对5版的音译外来词问题的论著并不多见。 但是,对5版《现汉》中的音译外来词的研究,有利于加强和促进现代汉语音译外来词的规范化,进一步了解其收释外来词的基本原则,肯定成绩,找出不足,使其在收释音译外来词方面更加趋于完善。为此我们对比了《现汉》第5版(下简称5版)与第4版(指《现汉》2002年增补版,下简称4版),以计量的方式从词条、释义、词源的增删和修改的角度探讨了《现汉》在音译外来词方面的修订所取得的成绩和存在的不足。 本文研究的区域是《现汉》的第4、第5两个版本的A—Z部,“音译的外来语一般附注外文,如:【沙发】…[英sofa];【蒙太奇】…[法montage]。“英、法”等字,表示语别。【鶆】…[新拉Rhea],“新拉”表示是新拉丁文。从我国少数民族来的词只附注民族名称,如【萨其马】条附注[满]”。 ②本文所分析统计的外来词为词典中有标记的,即词条末附注语源的词条,得出的计量结果:5版共增加词条35个,删减词条25个,修改词条136个,另外还有“爱克斯射线”、“白金汉宫”、“贝塔粒子”、“伽马射线”、“互联网”、“来复枪”、“米制”、“拍档”、“檀越”等9个词条在4版中未标注语源,但在5版中进行了标注,以及“分贝”和“胲”两个词条在4版中标注了语源,但在5版中未进行标注。 一﹑词条的增减 ①韩淑红、吴远庆:《现代汉语词典》一、五版外来词语源对比考察[J].语文学刊.2008,第1期,第104页。 ②《现代汉语词典》[M].北京:商务印书馆,2005,凡例第6页。

新版现代汉语词典新词

新《现代汉语词典》第6版出版增3000余条新词 历时7年修订,在中国社会科学院语言研究所和商务印书馆的共同努力下,《现代汉语词典》(以下简称《现汉》)第6版正式出版。昨天下午,该书出版座谈会在北京召开。语言生活的变化,时代变迁的痕迹在该辞典中有明显反映。 九大修订吸收最新学术成果 《现汉》自1978年正式出版以来,先后经历了5次修订。该词典迄今已印刷400多次,发行5000万册,先后荣获国家图书奖、国家辞书奖、中国出版政府奖等多个奖项。 中国社会科学院原副院长、中国辞书学会会长,本次修订主持人之一江蓝生介绍说,第6版修订遵循《现代汉语词典》引导规范的一贯宗旨,在全面正确贯彻以往国家有关语言文字和科学技术等方面的规范和标准的同时,还注意吸收和反映近些年来国家语委组织专家学者制定、修订的有关字形、字音等方面的规范标准的最新成果;除了常规性的增、删、改外,还对一些以往历次修订尚未触及的问题进行了系统的调查研究和处理。修订的主要内容有下列九项: (1)依照规范标准审慎确定字形、字音;对字头的简繁、正异关系进行了梳理;增加单字600多个(以地名、姓氏及科技用字为主),共收各类单字13000多个。 (2)增收新词和其他词语3000多条,增补新义400多项,删除少量陈旧词语和词义,共收条目69000多条。 (3)参照国家语委《汉语拼音正词法基本规则》修订课题组和《普通话轻声词儿化词规范》课题组的意见,对条目的注音做了修订。

(4)以意义为主要标准,对同形同音条目的分合做了调整;根据学理和语言使用的实际,调整了一批异形词的主副条。 (5)按类别(如“口语词、方言词、文言词、专科词、外来词、西文字母词”等)对释义进行全面检查和修订,对释义提示词(以“比喻、形容、借指”为主)也做了统一修订。 (6)复查了词类标注,在保持原有词类标注体系的基础上,对少数词的词类标注做了修订。 (7)本着更好地配合释义,体现用法以及扩大词汇信息量等原则,对例词、例句做了相应的增删和修改。 (8)配合释义增补了近百幅古代器物等方面的插图。 (9)根据有关标准和新的研究成果对检字表和附录做了修订。 反映语言生活变化,记录时代变迁 《现汉》第6版中的新词新义新用法充分反映了我国新时期特别是近几年来涌现的新事物、新概念、社会生活的新变化和人们的新观念。新增词语涉及社会生活多个领域。其中,与经济有关的有“产业链、第一桶金、民营企业、文化产业”等;与社会建设和管理有关的有“医疗保险、医改、民调”等;与大众日常生活相关的有“产权证、房贷、群租、二手房、廉租房、两限房、动车”等;反映时下新的生活方式的有“首付、拼车背包客”等;与计算机、互联网有关的有“播客、博客、博文”等。 有些新词语真实地记录了当代社会生活。例如,源自西方的“父亲节、母亲节、感恩节、情人节”等词语,反映中西文化的交流与融合;“洋插队、落地签证、申根协定”等条目是众多国民走出国门的写照;“低碳、减耗、减排、减碳、新能源、光伏效应、电子污染、二手烟”等可以看出我国的社会建设正在稳步推进,民众环保意识也大大增强;“北漂、草根、

现代汉语情感词语表达系统研究 现代汉语频率词典

现代汉语情感词语表达系统研究现代汉语频率词典现代汉语情感词语表达系统研究现代 汉语频率词典 话题:现代汉语频率词典心理活动抑郁寡欢词语 摘要:不同情感词语之间存在着诸多差异,如果不加选择地以情感词语为基础考察情感词语的语法模式和语义特征,会影响研究结果的有效性。通过分析从9种语义分类词典中选择的情感词语,发现它们至少在语体、音节、构词方式、词性、级差、极性和释解方式7个维度上存在差异。这些词语以这7个维度为基础可以构成一个情感意义的词语表达系统;该系统能够为情感词语选择提供理论框架。关键词:情感意义情感词语表达系统情感词语选择情感意义是一个基本的语义范畴;与此对应,情感词语也是一个基本的词语类别。根据Whorf(1956、1998)的隐形范畴理论和功能语言学的语法理论(如Halliday & Matthiessen,1999:26,27),同一语义域的词语应当具有相同的语法表现,同一语义域词语的语义特征可以由语法特征抽象而来。目前的研究大多以此为理论指导,以情感词语为出发点,通过分析情感词语的 搭配,归纳情感词语的语法模式(如赵春利,2007),总结情感意义的语义特征(如Shaver,Wu & Schwartz,1992;赵家新,2006);但是他们在选择作为研究起点的情感词语时很少考虑所选词语之间存在的差异。而正如郭锐(2002:24,25)所说,词语的结构、语体等因素影响词语的语法体现;因而情感词语的筛选是以情感词语的语法分析为基础的研究的先决条件。本文以从9个版本现代汉语语义词典中选出的情感词语为基础,结合前人的研究,分析现代汉语情感意义的词语表达系统,为情感词语的选择提供理论指导。一、情感词汇的选取语义分类词典是根据意义编排,以建立词汇系统为目的的工具书(董大年,2007)。虽然目前国内出版的此类词

现代汉语词典新修改的词语、字音等

(第6版)《现代汉语词典》新修改词语、字音等 现代汉语词典(第6版) 一、新增词语 1、增加新词语 住房出行:产权证、房贷、房卡、群租、房改房、二手房、廉租房、两限房、经济适用房;摆渡车、接驳、动车、屏蔽门、高铁、轨道交通、减速带、车贷、车险、交强险、代驾、酒驾、醉驾、爆堵。 新式生活:首付、扫货、拼车、拼购、拼客、团购、网购、网聊、美甲、瘦身、塑身、餐叙、茶叙、陪餐、陪聊;自驾游、自由行、自助游、背包客、移动办公; 裸婚、闪婚、闪离。 社会群体:北漂、草根、社工、达人、独董、愤青、名嘴、蚁族、月光族。 网络世界:播客、博客、菜鸟、晒客、闪客、炫客、超媒体、电子政务、内联网、物联网、网瘾、微博、云计算。 环境保护:厨余垃圾、低碳、光伏效应、减耗、减排、碳汇、碳源。 经济领域:产能、产业链、客服、环比、负资产、存款准备金、第一桶金、民营企业、非公有制经济、后工业化、文化产业;爆仓、挂单、老鼠仓、期权、权证、权重股、 升水、私募、托收。 社会管理: 三险、社会保障基金、住房公积金、医保、医改、非政府组织、维稳、民调、首问制、述廉、征信、调峰、限行、摇号、调节税。 2、新收外来词、地区词、方言词、字母词 英语外来词:晒、博客、微博、丁克、粉丝、嘉年华、桑拿、舍宾、斯诺克、脱口秀。 日语外来词:刺身、定食、寿司、天妇罗、榻榻米、通勤、手账、数独、新人类、宅急送。粤港澳地区词:八卦、搞掂(搞定)、狗仔队、无厘头、手信、饮茶。 台湾地区词:软体、硬体、网路、数位、太空人、幽浮、捷运;呛声、力挺、糗、出糗、拜票、谢票、站台。 东北方言词:忽悠、嘚瑟、指定。 字母词: CPI(居民消费价格指数)、PPI(工业品出厂价格指数)、(在空中飘浮的直径小于微米的可吸入颗粒物)、ETC(电子不停车收费系统)、ECFA(海峡两岸经济合作框架协议)、FTA(自由贸易协定)。 3、第6 版词语和读音记录社会生活词语 (1)源自西方的“父亲节、母亲节、感恩节、情人节”等词语,反映中西文化的交流与融合; (2)“洋插队、落地签证、申根协定”等条目是众多国民走出国门的写照; (3)“低碳、减耗、减排、减碳、新能源、光伏效应、电子污染、二手烟”等可以看出我国的社会建设正在稳步推进,社会管理更趋开放性和科学化,环保意识也大大增强; (4)“北漂、草根、社工、达人、高管、愤青、名嘴、香蕉人、小皇帝、蚁族、月光族、全职太太”等名词直观地反映了一些新的社会群体及其特点; (5)“闪婚、闪离、试婚”等词语反映了传统婚恋观所受到的巨大冲击; (6)“拜金主义、傍大款、买官、贪腐、碰瓷、吃回扣、潜规则、封口费、关系网、冷暴力、霸王条款”等词语反映了进入社会转型期,市场经济在促进生产力发展的同时也给社会风气和人们的价值观带来一些负面影响。 4、不同版本词语反映时代变迁

13-真的读完整本《现代汉语词典》

宁波高考复习会讲稿 各位同行:大家好。 每次到宁波,都大开眼界,大有收获。 我来自台州玉环,我要和大家分享的故事,可以从两个真实的传言开始。高三离不开做题,其实很多模拟题是抄来抄去的。但是,2012年的高考第一题中的“质量”和2015年的样卷第一题中的“腈纶”两个字,传说都是命题的老师在自己的生活中亲身遇见过的。 我认为语文学习的外延和生活的外延相等这句话无比正确。语文学习不能把语文当作外在的对象学习,还应该和师生的生活融为一体。如果有一本最能代表汉语的书,和学生朝夕相处,相伴三年。那么语文就可能真的成为学生生活的一部分。 具体做法是全年级统一进度,学生人手一本《现代汉语词典》,每周25页,早晚读通读识记,每周自我检测循环往复,历时两年,69周。 当我们从2012年的高一开始这一行动的时候,并不知道,真的读完了整本《现代汉语词典》的每一页。这就是我想和大家分享的故事。 为了让学生动眼又动手,也为了让学生付出的努力不至于化为一、片片飞走的纸张,编制印发了《语基积累本》,每一学年人手一本,三年三本。《语基积累本》由三部分组成:一是使用说明介绍,明确使用方法。二是语基积累单,用于每周的《现代汉语词典》的摘记。三是个性积累单,用于平时的阅读、练习中自己觉得重要或易错内容的整理。 学生利用早晚读逐页翻阅《现代汉语词典》,标注出自己认为读音、字形或词义比较重要而自己又不熟悉的内容,课后将它们摘录到自己的《语基积累本》上,每周的阅读量为25页。

学生在最初阶段的积累时往往抓不住重点,会关注一些很生僻的字词。因此在起始阶段,教师一定要带着学生一起读词典,一起划出重要的内容,并说明理由,慢慢培养他们对语言筛选的敏感。 每个学生在具体摘录的方式上可以选自己喜欢的方式,有的是按页码顺序摘录的,有的把字音、字形、成语分开摘录,有的又特别把多音字整理在一起。 其实这样的故事每天都发生在大家的校园里,我这里重点分享几个细节。我用“团结·紧张·严肃·活泼”八个字概括。这八个字是毛泽东为抗日军政大学题写的校训首先是“团结”。读完一本词典不是容易的事,坚持需要相互鼓励。玉环是一个小城市,成规模的普通高中只有三所,而且好多教师都是相互流动的。我们以校内合作为基础,三校联动,资源共享,也有利于相互提醒相互鼓励。 “紧张”就是学生自己目标明确、任务清楚、每周25页,每天5页,持之以恒,不放一天溜走。虽然检测不是万能的,但是没有检测也是不能的。我们更在意的是把检测渗透在其他必不可少的检测中。 功不唐捐,69周以后,仅仅是每周的检测,就汇集成一本书。下一轮学生有了更好的学习工具。 对学生来说,在完成一轮字典自学后,也就到了高三,就可以根据自己整理的资料,缩小范围,重新梳理出读音、字形和成语释义三个方面资料供自己识记。 第三,无论是怎样的学习,都应该是严肃的。停留在每天的翻阅接触到的还是词典的皮毛,我们还设想了“规律引领”“条块识记”“自主整理”“高频不漏”四个环节。这里举两个细节。在刚开始的时候,我们分20次,每次5分钟,给学生讲解词典的凡例,结合讲授汉语词汇知识。后来这个部分,我们制作成了微课程《玩电脑·读词典·学语言》,被评为省精品课程。

《现代汉语词典》第7版修订的变化

《现代汉语词典》第7版修订的变化 《现代汉语词典》自1978年正式出版以来做过多次修订,以适应社会的发展,更好地反映现代汉语词汇新面貌,体现有关学科研究的新成果,落实国家有关语言文字方面的新规范。 本次修订,主要内容为:全面落实2013年6月由国务院公布的《通用规范汉字表》;增收近几年涌现的新词语400多条,增补新义近100项,删除少量陈旧和见词明义的词语;根据读者和专家意见对700多条词语的释义、举例等做了修订。

重要字音总结 未变化: “血”还是原来的读法,没有改变; “下载”的“载”还是读去声(四声); “纪”在做姓氏的时候还是读上声(三声); “粳米”的“粳”还是统读为jīng; 连累lěi、累lěi及、硕果累léi累léi读音也不变;

应yīng届、应yīng名儿、应yīng许也不变; 血晕yùn、晕yùn车也不变; “心宽体胖”读音也不变,不读pàng; 除“作坊”读zuō外,其余都读zuò不变,包括“作死”、“作揖”、“作弄”; 已变化: 说服,改念shuō服; 芥统读jiè,不读gài了; “荫”不统读yìn了,“林荫道”读yīn,“福荫”读yìn; 大dài黄,改“大dà黄”; 拜,增加“bái”音,用于“拜拜”; 的,增加“dī”音,用于“打的”; 螫统读shì(但字后同时注有zhē)。 另外,“六”也只有liù一个读音,因此地名“六安”按规范应读作liù安,不读lù;“宁”做姓氏时读阳平(二声),区别姓氏“甯”,去声(四声)。 从总结来看,《现代汉语词典》第7版其实这次修订的变化并不多,删改还是比较谨慎的,基本是增加了400多个新词及100多项新义等等,但目前官方并未给出到底增补了哪些内容。

现代汉语(1)(2)

一、单项选择题(在每小题的四个备选答案中,选出一个正确的答案,并将其号码填在题干的括号内。每小题1分,共30分) 1、汉民族共同语在明代称为()。 A.雅言 B.通语 C.国语 D.官话 2、下列各字跟“删”的声母相同的是()。 A.嫂 B.僧 C.耍 D.嗽 3、跟“濒”的声母发音方法完全相同的是()。 A.刽 B.揪 C.傀 D.频 4、下列各组字其韵母跟“凝”完全相同的是()。 A.宜、疑 B.井、杏 C.进、拎 D.邻、平 5、下列双音节词,两个音节的韵母都是合口呼的是()。 A.作对 B.内部 C.舞曲 D.虚幻 6、下列各字跟“索”的声调相同的是()。 A.国 B.谁 C.复 D.乞 7、第一个音节全都变读为211调的是()。 A.毁灭朴素亚洲 B.伪劣请假奶奶 C.柳树有趣舞蹈 D.演示使命广场 8、下列各词中,两个音节的结构方式完全相同的是()。 A.三峡 B.问卷 C.闻名 D.秀美 9、象形、指事、会意、形声都有的一组字是()。 A.益盂戌朱 B.涉伐豕疫 C.布刃取囤 D.易甘贼旗 10、将繁体字“淚”简化为“泪”,使用的方法是()。 A.简化偏旁 B.同音代替 C.换用简单符号 D.构成新的会意字 11、下列短语,没有错别字的是()。 A.戮力同心 B.精神涣发 C.随声附合 D.直接了当

12、都含三个语素的一组词语是()。 A.石榴花儿小孩儿 B.光脚丫儿玻璃瓶儿 C.婴幼儿没有准儿 D.萝卜干儿羊肉串儿 13、全部属于主谓型合成词的一组词是()。 A.眼红火红 B.狐疑笔直 C.胆怯眼热 D.瓦解冰释 14、加下划线的词在句中使用比喻义的是()。 A.他为此费尽了心血 B.阴谋宣告破产 C.月光如水 D.像金刚石一样坚硬 15、从语义场的种类来看,属于关系义场的一组词是()。 A.买—卖 B.工业—农业 C.站—坐 D.会计—出纳 16、下列各组短语中,加下划线的词不属于多义词的是()。 A.背心上长疮了买了一件背心 B.谷底有条河二月卖新丝,五月粜新谷 C.给年青干部加担子农民挑着担子赶集 D.讲讲文章的大意你太大意了 17、属于互补(绝对)反义义场的一组词是()。 A.前进—后退 B.好—坏 C.崇高—渺小 D.运动—静止 18、跟“野生”词性相同的是()。 A.女式 B.男士 C.出生 D.野游 19、“秘密让他发现了”“让他先发言”,其中的“让”()。 A.都是动词 B.都是介词 C.前一个是动词,后一个是介词 D.前一个是介词,后一个是动词 20、下列句子中,疑问代词表示任指的是()。 A.你想说什么? B.你确实什么也没有说过吗? C.他可能有什么心事。 D.我知道他想说什么。

现代汉语词典词语汇总

现代汉语词典词语汇总 现代汉语词典第六版难读难写词语汇总1-300页【柯老师整理】1. 吖嗪ü qín是含有一个或几个氮原子的不饱和六节杂环化合物的总称。 2. 阿訇āhōng 今为清真寺经堂大学或经学院“穿衣”毕业,具有较高宗教学识的宗教人员的通称。 3. 腌臜ā za 是一种地方口语,意为不干净,肮脏的意思。用以形容环境、物件等的杂乱不堪、恶臭不洁净等。后引申可用为形容行为、动作等的龌龊,有悖道德良知的层面;也用于心理不爽快等的形容抒发。 4. 哀矜üij?n哀怜;怜悯 5. 娭毑üi jit 1、祖母;2、尊称老年妇女。 6. 欸乃ǎinǎi1.象声词。摇橹声。2.象声词。棹歌,划船时歌唱之声。 7. 嗳气ài qì指气从胃中上逆。胃出而作声,多见于饱食之后。 8. 嗳酸ǎi suün胃酸从胃里涌到嘴里,指吐酸水。 9.

僾尼ài ní部分哈尼族人的自称。主要居住在云南省西双版纳傣族自治州。10叆叇àidài 指浓云遮日。11. 安厝ün cu?停放灵柩待葬或浅埋以待正式安葬。12氨纶ün lún氨纶是聚氨基甲酸酯纤维的简称,是一种弹性纤维。13媕娿ün y亦作\媕阿\。亦作\媕妸\。亦作\媕婀\。不能决定的样子。14鹌鹑是雉科中体形较小的一种。野生鹌鹑尾短翅长而尖,上体有黑色和棕色斑相间杂,具有浅黄色羽干纹,下体灰白色,颊和喉部赤褐色,嘴沿灰色,谢淡黄色。15鮟鱇ün küng,俗称结巴鱼、哈蟆鱼、海哈蟆、琵琶鱼等,一般生活在热带和亚热带浅海水域。我国有黄鮟鱇和黑1 鮟鱇两种,黄鮟鱇分布于黄渤海及东海北部,黑鮟鱇多见于东海和南海。16鞍韂ün chàn马鞍子和垫在马鞍子下面的东西。17吧嗒büdü象声词,表示一种双音的声响18疤瘌bü la也叫疤拉,伤口或疮平复以后留下的痕迹:疮疤。19拔擢bázhu?:提拔、挑选

读苏新春的《现代汉语分类词典》

龙源期刊网 https://www.wendangku.net/doc/4a11336632.html, 读苏新春的《现代汉语分类词典》 作者:张志毅 来源:《辞书研究》2014年第05期 摘要文章主要评介苏新春的《现代汉语分类词典》,就其分类体系的六个方面以及归类的三个层次进行阐述,并提出该词典还需要增补一些词条及义项,希望未来能在苏新春先生的领导下,编纂出版一部大型的、分类和归类更科学的义类辞书,推动中国尽早成为辞书强国。 关键词《现代汉语分类词典》分类义类辞书归类 中国辞书的天空,古往今来一直群星灿烂。但是词汇语义学的天际,向来是寥若晨星。以词汇语义学为理论框架构拟出的一部词典,苏新春的《现代汉语分类词典》(以下简称“苏典”)则是一颗明亮的启明星。20世纪八九十年代之交,新春以其新锐的思想、新颖的编纂手段,像新星一样升起在东方的词汇学界。20年来,新著迭出,但更令人瞩目的是苏典。 义类辞书,也叫概念词典或题材词典,分为现代的和传统的。 现代义类辞书,导源于1852年罗杰(Roget P.M.)医生主编出版的Thesaurus of English Words and Phrases:Classified and Arranged so as to Facilitate the Expression of Ideas and Assist in Literary Composition.(常译为《罗杰英语同义语词词典》或《英语词汇宝库》),收25.6万个词语,附音序索引,便于检索,至今已经出80多版。效仿该书,从1859年到1963年,法、德、意、俄、西等多国相继出版了十几部义类辞书。在中国,有1983年的《同义词词林》(以下简称《同》)、1985年的《简明汉语义类词典》(以下简称《简》),1991年的《俄语同义词词林》(编者、分类都与《同》大同小异)、1999年的《写作语库》等等。在此前后,仅“柯林斯”“牛津”两大系列的义类辞书就有20多部,如雨后春笋,像春潮齐涌。苏典正 是众多义类辞书中独具特色的一部。 一、继承中外成果 传统义类辞书,旨在训诂读经,分类较粗,如《尔雅》(成书于秦汉之际)、雅系典籍及《释名》《通俗编》《艺文类聚》《渊鉴类涵》,这些义类辞书,属于古典范畴,跟柏拉图式的知识分类没有本质区别。但是,《尔雅》及雅系典籍对后世的一个启示是:审慎选择主训词。例如: 初、哉、首、基、肇、祖、元、胎俶、权舆,始也。 如、适、之、嫁、徂、逝,往也。 上例主训词分别是“始”“往”,其条件是使用频率高,分布语域广。苏典类名的选择,基本遵从这两个原则。

现代汉语词典词语汇总

现代汉语词典第六版难读难写词语汇总1-300页【柯老师整理】1. 吖嗪ā qín是含有一个或几个氮原子的不饱和六节杂环化合物的总称。 2. 阿訇āhōng 今为由清真寺经堂大学或经学院“穿衣”毕业,具有较高宗教学识的宗教人员的通称。 3. 腌臜ā za是一种地方口语,意为不干净,肮脏的意思。用以形容环境、物件等的杂乱不堪、恶臭不洁净等。后引申可用为形容行为、动作等的龌龊,有悖道 德良知的层面; 也用于心理不 爽快等的形容 抒发。 4. 哀矜āijī n哀怜;怜悯 5. 娭毑āi ji ě 1、祖母;2、 尊称老年妇女。 6. 欸乃ǎin ǎi1.象声词。 摇橹声。2.象声 词。棹歌,划船 时歌唱之声。 7. 嗳气ài qì 指气从胃中上 逆。胃出而作 声,多见于饱食 之后。 8. 嗳酸ǎi su ān胃酸从胃里 涌到嘴里,指吐酸 水。 9. 僾尼ài ní部分 哈尼族人的自称。主 要居住在云南省 西双版纳傣族自治 州。 10叆叇àidài 指 浓云遮日。 11. 安厝ān cuò停 放灵柩待葬或浅埋 以待正式安葬。 12氨纶ān lún氨 纶是聚氨基甲酸酯 纤维的简称,是一种 弹性纤维。 13媕娿ān ē亦作" 媕阿"。亦作"媕妸"。 亦作"媕婀"。不能决 定的样子。 14鹌鹑(ān chún) 是雉科中体形较小

的一种。野生鹌鹑尾短翅长而尖,上体有黑色和棕色斑相间杂,具有浅黄色羽干纹,下体灰白色,颊和喉部赤褐色,嘴沿灰色,谢淡黄色。 15鮟鱇ān kāng,俗称结巴鱼、哈蟆鱼、海哈蟆、琵琶鱼等,一般生活在热带和亚热带浅海水域。我国有黄鮟鱇和黑鮟鱇两种,黄鮟鱇分布于黄渤海及东海北部,黑鮟鱇多见于东海和南海。 16鞍韂ān chàn 马鞍子和垫在马鞍子下面的东西。17吧嗒bādā 象声词,表示一 种双音的声响 18疤瘌 bā la 也叫疤拉,伤口 或疮平复以后 留下的痕迹:疮 疤。 19拔擢bá zhu ó:提拔、挑选 人员使担任更 重要的职务。 20菝葜bá qiā也称金刚 藤,百合科菝葜 属,多年生藤本 落叶攀附植物。 21跋前疐后bá qián zhì hò u跋:踩;疐: 被绊倒。本指狼 向前进就踩住 了自己的颈肉,向后 退又会被自己的尾 巴绊倒。比喻进退两 难。同“跋胡疐尾”。 22白垩bái’è (名)石灰岩的一 种,主要成分是碳酸 钙(CaCO3)。是有古 生物的残骸集聚形 成的。白色,质软, 分布很广,用作粉刷 材料等。 23白镪bái qiǎng 古代当作货币的银 子。 24白鹇 bái xiá n,又名白雉。属于 大型鸡类。头顶具 冠。嘴粗短而强壮, 上嘴先端微向下曲, 但不具钩;鼻孔不为 羽毛所掩盖着。翅稍

第六版《现代汉语词典》字词成语整理库

为语文素养奠基 ——第六版《现代汉语词典》常见常用字音、字形、成语整理 (一)正确书写下面加点字的字音。 七上: 1.拗.口() 2.碍.事() 3.遨.游() 4.黯.淡() 5. 哀悼.() 6.把舵.() 7.败露.() 8.斑驳.() 10.褒.贬() 11.报偿.() 12.奔.命() 13.崩坍.() 14.秕.谷()15.蹩.脚() 16.濒.临() 17.秉.承()18.落魄.()19.剥.削()20.庇.护() 21.彪.悍()22.砭.骨() 23.不得.劲()24.不落窠.臼()25.不蔓.不枝() 26.不逊.() 27.恻.隐()28.参差 ..() 29.刹.那() 30.馋涎.欲滴() 31.绰绰 ..() 有余 32.秤.杆() 33.炽.烈() 34.忧心忡忡 ..() ..()35.雏.形() 36.抽搐.() 37.惆怅 38.蟾蜍.( ) 39.雏.鸡() 40.踌躇.() 41.疮.疤()42.创.口() 43.怆.痛() 44.淳.厚() 45.戳.穿() 46.辍.学() 47.一沓.纸()48.大腹便.便() 49.歹.徒()50.大.夫()51.大儒.() 52.大舎.() 53.呆.板() 54.代金券.() 55.旦角.()56. 捯饬.()57.的.士() 58.富庶.()59.电话簿.()60.豆角.() 61.妒.忌() 62.妒嫉.() 63.阿谀 ..() 64.附着.() 65.泔.水()66.穷凶极恶.()67.遏.止()68.发怵.()69. 发横.财() 70.发卡.() 71.杆.秤() 72.杆.子()73.反刍.()74.敷衍塞 ...责()75.拂.晓()76.更.正()77.抚恤.()78.俯瞰.()79.腐蚀.()80.附和.()81.刚柔并济.()82.高亢.()83.耿.直()84.哽塞.()85.哽咽.()86.供.求()87.供.养()88.勾兑.() 89.勾.结()90.诟.病()91.固执.()92.桎梏 ..()93.瓜蔓.() 94.乖戾.()95.拐弯抹. 角()96.怪诞.()97.关隘.()98.关防.()99.归谬.()100.皈.依()101.巾帼.()102.裹挟.()103.扎.小辪()104.虎视眈.眈() 105.殚.精竭虑()106.掸.子()107.肆无忌惮.()108.百战不殆.()109.当.铺()110.荡涤.()111.衣服打折.()112.大大落.落() 113.黄疸.()114.悼唁.()115.嫡.亲() 116.嗲.()117.恫吓 ..()118.豆豉.()119.独角.戏()120.星宿.() 七下: 121.砝码 ..()122.书坊.()123.痱.子() 124.分娩.()125.风靡.() 126.封妻荫.子() 127.封禅.()128.击缶.() 129.麸.子() 130.蜉蝣 ..()131.拊.掌()132.附.加值() 133.曲阜.() 134.馥.郁() 135.旮旯 ..()137.言简意赅.()138.骇.人听闻 ..()136.咖喱 ()139.井冈.山()140.缟.素()141.枯槁.()142.镐.头() 143.隔三岔.五()144.打嗝.() 145.更.衣室()146.更.新()147.如鲠.在喉() 148.呱.呱落地() 149.待价而 沽.() 150.蛊.惑() 151.千刀万剐.()152.哈喇.子()153.哈欠.()154.虾蟆 ..() 155.哈巴 ..狗() 156.哈.达()157.骸.骨() 158.海防.()159.害臊.()160.鼾.声() 161.可汗 ..()162.含混.()163.含血.喷人()164.寒碜.()165.寒噤.()166.罕.见() 167.汗渍.()168.捍.卫()169.悍.勇()170.菡萏 ..()171.颔.首()172.夯.实()173.行.辈()174.行.货()175.引吭.高歌()176.巷.道()177.薅.草()178.蚝.油()179. 号召.()180.明眸皓 ..()184.黑黝黝 ..() ..()182.黑黢黢 ..齿()181.和弦 ..()183.黑魆魆

《现代汉语词典》(第6版)通用词推荐

《现代汉语词典》(第6版)通用词推荐说明:此表推荐用括号前的词,括号内的词尽量不用。 A 艾窝窝(爱窝窝) B 疤瘌(疤拉) 跋前疐后(跋前踬后) 把式(把势) 白茬(白楂、白槎、白碴) 斑白(班白) 斑驳(班驳) 般配(班配) 斑斓(斒斓) 版筑(板筑):土木营造的事情。 板型(版型):样式、款式。 苞谷、苞米(包谷、包米):玉米。 保镖(保镳) 曝光(暴光) 卑辞(卑词):谦恭的话。 贝斯(贝司):多指低音电吉他。 备不住(背不住):说不定,或许。 悖晦(背晦):糊涂,多指老年人。 悖理、悖谬(背理、背谬) 背时(悖时):不合时宜,倒霉。 背搭子(被褡子):出门时用来装被褥、什物等的布袋。 比画(比划) 笔芯(笔心) 筚路蓝缕(荜路蓝缕):形容创业的艰苦。觱篥(筚篥、觱栗):古代一种管乐器。 愊忆(腷臆):烦闷。 辩白(辨白) 辩证(辨证):仅表辨析考证义时通用。 辨证(辨症):辨别症候。 辨正(辩正):辨明是非,改正错误。 辩词(辩辞):辩解的话。 标榜(摽榜) 拨浪鼓(波浪鼓) 波罗蜜(菠萝蜜):一种植物及其果实。勃谿(勃豀):家庭中的争吵。 脖颈(脖梗) 擘画(擘划):筹划,布置。 峬峭(逋峭、庯峭):形容风姿、文笔优美。补缺(补阙) C 菜籽(菜子) 菜籽油(菜子油) 仓促(仓猝) 鸧鹒(仓庚):黄鹂。 仓皇(仓黄、仓惶、苍黄) 草帽辫(草帽缏):用麦秆一类东西编成的扁平的带子。 册页(册叶):分页装裱的字画。 厕足(侧足):插足、涉足。 岔流(汊流) 差使(差事):在泛指职务或官职时通用。掺兑、掺和、掺假、掺杂(搀兑、搀和、搀假、搀杂) 铲除(刬除) 常性(长性):指能坚持做某事的性子时通用。 常川(长川):经常地、连续不断地。 惝恍(惝怳):失意,不高兴;迷迷糊糊,不清楚。 唱功(唱工):戏曲中的歌唱艺术。 潮乎乎(潮呼呼):微湿的样子。 车把式(车把势):赶大车的人。 撤销(撤消) 趻踔(踸踔):跛行、跳跃。 撑竿跳高(撑杆跳高) 成分(成份) 承想(成想) 成荫(成阴):绿树成荫。 呈正(呈政):敬辞,把自己的作品送请别人批评改正。 承上启下(承上起下) 吃挂落(吃挂络):受连累。

现代汉语词典第六版

《现代汉语词典》第5版和第6版字音、字形、词义上的部分区别 一、增改外来词读音 1.的士 “的士”和“打的”中的“的”,《现汉》第5版注音为dí,《现汉》第6版尊重语言事实,把dí直接改为dī(278页)。 2.拜拜 “拜”在《现汉》第5版中只有一个读音bài,《现汉》第6版为“拜拜”的“拜”设立了字头,音bái,“拜拜”注音改为báibái(28页),更符合大众的语言习惯。 3.戛纳 “戛”在《现汉》第5版中只有一个读音jiá(656页),那么我们熟悉的戛纳(法Cannes)电影节该怎么念?是jiánà还是gānà?《现汉》第6版规范了“戛纳”的读音,为这个法国地名设立了字头“戛”,音ɡā(414页)。 4.啫喱 《现汉》第6版为“啫喱”的“啫”设立字头,音zhě,“啫喱”注音为zhě?lí(1649页)。顺带说说“咖喱”的读音,《现汉》第5版、第6版都注音为ɡālí,可日常生活中“喱”往往轻读,建议《现汉》将来修订时把注音改为ɡā?lí或者ɡā?li。 二、调整古语词读音 1.跂① 《现汉》第5版注音为qì(1081页)。《现汉》第6版改为上声qǐ

(1025页) 2.倩 《现汉》第5版收有两个“倩”,都读qiàn,“倩1”意为“美丽”,“倩2”意为“请”(1093页)。《现汉》第6版仍收两个“倩”,但读音不同,“美丽”义仍读qiàn(1039页),“请”义改读qìnɡ(1064页)。宋代大词人辛弃疾的名篇《水龙吟?登建康赏心亭》最后一句是:“倩何人、唤取红巾翠袖,揾英雄泪?”句中的“倩”就是“请”的意思。《汉语大字典》《汉语大词典》《辞海》在这个意义上都注音为qìnɡ。 3.柷 《现汉》第5版只有一个读音chù,古代乐器(205页)。《现汉》第6版改为两个读音:一音chù,用于人名,李柷,唐哀帝(197页);二音zhù,古代乐器(1704页)。 4.唯。“唯唯诺诺”的“唯”,《现汉》第5版注音为wěi(1421页),第6版改为“wéi(旧读wěi)”(1353页) 三、删改方言词读音 1.虎不拉② 《现汉》第5版“虎”有hù音,收方言词“虎不拉”,音hù?bulǎ,指伯劳鸟(579页)。《现汉》第6版删“虎不拉”,“虎”只有一个读音hǔ(549页)。 2.猫腰 《现汉》第5版“猫”有máo音,收词“猫腰”,音máoyāo,《现汉》第6版删“毛腰”,“猫”只有一个读音māo,“猫腰”音māoyāo,并增

第六版现代汉语词典常用成语汇总

常用成语汇总(示例) (释义以第六版《现代汉语词典》为准,★为多义或释义发生变化的词语) 望各位以此为模板,在1月10日前完成这项工作。 A 1.哀而不伤:哀,悲哀;伤,妨害。原来指悲伤不至于使人伤害身心。后形容诗歌、音乐优 美雅致,感情适度,也比喻做事情适中,没有过与不及之处。 2.哀鸿遍野:形容到处都是呻吟呼号、流离失所的灾民的悲惨景象。哀鸿,哀鸣的大雁,比 喻悲哀呼号的灾民。 3.爱莫能助:心里愿意帮助,但是力量做不到。 4.爱惜羽毛:指珍重爱惜自己的声誉。 5.爱屋及乌:因为爱那个人,而连带爱护停留在他屋上的乌鸦。比喻因为爱一个人而连带地 喜爱跟他有关的人或物。 6.安步当车:慢慢地步行,就当着坐车。安,安闲。 7.安贫乐道:安贫,安于贫困;乐道,以守道为乐。处于贫困境地,仍以守道为乐。 8.安身立命:生活有着落,精神有所寄托 9.安时处顺:安于常分,顺其自然,形容满足于现状。 10.安土重迁:重迁,把搬迁看得很重。形容留恋故土,不愿轻易迁移。 11.安之若素:(遇到不顺利情况或反常现象)像平常一样对待,毫不在意。现在也指对错误 的言论和行为不闻不问,听之任之。 12.按部就班:按照一定的条理,遵循一定的程序。 13.★按图索骥:索,寻找;骥,好马。比喻死规矩机械、呆板地做事,也泛指指照线索去寻 找目标。 14.暗度陈仓:指称作战时在正面迷惑敌人,在侧面突然袭击的策略;现比喻暗中进行的活动。

15.暗送秋波:原指暗中眉目传情,后泛指献媚取宠,暗中勾搭。 16.暗箱操作:指利用职权暗中做不公正、不合法的事。 17.黯然销魂:黯然,心情沮丧的样子,销魂,灵魂离开了躯壳。心情沮丧得好象失去了灵魂。 形容极度的悲伤或愁苦。 18.嗷嗷(áo)待哺(bǔ):形容受饥饿的悲惨遭情景。嗷嗷,哀号声;哺,喂食。 B 19.★八面玲珑:原指窗户宽敞明亮,后用来形容人处世圆滑,不得罪任何一方。 20.拔刀相助:指见义勇为,打抱不平。 21.跋山涉水:翻越山岭,蹚水过河,形容旅途艰苦。 22.白璧微瑕:比喻很好的人或事物有些小缺点。 23.白驹过隙:比喻时间过得飞快,就白马在细小的缝隙前一闪而过。 24.★百川归海:形容条条江河流入大海。比喻大势所趋或众望所归,也比喻许多分散的事物 汇集到一个地方。 25.百花齐放:比喻不同形式和风格的各种艺术作品自由发展。 26.百孔千疮:形容破坏严重或弊病很多。 27.百里挑一:形容十分出众。 28.百尺竿头,更进一步:泛用以鼓励人们不要满足于取得的成就,还要继续努力,不断前 进。 29.百身何赎:百身,意为死一百次;何,怎么;赎,抵罪。意思为自身死一百次也换不过来。 比喻对死者极其沉痛的哀悼。 30.百无聊赖:聊赖,依赖,精神上的依托。后来表示思想情感没有依托,精神空虚无聊。 31.百足之虫,死而不僵:现用来比喻势力大的人或集团虽已失败,但其余威和影响依然存 在(多含贬义)。 32.稗官野史:稗官,古代的小官,专给帝王述说街谈巷议、风俗故事,后来称小说为稗官; 野史,古代私家编撰的史书。泛指记载逸闻琐事的作品。 33.班门弄斧:比喻在行家面前卖弄本领。 34.斑驳陆离:形容色彩繁杂。 35.坂上走丸:坂,斜坡;丸,弹丸。形容形势发展很快,就象斜坡上滚弹丸一样。 36.★半壁江山:指保存下来的或丧失掉的部分国土。

相关文档
相关文档 最新文档