文档库 最新最全的文档下载
当前位置:文档库 › 基于TeXTrk和语义网络的文档摘要(IJISA-V9-N11-4)

基于TeXTrk和语义网络的文档摘要(IJISA-V9-N11-4)

基于TeXTrk和语义网络的文档摘要(IJISA-V9-N11-4)
基于TeXTrk和语义网络的文档摘要(IJISA-V9-N11-4)

I.J. Intelligent Systems and Applications, 2017, 11, 26-33

Published Online November 2017 in MECS (https://www.wendangku.net/doc/c516490040.html,/)

DOI: 10.5815/ijisa.2017.11.04

Document Summarization using TextRank and

Semantic Network

Ahmad Ashari

Department of Computer Science and Electronics,

Faculty of Mathematics and Natural Sciences, Universitas Gadjah Mada

E-mail: ashari@ugm.ac.id

Mardhani Riasetiawan

Department of Computer Science and Electronics,

Faculty of Mathematics and Natural Sciences, Universitas Gadjah Mada

E-mail: mardhani@ugm.ac.id

Received: 16 March 2017; Accepted: 08 June 2017; Published: 08 November 2017

Abstract—The research has implemented document summarizing system uses TextRank algorithms and Semantic Networks and Corpus Statistics. The use of TextRank allows extraction of the main phrases of a document that used as a sentence in the summary output. The TextRank consists of several processes, namely tokenization sentence, the establishment of a graph, the edge value calculation algorithms using Semantic Networks and Corpus Statistics, vertex value calculation, sorting vertex value, and the creation of a summary. Testing has done by calculating the recall, precision, and F-Score of the summary using methods ROUGE-N to measure the quality of the system output. The quality of the summaries influenced by the style of writing, the selection of words and symbols in the document, as well as the length of the summary output of the system. The largest value of the F-Score is 10% of the length ta of the document with the F-Score 0.1635 and 150 words with the F-Score 0.1623.

Index Terms—TextRank, Semantic Network, Document Summarization, Rouge-N, F-Score.

I.I NTRODUCTION

The development of technology and the dissemination of information has converged into the wide variety of data and information [1,2,3]. The information dissemination is accompanied by the proliferation of available information, such as documents. However, increasing the amount of information available does not always make it easy for the reader. The problem occurs because everyone does not have enough time to read through all the information available. Especially after reading, it turns out the information available in a document is not following the desired information reader. Therefore, we need a document summarization approach to give the reader a general overview of a document before reading. To resolve this problem, do the method of reading the document at a glance (skimming) [4,5]. But sometimes they make some of the information on the document becomes hard to understand because the information may require other information previously unreadable due to come into skimming.

In addition to skimming, another method that can be done is to read a summary of a document. Summary is a representation of a document containing the main focus of the document. A summary can improve the effectiveness of the reader in searching and finding the desired document [6]. However, a document generally do not have a summary for a summary of a document is time consuming and cost [7]. In addition, a summary document is not easy because a summary should be able to represent the whole of the contents of the document. The research implemented document summarization system uses TextRank algorithms, Semantic Networks and Corpus Statistics. The use of TextRank allows extraction of the main phrases of a document that has used as a sentence in the summary output. Documents Summarization on TextRank consists of several processes, namely tokenization sentence, the establishment of a graph, the edge value calculation algorithms using Semantic Networks and Corpus Statistics, vertex value calculation, sorting vertex value, and the creation of a summary.

II.R ELATED W ORKS

III. M ETHODS

A general description of the system can be seen in Fig.1. The schematic design of the system, there are two main modules, namely TextRank module, and the module Sentence Similarity. In TextRank module, the document has processed into an undirected graph. Documents that have been processed into sentences on TextRank module is then delivered to module Sentence Similarity to quantify the similarity between the sentence that was then sent back to the module TextRank to be the edge. After all processes in TextRank completed, then the sentences issued on the graph in the form of plain text form of a summary.

Fig.1. System Design

TextRank module design includes several major processes, namely splitting the document into sentences, the creation of graphs, calculation of the degree of similarity between sentences, and counting rank within the graph [8,12,14,15]. Chronology of the process of this module begins with the receipt of the documents that has been extracted. Documents in the form of plain text that has entered into the system will be processed first by the type of encoding specified in the input parameters, then proceed with the next process, namely tokenization. In

the process tokenization, each sentence in the document is detected then split into tokens sentence. After tokens sentences were formed, then the next process is the manufacture of undirected graph with each vertex containing tokens sentences preconceived and Initial Value (IV), which is 1. Value edge of the graph is obtained from the process the next module Sentence Similarity.

The next process is to calculate the values at each vertex. Vertex value at iteration n and n + 1 will be recorded to gain error rate (errors) by calculating the difference. If the value of the error is already less than the specified threshold, then continue the next process, if not, repeat the calculation of the value of the vertex. This vertex value calculation process can be performed in parallel because the value of a vertex at iteration n independently of each other due vertex values used for iteration n + 1 is the vertex at iteration n. The graph showing the vertex, the next process is the vertex sort by a value ranging from the largest (descending order). Sentences on vertices that has been ordered are then taken to be used as a summary in the form of plain text with a word length specified in the input parameters.

This similarity accepts input values in the form of a couple of sentences from TextRank module. Every sentence received tokenization process has been conducted so that it will be a collection (set) words. The next process is the calculation of semantic similarity and word order similarity. The output of the counting process semantic similarity is the similarity values between 0 and 1, as well as the word order similarity. After the value of the two processes previously obtained, then the two values will be combined to obtain the overall similarity value which would then be sent to the module to be used as a value TextRank edge on graph.

IV.I MPLEMENTATION Implementation of this system is divided into two large modules as described in the previous section, the module TextRank and Sentence Similarity. TextRank module is responsible for handling and document summarization process. Sentence Similarity module tasked with finding a similarity between the sentence that was subsequently used on the module TextRank. However, this implementation is not limited to these two major modules, are also add-on modules such as modules that handle input, output, and the parameters of the program, as well as modules that handle Corpus used in module Sentence Similarity.

A. Implementation of TextRank Module

In the implementation of this TextRank module, used Python library named NetworkX used to handle the graph creation process. This NetworkX using Python dictionary-based data types to accommodate the data vertex, edge, and graphs so that the data can be accessed quickly. Besides NetworkX, one NLTK module is also used in this module to handle tokenization sentence, namely Punct.

This function was originally named create_graph call a function that will produce a non-directional graph includes a token sentence and edge that contains the similarity between sentences. The resulting graph will then be calculated vertex value by calling a function named calculate_rank which will produce a list containing the value of the vertex, with the index of the list is the same as the index of vertices in a graph. After the vertex values obtained the list, then the list will be further sorted in descending order based on the contents of later retrieved index. List index gained will be used in the next process for the preparation of the summary by taking the sentence on the vertex with the corresponding index in the list of indexes that had previously has sequenced. The length of the word also needs to be calculated so as not to vary much with word length specified in the input parameter (sum_length). This function will then produce the output of string which will then sent to the module that handles input and output to issued in the form of a file.

Fig.2. Create_graph Function

Later in create_graph function as shown in Fig.2, initially to initialize the object of Sentence Similarity modules in a variable named _simobj that has used to compute the similarity between sentences. NetworkX used to create graphs that contain total_words property used to accommodate the total words in the input document to be used in determining the length of the summary output. To process tokenization in the document into sentences, use one of the modules NLTK, Punct which was previously train to detect the expressions on the input document. Furthermore, punct variable that contains the list of punctuation symbols used

as a basis to remove symbols of punctuation in the sentence. The next step is to fill the vertices in a graph with a token sentences and words from the sentences that will be the token is used to calculate the similarity between sentences in Sentence Similarity module. After all and vertex filled, then all the vertices in a graph will be connected with each other with the edge whose value is calculated based on the similarity of the sentence on the vertex-related uses on _simobj functions that have previously has initialized. Edge that contains the value 0 will be removed as vertex-vertex connected has no similarity at all. This function will then produce the output of which is an object graph of NetworkX.

The next function is a function calculate_rank tasked to calculate the value of the input vertex of the. This function will perform as many repetitions max_iter times to calculate the vertex value. Maximum iterations given that the function does not perform repetition does not end because the threshold has not met. Furthermore, the values of vertices in a graph represented with a list of named val and new_val with the same index of the list with an index of vertices in a graph. If the sum of the difference in the overall vertex at iteration n (val) and n + 1 (new_val) -in this case is a delta-less than the specified error threshold, then the iteration will be terminated and the function will return the list new_val iteration where these conditions occur , If the function already reached the limit of maximum iterations, the function will be stopped and return the list new_val.

B. Implementation of Similarity Module

Sentence Similarity on the implementation of this module, WordNet which is one of the modules of NLTK used as a database to search for related words. This module has implemented as an object for easy storing and accessing results similarity in function words in it. Suppose that in a document the word 'eat' and 'rice' appear 10 times, if the results of the calculation of similarity between the word 'eat' and 'rice' has not saved, then the system will search for the similarity between the words as much as 10 times. It has caused the program runtime is significantly slower due to the process of finding similarity between the words is an expensive process regarding of computing and runtime. In addition to computing and runtime issues, easy access to various global variables in the object is also a consideration in the implementation of this module because this global variable will be accessed and used on many of the functions in this module.

Sim_sets variable is a variable of type Python dictionary that can store data in the form of key-value. This variable is used to store a collection of similarity between the words that has previously calculated. Key stored here is a list containing pairs (kata1, kata2) and value here shows similarity between kata1 and kata2. Besides sim_sets, stored too many variables that were used in other functions such as language, corpus, alpha, beta, threshold, and used in calculating the similarity measure.

Sentence_similarity who receive such couples enter a sentence that has become tokens previously stored in the vertex of the graph. This function will call three other functions, namely comb_similarity which will produce sim_sets calculated using the function word_similarity with the input of all possible unique combinations of words in a sentence input, then semantic_similarity used to calculate the value of semantic similarity of the sentence, and word_order_similarity that will count value based on sequence similarity sentence. In the end, this function will provide a combined output of semantic similarity between the value and the value of word order similarity in the form of overall similarity.

Word_similarity which has the task to calculate the degree of similarity between the two words of input by considering the path length and depth along the nearest parent (lowest common subsume) between two words in WordNet. First, the function will search synset in WordNet two input words which, if not found, then the value 0 will be returned. Furthermore, the results of the search will produce two previous synset, synset list of two words given that then searched all the possible combinations and calculated the length of the path between synset. The length of the path of synset has the possibility of providing value None, which means two synset were located in a different tree. Suppose the word 'street' is a verb and the word 'road' which is a noun. Both words are equally the word 'road', but has different properties so that the two has not compared, therefore the length of the path between the two synset None, or no path connecting the two. If the path length of the entire combination synset is None, then the function will return a value of 0. Otherwise, it would have taken a couple of synset that has the shortest path length.

C. Implementation of Corpus Statistic

The Corpus object initialization, the function will read the file corpus that has been provided by the corpus of research results Dinakaramani et al. [3], which contains 10,000 sentences tokenized result are 262,330 tokens. Another module is a module that regulates the input, output, and display program. This module uses Python library named Click to set the input parameters in the CLI. Partially parameters set by the Book, input parameter to accept the document input, output summary and length summaries. Click can set the parameter name, parameter description, the default value of the parameter and others.

D. Testing

Tests on this system using Java implementation of such a program named ROUGE 2.0. The program will accept input in the form of a summary document as plain text. The summary input document has separated into two folders named reference to hold summaries or summaries ideal man, and a folder has named system to accommodate a summary of artificial systems.

Once the summary document has loaded, the next is the configuration settings ROUGE 2.0 which has located in a file with the name rouge.properties. The thing to note in this study is the parameter project.dir, ngram, output, and outputfile. Project.dir parameter is the name of the

folder that holds folders and system reference, ngram is the number of pairs of word n-gram that will be used in ROUGE-N, the output is output from ROUGE type 2.0, and output file is the output file of ROUGE 2.0 if the previous output parameters filled with files. After configuration is complete, run the program named rouge2.0.jar with the command java -jar rouge2.0.jar, then the program will automatically calculate the value of the F-Score, re-call and precision.

V.R ESULT AND D ISCUSSION

The testing is done in two stages, the first stage is to test the summary document by the length parameter summary in the form of a percentage of the document, and the second stage is to examines the summary document by the length parameter summary form of the number of words.

Tests using percentages do as much as 6 times the length of the percentage of a summary document has tested is 5%, 10%, 15%, 20%, 25% and 30%. The test results ROUGE-N will generate recall, precision and F-Score which will then be averaged by columns based on the length of the summary. The test results shows in Table 1.

Table 1. Summarization (Percentage)

Tests using the word count done as much as 6 times the length of each summary is 50, 100, 150, 200, 250, and 300 words. Just as before, the test results ROUGE-N generate recall, precision and F-Score which will then be averaged by columns based on the length of the summary. The test results shows in Table 2.

Table 2. Summarization (Length) From the second testing that has been done, the recall

value in the second test will increase along with

increasing the length of the summary. This is due to the

longer summary of the output system, the more the words

in the summary output system that are relevant to

the

words in the summary of the man-made causes the expanding recall value obtained. But the great recall value which does not guarantee the accuracy of the summary produced by the system with a summary of man-made, because the recall value simply counting how many relevant value received by the system. Suppose the 1000 data received by the system, already covers 50 of the 50 relevant data, the recall value of the system is 1 (100%) due to the received data already covers all relevant data, although the value obtained is also entering 950 incorrect data.

Fig.3 and Fig.4, the value of precision that results from both tests tend to decrease with increasing the amount of long summary. This is because the longer the output summary of the system, the more the words in the summary output system that are not relevant to a summary of man-made cause a decline in the value of precision given the precision value has obtained by calculating whether all the accepted values is the value of the relevant system. Suppose the data received from the 1000 system, obtained 50 of the 50 relevant data, then the value of precision of the system is simply 50/1000 (5%) although data received already covers all relevant data. This is because the 1000 data received, precision or accuracy of the system are just 50 of the 1000 Data.

Fig.3. Recall Average Percentage

From the above test results, it can be seen that the precision and recall value inversely with the amount of data in this study the long-summary-received. To overcome this, use the F-Score is the average harmonic of recall and precision. Value F-Score has used to measure the degree of similarity of the summary output with a summary of man-made systems. As for the average chart F-Score of the test shows in Fig.5 for testing with the

length of the sentence in the form of percentages, and Fig.6 for testing with the length of the sentence in the form of the word count.

Fig.4. Recall Average Length

Fig.5. Average Precision (Percentage)

Fig.6. Average Precision (Words)

Fig.7 and Fig.8, shows the average value of the F-Score achieved when the maximum length of the summary is set at 10% of the total words on the document or set at 150 words. This shows that on average the highest proximity to the system summary manmade ideal is achieved when the length of the summary is set at 10% of the total words on the document or set at 150 words. In addition to a long summary, F-Score of the summary is also influenced by the content of the document to be

summarized.

Fig.7. Average F-Score (percentage)

Fig.8. Average F-Score (Words)

VI. C ONCLUSION

Research has been successfully implemented in a system using TextRank algorithm, Semantic Network and Corpus Statistics. The results showed that the value of F-Score Low summary influenced by the style of writing the source document that gives many examples of cases so as to provide a significant impact on the value of the F-Score summary as previously discussed. The result applies to all documents that use this style of writing such works by looking at remembering TextRank majority voting so that the topic with major supporters sentence that will go into a sentence in the summary. Thus, the style of writing is one of the factors that affect the quality of the output summary. The use of symbols and choice of words that are not standard will also affect the results of the summary given on Sentence Similarity module as described earlier, words or symbols that are not on WordNet will be assigned a value of 0 for the sentence. The results also showed that the value of F-Score on summary influenced by the length of the summary. This is because with the increased length of the summary, increased many words that are not relevant to the summary should ideally lead to the falling value of precision. The fall in the value of precision will significantly impact the value of the F-Score although

recall value will continue to increase, given the value of the F-Score has obtained by calculating the average harmonic of recall and precision so that these values must be in the balance to achieve the F-Score high.

Based on test results, obtained the optimal length of the output summary which has an average value of the highest F-Score system that is 10% with a value of 0.1635 if the F-Score lengthy summaries using percentages, and 150 words with a value of 0.1623 if the F-Score long summary uses the word count. The F-Score value generated by the system is still limited to be used as a summary of the document. This is because the summary of the results of the document summarize system can only extract from the sentence contained in the document, unlike the man-made abstract whose contents may have the same meaning but use different words (paraphrasing) so that the ROUGE test can not detect this .

The future work of the reseaech, It should be further investigated the use of other algorithm models or the incorporation of several other algorithm models to calculate the degree of similarity between words. It should be further investigated how the influence and use of other ontology models in addition to WordNet in finding relations between words. Implemented word matching based on HAS-A relation on WordNet and combine it with search based on IS-A relation.

A CKNOWLEGMENT

Cloud & Grid Technology Working Group has supported the research in facilities and technical assistance. The research has supported by Postgraduate of Computer Science Program, Faculty of Mathematics and Natural Sciences, Universitas Gadjah Mada. The research give acknowledgement to Nurdian Nugroho for his assistance and technical supports.

R EFERENCES

[1]Bond, F., Lim, L.T., Tang, E.K. and Riza, H., 2014, The

Combined Wordnet Bahasa, NUSA: Linguistic studies of languages in and around Indonesia, 57, 83–100.

[2]Brin, S. and Page, L., 1998, The Anatomy of a Large-

Scale Hypertextual Web Search Engine, Computer Networks and ISDN Systems, 1-7, 30, 107–117.

[3]Dinakaramani, A., Rashel, F., Luthfi, A. and Manurung,

R., 2014, Designing an Indonesian Part of Speech Tagset and Manually Tagged Indonesian Corpus, 2014 International Conference on Asian Language Processing (IALP), Kuching.

[4]Li, Y., McLean, D., Bandar, Z., O'Shea, J.D. and Crockett,

K., 2006, Sentence Similarity Based on Semantic Nets and Corpus Statistics, IEEE Transactions on Knowledge and Data Engineering, 8, 18, 1138–1150

[5]Lin, C.Y., 2004, Rouge: A Package for Automatic

Evaluation of Summaries, Text Summarization Branches Out: Proceedings of the ACL-04 Workshop, Barcelona. [6]Aliguliyev, R.M., 2007, Automatic Document

Summarization by Sentence Extraction, Вычислительные технологии, 5, 12, 5–15

[7]Radev, D.R., Hovy, E. and McKeown, K., 2002,

Introduction to the Special Issue on Summarization, Computational Linguistics, 4, 28, 399–408. [8]Mihalcea, R. and Tarau, P., 2004, TextRank: Bringing

Order into Texts, Proceedings of the 2004 Conference on Empirical Methods in Natural Language Processing, Barcelona.

[9]Li, Y., Bandar, Z.A. and McLean, D., 2003, An Approach

for Measuring Semantic Similarity between Words Using Multiple Information Sources, IEEE Transactions on Knowledge and Data Engineering, 4, 15, 871–882 [10]Zikra, H., 2009, Sistem Peringkas Teks Otomatis

Menggunakan Algoritme Page Rank, Tesis, Jurusan Ilmu Komputer FMIPA IPB, Bogor

[11]Hoffmann, A. and Pham, S.B., 2003, Towards Topic-

Based Summarization for Interactive Document Viewing, K-CAP 2003 - Proceedings of the 2nd International Conference on Knowledge Capture, Sanibel Island. [12]Park, S., 2009, User-focused Automatic Document

Summarization using Non-negative Matrix Factorization and Pseudo Relevance Feedback, Proceedings of 2009 International Conference on Computer Engineering and Applications (ICCEA 2009), Manila.

[13]Aji, S. and Kaimal, R., 2012, Document Summarization

Using Positive Pointwise Mutual Information, International Journal of Computer Science & Information Technology, 2, 4, 47–55.

[14]Miller, G.A., 1995, WordNet: A Lexical Database for

English, Communications of the ACM, 11, 38, 39–41 [15]Noor, N.H.M., Sapuan, S. and Bond, F., 2011, Creating

the Open Wordnet Bahasa., Proceedings of the 25th Pacific Asia Conference on Language, Information and Computation (PACLIC 25), Singapore.

[16]Fang, C., Mu, D., Deng, Z., Wu, Z., 2016, Word-Sentence

co-ranking for automatic extractive text summarization, Expert System with Appliactions, 72,, 189-195.

[17]Abdi, A., Idris, N., Alguliyev, R.M., 2017, Query-based

multi-dicuments summarization using linguistic knowledge and content word expansion, Soft Computing, 21(7), 1785-1801.

[18]Di Sciascio, C., Mayr, L., Veas, E., 2017, The 2017 ACM

Workshop on Exploratory Search and Intreactive Data Aanalytics, 41-48.

[19]Kumar, Y.J., Kang, F.J., Goh, O.S., Khan, A., 2017, Text

Summarization Besd on Classficiation Using ANFIS, Studies in Computational Intelligence, 405-417. Authors’ Profiles

Ahmad Ashari, Dr.techn is senior researcher in

Department of Computer Sciences and

Electronics, Faculty of Mathematics and Natural

Sciences, Universitas Gadjah Mada. His work

has been published in several international

journals for Computer and Network architecture

area. The research focuses are computer network,

security and high performance computing.

Mardhani Riasetiawan is researcher in

Department of Computer Sciences and

Electronics, Faculty of Mathematics and Natural

Sciences Universitas Gadjah Mada, Indonesia.

Mardhani research focus is in Cloud, Grid and

Cluster Infrastructure, Enterprise Data Center,

and Big Data.

How to cite this paper: Ahmad Ashari, Mardhani Riasetiawan, "Document Summarization using TextRank and Semantic Network", International Journal of Intelligent Systems and Applications(IJISA), Vol.9, No.11, pp.26-33, 2017. DOI: 10.5815/ijisa.2017.11.04

论网络语言的特点与发展趋势

论网络语言的特点与发展趋势 [ 孙柏转贴自: 湖南社会学网点击数:239更新时间:2009-6-17文章录入: admin] 越来越多的人正处在网络文化的新时代当中,而人类交流的工具——语言,也随着网络的扩展在一个新的时空里延伸。网络作为语言的一个载体,具有虚拟性、自主性、开放性、包容性、多样性等不同于传统语言载体的特点,正是由于这些特点催生了语言的新语体--网络语言。网络语言的出现和发展是当代语言生活中一个引起广泛关注的现象。 一、网络语言的特点 相对于我们的真实世界和生活语言,网络语言是人们在网络上用以交流的信息载体,由于其形成环境的特殊性,不可避免地带有与网络相适应的鲜明特征。 1、口语化 网络语言的表现形式虽然是书面的,但其实质更接近口语。网民们在网络中使用网络语言进行交流,就像是在现实生活中"打电话",它带有口语化的特征,主要表现为: (1)语气词的大量使用。网络语言中语气词的使用随处可见,网民们在一句话的开头或结尾都常会使用语气词,有的时候还是两个语气词叠用。如: "哇噻,终于找到你了!","噢,我就说呢。"语气词的使用在日常口语中也很常见,但网络语言中语气词的使用与之相比似有过之而无不及。由于网上交流少了面对面交流的那一份约束,网络语言常显得更加夸张,就语气词而言,不仅出现的频率相当高,而且还常常在后面跟上类似于"~~~"的符号,用以加强语气。

(2)方言词的大量使用。在网络语言中方言占据了流行的一角,并借助网络传播的优势赢得了越来越多网民的亲睐。由于方言在语音、语调和词汇上与普通话有一定的差异,字典里很少有标记这一类词汇的文字(有的方言甚至根本没有相应的文字书写形式)。因此,为了达到方言的音响效果,网民们常常利用谐音这一手段造出许多字的"新"用法。如: "麻烦介绍一下撒"(语气词,四川方言),"偶觉得还可以"("我"的意思,港台方言)。网络语言中的方言现象不仅能让操同一方言的使用者倍感亲切,有时还能利用其特殊的语音、语调造成幽默,新奇或是讽刺的效果,如下文中的例子采用谐音,就将方言普通话的腔调模仿的惟妙惟肖,例一: "亲爱滴,偶来了咯~~~",生动地表现了"小情人"间那种"粘乎乎"感觉。 (3)省音现象。网络语言中的省音现象与英语中的连读有些相似但又不完全相同,英语中的连读只是将两个字的发音连在一起,并不因此减少一个因素。而网络语言中的这种省音现象不仅将两个字的发音连在了一起,还省去了一些因素对音节进行合并。在日常的口头交际中,由于语速过快人们有时会将两个字的音连起来发,听上去像一个字,用书面语的形式记录下来的话,通常会还其本来面目,可是在网络语言中,这种现象却被网民们"临摹"下来了,如: "你不要老是酱紫嘛。"--"酱紫"是"这样子"的意思。 2、创造性 与现代汉语词汇系统中词汇的严谨相比较,网络语言由于减少了外来的束缚,发挥了运用者的自由,往往在构思上更为巧妙,语出惊人,令人瞠目,最大限度地反映了人们在语言上的创造力。网民们可以在网络上最大限度地发挥自己的想象力和创造性,张扬自己的个性以引起别人的重视,取得一定范围的认同,丰富多彩的网络语言为网民提供展示个性的平台,网民展示个性的文字又丰富了网络语言的空间。网络语言建立在想象基础之上,其独特的语言体式和风格表现在网络语言的词语、数字、字母、图形、音韵和中外语言的内涵延展、脱义和综合转换运用上,表现在句式的简短、倒装、创新和省略上。 (1)完全创新。例如:

网络语言变异词语对中小学生语言发展的侵害探微 (2)

浅谈网络语言变异词语对中小学生语言发展的危害 [摘要]网络语言日益显示出它强大的渗透力和影响力,网络语言在语词、语法、语用等方面都出现了变异。中小学生群体,驾驭语言能力较差,辨别能力不够,判断是非模糊,可塑性很强,很容易受到网络语言中的不良词语的侵害。网络信息传播者和语言文字工作者以及教育工作者如何正视网络语言,抵御网络语言不良词语对中小学生的侵害,是当前摆在网络信息传播者和语言文字工作者以及教育工作者面前的一个新课题。 [关键词]网络语言变异词语中小学生受众语言发展 一网络语言的现状 据中国互联网信息中心2008年2月公布的调查报告显示,截止2008年1月17日我国上网人数已达到3亿人。这个庞大的数字标志我国已经进入互联网时代。互联网的广泛使用,促进了新的表达语言的产生:网络语言。网络语言包括编辑网页和编程所使用的计算机语言,与网络设施和技术有关的术语,与网络有关的特别用语。人们在聊天室和BBS上的常用词语和符号。但最具影响的还是人们的聊天室和BBS上的常用的词语带有明显网路背景和自身特点的词语和符号。 网络时代的海量信息客观上要求网路交流必须实现最大程度的快捷和迅速,而传统的语言已无法满足这个要求,由此应运而生了一种由符号数字英文字母汉字等糅杂的网络语言。“寒ing,泥素芥末286,偶稀饭滴淫8素酱紫滴!”这段话乍一看,让人摸不到头脑,翻译过来,它的意思是:“天哪,你是这么老土了,你太外行了,我喜欢的人不是这样的。”而“大虾,你好油墨!粉丝,偶倒。”的意思则是“高手,你太幽默了,说话拐弯抹角,我笑倒了。”这些语言正是网络上的一段很普通的对话,却如此“简洁”,已经让人不知所云了。 网络语言不仅流行在网络社会,同时它正在逐渐侵占着我们现代社会的文明,给社会带来巨大的冲击和改革。经济社会的发展,互联网的重要性不言而喻,但从此产生的网络语言却带给我们太大的影响。 光明日报曾进行这样一项关于网路语言的调查问卷,主要通过发放问卷与网上发问两种方式,调查对象有:中学生大学生上班族。结果显示,对网路语言表示反对的占15%左右,支持的占10%,“骑墙”的占75%,其中90%以上的调查对象只懂得几,据中国互联网信息中心2008年2月公布的调查报告显示,截止2008年1月17日我国上网人数已达到3亿人个网络词语。而网民们“骑墙”的态度主要是因为网络语言没有太多的影响自己的生活。而且,偶尔的几句富有趣味性的网络语言也增加了生活的情趣。但网络语言的产生对现在正在学习中的中小学生有没有不良的影响呢? 自从接触网络,虽然我从不使用网络语言,但我常常为许多生造的网络语言所迷惑,而且出尽洋相。 一次,我写了一首旧体诗发在网上,被我侄儿看到,被我侄儿大赞,阿姨正是与时俱进了,会使用网络语言了。弄得我一头雾水,最后总算明白,他把我文中的偶然的“偶”字理解为网络语言中的“我”去了。 如今是信息高速发展时代,网络作为“第四媒体”,受到越来越多的青睐与关注,网络语言也日益显示出它强大的渗透力和影响力。作为一种新形式的传播符号,网络语言在语词、语法、语用等方面都出现了变异。作为网络语言的特殊受群——中小学

网络计划技术习题(学生练习)

网络计划技术练习题 —、多选题: 1、某分部工程双代号网络计划如下图所示,其作图错误包括( ) A.多个起点节点 B.多个终点节点 C ?节点编号有误 D.存在循环回路E ?有多余虚工作 2、某分部工程双代号网络计划如下图所示,图中错误为( )。

A, 多个起点节点 B .多个终点节点 C .存在循 环回路 D.节点编号重复 E .节点编号有误 3、(04年考题)某分部工程双代号网络计划如下图所示,图 中错误为()。 I—— --------- ——5 ------------------------- f -------------------- B -------- D A.节点编号有误 B ?有多个终点节点 C ?存在循环回 路 D.工作代号重复 E .有多个起点节点 4、(01年考题)某分部工程双代号网络计划如下图所示,其中图中错误包括()。

A.有多个起点节点 B ?有多个终点节点 C ?存在循环 回路 D.工作代号重复 E ?节点编号有误 5. 在工程双代号网络计划中,某项工作的最早完成时间是指其( )。 A.开始节点的最早时间与工作总时差之和 B .开始节 点的最早时间与工作持续时间之和 C. 完成节点的最迟时间与工作持续时间之差 D .完成节 点的最迟时间与工作总时差之差 E.完成节点的最迟时间与工作自由时差之差 6. 某工程双 代号网络计划如下图所示,图中已标出每项工作的最早开始时间 和最迟开始时间,该计划表明()。

A. 关键线路有2 条 B ?工作1 — 3与工作3—6的总时 差相等 C 工作4—7与工作5—7的自由时差相等 D. 工作2—6的总时差与自由时差相等 E ?工作3— 6 的总时差与自由时差不等 A. 工作2-5为关键工作 C. 工作1-6的自由时差为0 7、某工程双代号网络计划如下图所示, 图中已标出每个节点的 B ?工作5-7为关键工作 最早时间和最迟时间,该计划表明(

人工智能习题&答案-第4章-计算智能1-神经计算-模糊计算

第四章计算智能(1):神经计算模糊计算4-1 计算智能的含义是什么?它涉及哪些研究分支? 贝兹德克认为计算智能取决于制造者提供的数值数据,而不依赖于知识。计算智能是智力的低层认知。 主要的研究领域为神经计算,模糊计算,进化计算,人工生命。 4-2 试述计算智能(CI)、人工智能(AI)和生物智能(BI)的关系。 计算智能是智力的低层认知,主要取决于数值数据而不依赖于知识。人工智能是在计算智能的基础上引入知识而产生的智力中层认知。生物智能,尤其是人类智能,则是最高层的智能。即CI包含AI包含BI 4-3 人工神经网络为什么具有诱人的发展前景和潜在的广泛应用领域? 人工神经网络具有如下至关重要的特性: (1) 并行分布处理 适于实时和动态处理 (2)非线性映射 给处理非线性问题带来新的希望 (3) 通过训练进行学习 一个经过适当训练的神经网络具有归纳全部数据的能力,能够解决那些由数学模型或描述规则难以处理的问题 (4) 适应与集成 神经网络的强适应和信息融合能力使得它可以同时输入大量不同的控制信号,实现信息集成和融合,适于复杂,大规模和多变量系统 (5) 硬件实现 一些超大规模集成是电路实现硬件已经问世,使得神经网络成为具有快速和大规模处理能力的网络。 4-4 简述生物神经元及人工神经网络的结构和主要学习算法。

生物神经元 大多数神经元由一个细胞体(cell body或soma)和突(process)两部分组成。突分两类,即轴突(axon)和树突(dendrite),轴突是个突出部分,长度可达1m,把本神经元的输出发送至其它相连接的神经元。树突也是突出部分,但一般较短,且分枝很多,与其它神经元的轴突相连,以接收来自其它神经元的生物信号。 轴突的末端与树突进行信号传递的界面称为突触(synapse),通过突触向其它神经元发送信息。对某些突触的刺激促使神经元触发(fire)。只有神经元所有输入的总效应达到阈值电平,它才能开始工作。此时,神经元就产生一个全强度的输出窄脉冲,从细胞体经轴突进入轴突分枝。这时的神经元就称为被触发。突触把经过一个神经元轴突的脉冲转化为下一个神经元的兴奋或抑制。学习就发生在突触附近。 每个人脑大约含有10^11-10^12个神经元,每一神经元又约有10^3-10^4个突触。神经元通过突触形成的网络,传递神经元间的兴奋与抑制。大脑的全部神经元构成极其复杂的拓扑网络群体,用于实现记忆与思维。 人工神经网络的结构 人工神经网络由神经元模型构成。每个神经元具有单一输出,并且能够与其它神经元连接,存在许多输出连接方法,每种连接方法对应于一个连接权系数。 人工神经网络的结构分为2类, (1)递归(反馈)网络 有些神经元的输出被反馈至同层或前层神经元。信号能够从正向和反向流通。Hopfield网络,Elmman网络和Jordan网络是代表。 (2) 前馈网络 具有递阶分层结构,由一些同层神经元间不存在互连的层级组成。从输入层至输出层的信号通过单向连接流通,神经元从一层连接至下一层,不存在同层神经元之间的连接。多层感知器(MLP),学习矢量量化网络(LVQ),小脑模型连接控制网络(CMAC)和数据处理方法网络(GMDH)是代表。 人工神经网络的主要学习算法 (1) 指导式(有师)学习 根据期望和实际的网络输出之间的差来调整神经元连接的强度或权。包括Delta规则,广义Delta规则,反向传播算法及LVQ算法。 (2) 非指导(无导师)学习 训练过程中,神经网络能自动地适应连接权,以便按相似特征把输入模式分组聚集。包括

网络语言对我们生活的影响

网络语言对我们生活的 影响 LG GROUP system office room 【LGA16H-LGYY-LGUA8Q8-LGA162】

网络语言对我们生活的影响 by高二16班 摘要:随着互联网的日益普及,网络的魅力越来越大,几乎成为人们日常生活不可缺少的东西,人们在享受互联网所带来的快捷,便利以及庞大的共享资源的同时,也伴随着一些问题出现,首先就是铺天盖地的网络语言让人目不暇接。这种缺乏文化底蕴却充满着活力和创新活力的新语言在受到年轻人极度欢迎的同时,也要经受越来越多的人的挑战,而如何正确对待这种语言现象不得不引起我们的思考。 一·什么是网络语言现象 “555”“MM”“LZ”面对这样一些莫名奇妙的奇怪组合,你有何反应呢?实际上,这些特殊的字的组合正慢慢被越来越多的人接受并且使用,甚至,在网 络的大环境里被越来越多的人推崇。在现实生活中,尤其是在各大中小院校里,我们随处可以听见“恐龙”“青蛙”“灌水”“BF(男朋友)”等这样的网络语言,有的把它们当成口头禅,有的学生甚至把它们当作书面语言,在作文中使用。首个《中国语言生活状况报告》也把网络语言的研究提到日程中,这些充斥着让人似懂非懂的网络语言的使用频率在某些方面甚至超过了正规汉字,尤其是各种表情符号,越来越受到广大网民的推崇,网络语言现象也越来越引起人们的重视和研究,。实际上,中国的互联网真正兴起也不过是最近十年的时间,但在这短短的十年里网络语言的产生速度和流传广度已经大大超出了人们的预料,它不就改变了广大网民的网络生活和思维方式,同时也日益影响着现实生活,甚至走进报刊杂志这些与人们生活时时相关的传播渠成一种极具特色的语言现象。 二·网络语言是否是一种文化? 不得不承认,网络语言固然有一定的创造力,但这只针对部分人而言的,网语对一些不经常接触网络的人来说无异于“天语”。一种语言写出来如果让大部分人看不懂,影响了沟通,也就失去了它作为语言的意义。而网络语言现象越来越火热,甚至走入平面媒体,这就不得不让我们思考网语是否是一个文化呢?还只是一种短暂性的语言现象。广义的文化是指人类在社会历史实践中所创造的物质财富和精神财富的总和。狭义的文化指社会的意识形态以及与之相适应的制度和组织机构。作为意识形态的文化,是一定社会的政治和经济的反映,又作用于一定社会的政治和经济。从这个角度看,网络语言是网络发展的体现。对中国而言,网络的普及几乎是与经济发展同步的,上世纪九十年代后,中国的经济的发展迅速,带动了整个社会形态偏向于一种快节奏,快思维的模式,这也波及到变化相对缓慢的文化事业上。中国文化自古就讲究底蕴和内涵,追求博大精深,源远流长,而在经济大潮中应运而上的网络语言却彻底颠覆了这种观念。网语中大多存在不规范的简体字,或用字母简称某个词语等,有失规范,缺乏语言特征,更别谈有什么文化底蕴了。而一种文化之所以称之为文化,很重要的原因在于文化具有继承性和传承性,中国文化尤为如此。网络语言的更新速度相当快,很多昨天看着很时尚的网语,几天之后可能就是明日黄花了。从这个角度看,网络语言只能是伴随互联网产生的附属物,适用范围也有很大局限性,在传承性上也较为单薄。因此,网络语言只能称之为语言现象,还不能独立称之为一种语言文化。对中国而言网络的普及几乎是与经济发展大潮同步的,上世纪九十年代后,中国的经济发展迅速,这带动了整个社会形态偏向于一种快节奏,快思维的模式,这也波及到变化相对缓慢的文化

语言规范与语言变异相辅相成

语言规范与语言变异相辅相成 语言的规范和语言的变异之间有什么关系呢?我们说,语言是在规范中变异,在变异中规范。语言的规范和变异都是推动语言发展的力量。 我们知道,语言的发展是一个约定俗成的过程。在语言的发展过程中,“三人成龙”的现象尤为普遍:原来不规范的语言,使用的人多了,就成为规范。原来规范的语言,用得少了就会变成不规范。 今年出版的《现代汉语词典》第5版增收了6000余条新词,在增收新词新义的同时,删去了2000余条因陈旧而较少使用的词语和意义,如“二百二(红药水)、假象牙(赛璐珞)”等。 在拿就拿网络语言为例。网络突飞猛进的发展,无疑对年轻人的“语言创造力”起了推波助澜的作用,谁偶然间或无意间用了一个自己都莫名其妙的词,第二天可能就成了流行语。《文艺争鸣》杂志社编审、《汉语的危机》一书编者朱竞认为,网络语言如果用在文章里,形成书面语言,是对汉语的一种不尊重,应该对网络语言的使用进行规范。教育部相关官员也反对高考用“网语”。但是,与此同时,语言文字专家季恒铨2004年3月17日在汉参加“现代汉语规范化论坛”时表示,经过时间检验的、有生命力的网络词汇也应收入规范词典。季恒铨解释说,在编纂《现代汉语规范词典》时,北京曾流行过新词“商标西瓜”———贴着商标的西瓜,后来又发现有“商标苹果”、“商标橘子”,但过一段时间后,人们说那些带有商标的水果时不再特意加上“商标”了。这就意味着“商标西瓜”一词已被淘汰。如果过几年后,网民们不再称网上的女孩为“美眉”,就说明“美眉”这个词语被淘汰了,就不会作为“规范”进入词典了。 但是,目前社会上一些人为求“创新”,生搬硬套成语为其所用,例如卖布的商家树招牌“布言布语”,这就不符合人们的审美规律,和社会文化的发展趋势,就不可能成为规范语言。这是语言规范与变异促进语言发展的一个很明显的例子,由此可以说明两者关系的密不可分。我们谈到语言的规范,不能不谈到语言的变异,语言的规范是在语言变异的基础上进行的。我们谈到语言变异的时候,也不能够离开语言规范,语言的变异不是漫无目的毫无规则的,只有经过规范的符合人类社会历史发展规律的变异语言,才能够真正起到推动语言发展的作用。 语言随着时代的发展、社会的进步而不断发展,比如随着新事物的出现会出现新的词语,甚至出现新的句法,但发展的语言必须规范,不经规范的语言,必将造成语言的混乱,必将影响意义的传达;同时,也不能借口语言的规范而因循守旧,拒绝新的词语、新的句法,阻滞语言的发展。不规范的语言是混乱的,不发展的语言是僵化的。 总之,语言要在规范中发展,在发展中规范。 1、饭店门口:“抄”饭 2、修车店门口:补胎“冲”气 3、零售店铺门口:“另”售

人工神经网络复习题

《神经网络原理》 一、填空题 1、从系统的观点讲,人工神经元网络是由大量神经元通过极其丰富和完善的连接而构成的自适应、非线性、动力学系统。 2、神经网络的基本特性有拓扑性、学习性和稳定收敛性。 3、神经网络按结构可分为前馈网络和反馈网络,按性能可分为离散型和连续型,按学习方式可分为有导师和无导师。 4、神经网络研究的发展大致经过了四个阶段。 5、网络稳定性指从t=0时刻初态开始,到t时刻后v(t+△t)=v(t),(t>0),称网络稳定。 6、联想的形式有两种,它们分是自联想和异联想。 7、存储容量指网络稳定点的个数,提高存储容量的途径一是改进网络的拓扑结构,二是改进学习方法。 8、非稳定吸引子有两种状态,一是有限环状态,二是混沌状态。 9、神经元分兴奋性神经元和抑制性神经元。 10、汉明距离指两个向量中对应元素不同的个数。 二、简答题 1、人工神经元网络的特点? 答:(1)、信息分布存储和容错性。 (2)、大规模并行协同处理。 (3)、自学习、自组织和自适应。 (4)、人工神经元网络是大量的神经元的集体行为,表现为复杂

的非线性动力学特性。 (5)人式神经元网络具有不适合高精度计算、学习算法和网络设计没有统一标准等局限性。 2、单个神经元的动作特征有哪些? 答:单个神经元的动作特征有:(1)、空间相加性;(2)、时间相加性;(3)、阈值作用;(4)、不应期;(5)、可塑性;(6)疲劳。 3、怎样描述动力学系统? 答:对于离散时间系统,用一组一阶差分方程来描述: X(t+1)=F[X(t)]; 对于连续时间系统,用一阶微分方程来描述: dU(t)/dt=F[U(t)]。 4、F(x)与x 的关系如下图,试述它们分别有几个平衡状态,是否为稳定的平衡状态? 答:在图(1)中,有两个平衡状态a 、b ,其中,在a 点曲线斜率|F ’(X)|>1,为非稳定平稳状态;在b 点曲线斜率|F ’(X)|<1,为稳定平稳状态。 在图(2)中,有一个平稳状态a ,且在该点曲线斜率|F ’(X)|>1,为非稳定平稳状态。

网络语言的发展及演变

网络语言的发展及演变着名诗人北岛写过世界上最短的一首诗,诗名是《生活》,内容只有一个字:网。无论你是否承认,这首诗完全概括了你现在的生活状态,无处不处于一张张硕大的网中。而“网络”这一张无形的大网正以它无法抗拒的力量和速度覆盖了我们的生活。越来越多的人不可避免地处于网络文化的新时代中,人类交流的工具——语言,也正随着这种趋势而步入一个新颖另类的时空。在网上,每一个冲浪者的语言行为和能力,都在潜移默化地改变。为了更好地运用网络语言,驾驭网络,人们展开了一场场研究和讨论。目前,针对网络语言的研究比比皆是,形式各异的论着铺天盖地地向我们涌来。而今天,这种潮流的推动下,笔者也展开了一系列的调查和研究,对网络语言的特征、演变和发展前景等方面进行探索,力求找出答案,为大家的网络生活开拓一片明朗。 一、什么是网络语言 首先,我们必须知道什么是语言。语言是符号系统,是以语音为物质外壳,以语义为意义内容的,音义结合的词汇建筑材料和语法组织规律的体系。语言是一种社会现象,是人类最重要的交际工具,是进行思维和传递信息的工具,是人类保存认识成果的载体。 那么网络语言又是什么呢它和传统的语言又有什么不同呢 你只要在百度搜索上输入“网络语言”,在你面前出现的词条将不下一百种,比较严谨全面的解释还是不多,下面这条则具有一定的代表性:网络语言是伴随着网络的发展而新兴的一种有别于传统平面媒介的语言形式。它以简洁生动的形式出现在人们眼前,一诞生就得到了广大网友的偏爱,并在年轻群

体的推动下,神速发展。 二、网络语言的特征 前面我们对什么是网络语言稍微做了了解,那么网络语言的现状又是什么样的呢要研究这个问题,必须从表象和实质两方面入手。首先,我们小组对网络语言做了一番调查和总结,觉得网络语言可以分成下面几大类。 1、数字型:一般利用谐音来达到转化目的。 2、翻译型:其实这在语言学上很常见,就是外来语,一般也是根据原文的发音,找合适的汉字代替。 3、字母型:造词方法仍是谐音,以单纯字母的发音代替原有的汉字。 4、符号型:多以简单符号表示某种特定表情或文字,以表情居多。 (一)词汇特征 1.出现大量的谐音词:网络语言中的一个重要特点是数字发挥着重要的作用。由于易于输入和谐音的关系,一些数字的组合被赋予了特殊的意义。另一方面,网络交际过程中为了加快交流的速度,在用汉语拼音输入法进行汉字输入时,一般不进行选择,而是在当前输入法默认的情况下就按了回车键,于是导致了一些有趣的谐音怪词的诞生,在网络这个特定的环境中被赋予了新的生命力而广泛流传开来。 1)英语谐音:用同音字母代表一个单词或字母组合乃至句子。, 2)汉语谐音 3)数字谐音: 4)“网虫”们随机使用的但已被圈内公认的各种缩略词。这些缩略语的来源主要是公认的缩写词汇,电传、传真英语的缩略符号或用数字代替字母缩合

网络语言论文关于现代汉语的论文:网络语言与现代汉语规范化

网络语言论文关于现代汉语的论文: 网络语言与现代汉语规范化 摘要:网络语言特征鲜明:广泛运用数字符号、缩略语,通俗简明,等义词现象普遍。网络语言对现代汉语规范化的负面影响日趋明显,乱造、滥用汉字,滥用外来词、字母词、数字词、方言词,随意遣词造句,以及表现出的色情、暴力倾向等,有碍现代汉语的健康、规范化发展。因此,我们应积极采取措施,对网络语言加以引导和规范,倡导正确的语言观,提高规范意识,加强学校语文素质教育。 关键词:网络语言现代汉语规范化发展 网络语言是指人们在互联网交流中所使用的语言形式。随着计算机及网络技术在我国的日益普及,网络语言开始融入现代汉语,成为汉语普通话的有机组成部分。一方面,网络语言丰富了现代汉语词汇,增强了现代汉语的表现力,给人新奇的感觉;另一方面,网络语言对现代汉语规范化的负面影响日益突显,在网络交流中,“词不达意”、“言者无心,听者有意”的情景时常发生。当前,对网络、网络语言的研究渐成学术界的热点,本文拟对网络语言及其对现代汉语规范化的负面影响进行分析,并力图找出一些规范网络语言的途径、方法,以促进现代汉语在网络普及的背景下朝着规范、健康的方向发展。 一、网络语言的特征 网络语言是以传播媒介网络来命名的,正如其他语言样式并不仅仅决定于呈现方式一样,其特征不仅体现于独特的载体,更决定于它独特的语言特点。网络平台赋予的虚拟即时交流性、开放性、自由性,决定了网络语言不同于其他领域使用的语言。网上交流具有快捷性、视觉性强、时效性强的特色,与此相适应的网络语言在文字、词汇、语法方面就形成了既不同于口语,也不同于书面语的特点。 1.符号数字化。在网络交流中,人们常常使用一些“面部表情”来表达自己的喜怒哀乐。这些“面部表情”是一个个常用字符组成的画,看似一张脸。这是一套眉目传情的文化,而且国际通用。如:—D(表示非常高兴地张嘴大笑)、:C(表示生气)、@:—)(表示一头卷发)、o—o(表示戴眼镜)等。这些符号组成的脸谱,有的含义在一种以上,有的含义还截然相反,这正是比汉字更形象生动、简约丰富的网络符号语言的魅力。 数字网络语在聊天室以及OICQ中最常见,以简洁的数字来表示发言者的思想感情。如:555(呜呜呜,表示哭)、9494(就是就是)、526886(我饿了拜拜了)等。这些数字谐音语言让初涉网络者很难弄清其所代表的真正含义。还有些数字网络语特别另类,如:—7(夫妻)、286(反应迟钝的人或落后被淘汰的事物)等。 2.广泛运用缩略语。网友们为了加快交流速度,往往把一些常用的、较为固定的语言单位,取其汉语拼音词语的首个字母合成缩略代码,如:GG(哥哥)、JJ(姐姐)、MM(美眉,即漂亮妹妹)、GXGX(恭喜恭喜)等。 在网络交流中,网友们使用英语字母的缩略语也广泛存在,如:LOL(放声大笑,Langhing out loud)、HTH(希望能帮上忙,hope that helps)、TIA(先谢了,thanks in advance)、FTF(面对面,face to face)等。这些词最明显的特点是英语单词首字母构成的常规缩写,其中,有的是名词词组的缩写,具有名词的语法功能,如DOS、BF;有的是动词性词组的缩写,可作谓语,如DIY。 3.通俗简明化。网友们为了节约时间或求新求异,常常在交流时创造一些通俗而言简意赅的新词新语,如:把E-mail叫做“伊妹儿”,把Java戏称为“娇娃”,把Cookie称为“甜饼”,把丑女称为“恐龙”。网络酷爱者被称为“网虫”,初涉网络者被称为“爬虫”,网络高手被称为“大虫”,男性网民被称为“网蜂”,女性网民被称为“网蝶”。这些通俗简明的网络称谓是网络语言

浅谈网络语言及其规范化

前言 语言是什么?在语言学家眼里,是人类最重要的交际工具;让哲学家论述,是客观外部事物反映于人类思维及表达的手段;在作家心中,是心灵挣扎的外衣;让科学家描述,是社会最基本的信息载体。不管以什么角度理解,人类之所以需要语言,最主要的目的就是为了交流与沟通。 近年来,网络在我国迅猛发展,网络已成为人们特别是青少年学习、交流、休闲、娱乐的重要平台,它增强了青少年与外界交流和沟通,有利于创造出全新的生活方式和社会互动关系。随着网络交流的普及,网络语言也如雨后春笋般的出现,一些新兴的网络语言正逐步影响着人们的生活。 网络语言是指网民们在使用网络的过程中,新创并广泛使用的语言。这些词语一方面因为使用者的广泛而成为一个值得关注的语言现象;另一方面,由于词语是语言的基本要素,是文化的基本构成,研究网络语言有助于我们了解网络文化,倡导网络文明。 一、网络语言的产生及发展 1.1网络语言的产生及其定义 随着社会的经济的不断增长,互联网的发展更加迅速,网络媒体如雨后春笋般崛起,网络语言就成了网络时代的必然产物。那究竟什么是网络语言呢?网络语言是伴随着网络的发展而新兴的一种有别于传统平面媒介的语言形式,就是指在网络上产生并且具有特殊含义被广泛使用的词语。大部分网络语言是“结合了汉语、英语、汉语拼音、阿拉伯数字、日语等多种语言形式,运用缩略、谐音、合音、符号等各种表达方式”。 网络语言大体上分成以下三类:一是和网络有关的专业术

语,如鼠标、硬件、软件、病毒、防火墙等;二是与网络有关的特别用语,如网民、网吧、黑客、信息高速公路等;第三类是网民在聊天或是bbs上的常用词语也就是口头语,狭义的网络语言就仅指第三类网络词语。 1.2网络语言存在和发展的原因 任何一种新生事物的出现,不管人们对它是褒是贬,总是以承认它的存在为前提,网络语言在人们激烈的争论中凭借其生动的表达内容,新颖的表达方式而迅猛发展,应该说有其深刻的主客观原因。 1.网络语言的自身优势:网络语言有描形摹状,惟妙惟肖,言简意赅,快捷便利,扬长避短,栩栩如生等特点。 2.网络语言满足现代人的心理需求。网络的最大诱惑在于它是一个虚拟的空间,允许人们自由地说话,这是一种伟大的力量,更符合现代人面对巨大的现实压力,急于寻找避风港的心态,以某种隐匿的身份加入一个BBS或聊天室,再取一个标新立异的网名猫起来和对方神聊,让心情放松,将本性放纵,少了伪装,多了轻松。你不得不承认,这是现代人缓解压力,进行能量释放的绝好方式。它的存在,是因为符合了现代人自由至上的审美标准…每个人都有发表意见的权利,每个人都是传播者,每个人都是受众.都可以在这个自由王国里享受言论自由的舒畅。和其他时尚、流行的事物一样,年轻人对网络可以说是趋之若鹜。网民中青少年占的比例最高,所以它的使用者多为青少年,他们的接受能力和创新能力较强,网络语言在他们的推波助澜下势必愈演愈烈。 二、网络语言的特点 网络语言除了语言所具有的一般特征外,还具有许多其它特点,具体表现在以下四个方面: 2.1.缩略简约

网络计划技术习题

一、选择题 1.某工作最早完成时间与其紧后工作的最早开始时间之差,称为()。 a、总时差 b、自由时差 c、干涉时差 d、时间间隔 2.双代号网络图中用()表示出工作之间的联结关系。 a、虚工作 b、编号 c、箭头 d、节点 4.在单代号搭接网络间断型工作最早开始时间的计算,应考虑的基本搭接关系有() a、FTS b、FTF c、STS d、STF 5.在双代号网络计划中,某节点j的最早时间为7d,以其为终节点的工作i-j的总时差为TF i-j=8d,自由时差FF i-j=3d,则该节点的最迟开始时间为()。 a、10 b、11 c 、12 d、13 6.如果双代号时标网络图中某条线路自始至终不出现波形线,则该条线路上所有工作( ) a、最早开始时间等于最早完成时间 b、总时差为零 c、最迟开始时间等于最迟完成时间 d、持续时间相等 7.双代号时标网络图中箭线末端(箭头)对应的时标值为( )。 a、该工作的最早完成时间 b、该工作的最迟完成时间 c、紧后工作最早开始时间 d、紧后工作最迟开始时间 8.网络计划中工作之间的先后关系叫做逻辑关系,它包括( )。 a、工艺关系 b、组织关系 c、技术关系 d、控制关系 9.某工程双代号时标网络图如下图所示,正确的答案有()。

a、工作F最早结束时间为第7天 b、工作D总时差为1天 c、E工作的自由时差为2天 d、工作G最迟开始时间为第6天 10. 已知某单代号网络计划如下图所示,其关键线路为()。 a、1-2-4 -5-9 b、1-2-5-9 c、1-3-4 -5-9 d、1-3-4-7-9 11.某双代号网络计划中工作K的时间参数如表中所示,正确的是()组。

网络语言之语法变异现象

网络语言之语法变异现象 王洁 (北京化工大学北方学院,河北三河065201)[摘要] 网络语言是人们进行网络交流的工具。由于它使用场合的特殊性,使得这种语言形式与传统语言有所不同。与现实中的自然语言相比,网络语言的一个标志性特征就是语法的变异性,这种变异性有诸多表现形式。它们在使用上更加灵活,具有不受传统语法制约的随意性特征,并得到网民们的普遍认同,成为网络语法规则。 [关键词] 网络语言;语法变异;表现形式 网络语言在语法上常常冒传统语言学天下之大不韪。由于它是虚拟世界的语言,特殊的交际环境造成其语法变异现象屡见不鲜。网络语言的语法变异是指在网络语言中出现了新的语法现象或存在对传统语法规则偏离的语言现象。网民们出于对网络交际语言新奇性的追求和提高交际速度的考虑,常常打破一般语法规则的限制,创造出一些新的语法表现形式。 一、词类转换 语言学中有转类一说,即一个词从某种词类转入另一种词类的现象。由于汉语是词根语,缺少标志性转变的形态成分,一般不能够通过添加或改变词尾的办法来实现词性的转变,所以它常常采用通过搭配关系来实现这一转变。有时可以根据表达的需要,凭借上下文的条件而临时转变词性,这也被视为词类“活用”现象。在古代汉语发展史上,名词、动词、形容词、副词之间的活用、兼用现象非常普遍。例如“花、草、木、麻、毛、方、圆、尖、素、神、精、土、洋”等,最初都是名词,后来才转变为名、形兼类词。[1]在网络用语

中这样的词性转换现象比比皆是。 (一)名词用作动词 1.雷 2008年至今广泛流行于网络中的一个词就是“雷”。在这之前,人们看到“雷”,可能联想到的只是电闪雷鸣这类自然现象。但在过去的两年时间里,这个原本普通的词语,却在网络这个“大熔炉”中被赋予了新的意义,并且至今仍旧红透网络半边天。在网络上随便搜索一下,就可以发现很多动词用法的“雷”。既有带宾语,又有带补语,甚至还有“v+v”,“v一下”的格式,例如: (1)百花奖上的袁立把我雷.死了![2] (2)我来雷.一下大家。[3] (3)雷.出亚洲,囧向世界。[4] (4)囧囧更有神,雷雷 ..更健康。[5] 上例中的“雷”,例(1)是带补语,例(3)是带宾语,而例(2)是“v一下”的格式,例(4)是“v+v”格式,这些都说明“雷”在这里已然是一个典型的动词了。结合具体语境,我们不难得知“雷”有“震撼、打击、惊吓”的意思,说某人被“雷”,显然是指某人受到始料未及的外界刺激,继而产生强烈的震撼感:震惊、无奈、痛苦甚至崩溃。说得形象些,这种震撼带给人的感受有如“五雷轰顶”一般,面色焦黑,脑中轰然,全身麻木。随着“雷人”一词的风靡,它已从网上走到了网下。例如在2009年中央电视台元宵晚会上主持人就有“雷人不雷人”这样的台词。 2.N1+N2(pron)格式 这类拥有动词功能的名词通常是“V+ N1+给+N2(pron)”格式中动作的宾语,在网络中通常用“N1+N2(pron)”格式,例如: (1)有事电我——有事给我打电话 (2)别忘了E(伊妹儿)我——别忘记给我发电子邮件

网络词语的特点和成因探析

网络词语的特点和成因探析 网络是无国界的,中外文化可以打破时空在这里碰撞交流,各种语言都可以在这里接触,网络词汇可以说就是这种大碰撞大接触的产物,因此一产生就以其独特性展示在世人面前。由于网络环境的自由性,因此网络词语创造者的想象力、创造力、个性张力都在最大程度上得到了体现。从上面网络词语的构成分析我们可以发现其特点: 第一,构成材料的多样性。网络词语的构成材料,除了传统的汉字,还有英文字母、汉语拼音字母、标点符号、键盘符号甚至图片,开创了语言表达的新天地,只要能体现我的意图、思想,网民们就把这些材料顺手拈来,为我所用,所以网络词语的构造多语码夹杂现象十分突出。这些材料经创造者标新立异地自由发挥、随意组合拼接镶嵌,就构成了丰富多样的网络词语。例如“:-×”由标点符号、数学符号、键盘符号构成,其中数学符号×表示口部贴了封条,引申为表示“抱歉,这是秘密”的意思。 第二,构成形式的创新性。由于网络词语材料使用的多样性,因此我们可以直观地感受到网络词语形式和现实语言词汇的差别,例如“f2f”(面对面)、“BT”(变态)、“88”(再见)、“:-D”(哈哈大笑)。网络词语的内部结构关系已经超越了现实语言,创造者根本就没有去想有关语言规则、规范问题。网民们要的是创造、宣泄,是自我价值的实现,因此出语总是精心设计,巧妙构思,突破了常规语文,常常是夸张见义,“语不惊人死不休”。虽然有些词语的构成令人瞠目结舌,但是很多网络词语充满了活力,体现了创造者的睿智,使得你领悟后产生一种妙不可言的感觉,不能不佩服其想象力的大胆、惊人与丰富。 第三,意义表达的形象性。网络词语的一大特点是追求生动、新奇,以引人注目,因此网民在创造网络词语时特别注意词语表达意义的形象性。一方面,通过比喻的方式给旧词增添新义,如不同级别的网民,就有“网虫、爬虫、小虫、大虫、飞虫”之分,又如用“菌男、霉女”指称丑男丑女,具有强烈的反讽效果;另一方面,通过谐音方式以另一具有形象色彩的事物指称相关事物,例如用“猫”代指调制解调器,用“板猪”指代论坛版主,以“赛羊”指代赛扬(一种CPU品牌),以“温酒吧”指代windows98;再一方面,直接以键盘符号组合创造表情语,生动形象地表示发话人的体态、表情、态度、动作。 第四,追求结构的简洁性。由于上网是按时计费的,为节省费用,同时也为满足即时交互的需求,在最短的时间内发送最多的信息,因此网民在交际过程中尽量使用简短的词形,很少长句、复句,不但把词组省改节缩成词的形式,甚至把句子也省改节缩成词的形式,例如英文hand原义是手,但是网络词语表示have a nice day。网络语言中的“数字化”词语大行其道,与其说是一种创新,不如说是为了节约时间,使得信息交换更加快捷简便,比如用5203344587表示“我爱你生生世世不变心”,比起输入汉字,速度要快得多。 网络词语既是社会发展变化促进语言变化的自然反映,也与网络环境的特殊性有着密切的关系,语言的任何发展变化,都是与其环境分不开的。和社会现实环境相比较,网络交际环境有着特殊性。 第一,交际时间的紧迫性。网络交际是要付出代价的:登录网络按时计费,时间非常紧迫。为了节省费用,求得高效率,在最短的时间传递最大的信息,于是网民就采用了种种超乎常规语言的手段,例如“687”表示对不起,“TY”表示thank you(谢谢你)。这些语言现象,已是司空见惯,十分正常,谁也不以为怪。因

网络语言变异现象与现代汉语语言规范

第3卷 第3期中 南 林 业 科 技 大 学 学 报 (社 会 科 学 版)V o l .3 N o .3 2009年05月 JOU RNAL O F CEN TRAL SOU TH UN I V ERS ITY O F FORESTRY &TECHNOLO GY (Social Sciences ) M ay 2009  网络语言变异现象与现代汉语语言规范 Ξ 李素琼,杨燕群 (湘潭大学外国语学院,湖南湘潭411105) [摘 要] 网络语言是随着网络信息社会的出现而产生的,是一种特殊的言语现象。网络语言中充满了许多反映社会现实生活的新词新语,它们是汉语不断丰富、不断发展的体现。但新生物的产生不可避免地会带来一些问题,因此,有必要遵循一定的语言使用原则来规范汉语语言文字。 [关键词] 网络语言;语言变异;语言文字规范 [中图分类号] H 002 [文献标识码] A [文章编号] 1673-9272(2009)03-0094-03 The Var i a tion of Network Language and the Standard iza tion of M odern Ch i nese Language L I Su 2qi ong ,YAN G Yan 2qun (Faculty of Fo reign L anguages ,X iangtan U niversity ,X iangtan 411105,H unan ,Ch ina ) Abstract :T he netwo rk language ,a particular language phenom enon ,is p roduced w ith the em ergence of the info rm ati on 2 based society of netwo rk .T here are lo ts of new wo rds and exp ressi ons in netwo rk language ,w h ich reflects the developm ent and enrichm ent of Ch inese language .But it w ill inevitably bring about som e p roblem s .T herefo re,it’s necessary to standardize modern Ch inese acco rding to som e p rinci p les of language use . Key words :netwo rk language ;language variati on ;language standardizati on 自20世纪90年代初诞生以来,互联网以不可阻挡的加速度进入人们的生活,促使一种别具特色的语言逐渐在网络空间中形成,并被越来越多的网民所接受和使用,这就是网络语言。网络语言有广义、狭义之分,广义的网络语言主要指与网络有关的专业术语或特别用语,如鼠标、硬件等,以及网民们网上交流用语。狭义的网络语言是指网民们在网络交流中所使用的语言[1]。本文所讨论的主要是后者,即以中文为主体,以汉语拼音、英文、符号、数字等为辅助手段,在互联网上进行交际时所使用的语言形式。网络语言是一种社会方言,是社会的发展造成社会内部进一步分层,而同一阶层的人群在语言交际上具有某一社团特 征。[2]社会方言研究是当前社会语言学研究的热点之 一, [3] 同以往的研究相比,近期的变异理论不再局限 于对变异现象的描写和归类,提出了变异的规范问 题,如“语言变异与规范”[4] 等,本文将通过对网络语 言变异现象的分析,对现代汉语语言文字的规范进行初步的探讨。 一、网络语言变异现象 同一种语言,由于语言使用场合、交际对象以及情景不同而引起语言形式和结构上的变化,这种具备同一社会特征的人在相同的社会环境中使用的同一 语言所发生的语言变化现象称之为语言变异。[5] 也可 称为社会方言,即不同年龄、不同性别、不同职业、不 同阶级等人群在社会中使用的语言变体。[6]变异是普 遍存在的一种社会现象。网络语言就是在人类交流方式发生变化的条件下产生的一种非主流的语言变异现象,是一种社会方言。网络语言的变异主要是通过语音变异和词汇变异来实现的。 1.语音变异 网络交流(不包括语音聊天等形式)是无声的,但网络语言同样具有语音特征。它的语音特征跟我们日常语言交际的语音特征是不相同的,网络语言的语音特征主要是通过以下三种方式表现出来的。 (1)谐音修辞手法变异 谐音是音同、音近的现象。网络语言中有许多谐 4 9Ξ [收稿日期]2009202215 [作者简介]李素琼(1966- ),女,湖南邵东人,湘潭大学外国语学院教授,研究方向:社会语言学。

第三章-网络计划技术试题及答案

第三章网络计划技术试题及答案 一、单项选择题 1. 双代号网络计划中(B A 起始节点 C 终止节点 )表示前面工作的结束和后面工作的开始。 中间节点 虚拟节点 n 条关键线路持续时间之和( 2. 网络图中游n 条关键线路,那么这 A 相同 B C 有一条最长的 3 .单代号网络计划的起点节点可( A 有一个虚拟 C 有多个 D 4?在时标网络计划中,“波折线”表示(C A 工作持续时间 C 前后工作时间间隔 5?时标网络计划与一般网络计划相比, A 能进行时间参数的计算 C 能计算时差 6. ( B )为零的工作肯定在关键线路上。 A 自由时差 B C 持续时间 D 7?在工程网络计划中,判别关键工作的条件是该工作 A 自由时差最小 B C 持续时间最长 D 8?当双代号网络计划的计算工期等于计划工期时, A 关键工作的自由时差为零 C 关键工作的持 续时间最长 9.网络计划工期优化的目的是为了缩短( A 计划工期 C 要求工期 D A )° B A )。 不相同 以 上都不对 有两个 编号最大 B D 其优点是( B 虚工作 总时差 D )° 能确定关键线路 能增加网络的直观性 总时差 以上三者均 D ) ° 与其紧后工作之间的时间间隔为零 最早开始时间等于最迟开始时间 对关键工作的错误提法是( C )° 相邻两项关键工作之间的时间间隔为零 关键工作的最早开始时间与最迟开始时间相等 )° 计算工期 合同工期 M 的完成节点为关键节点, 10.某工程双代号网络计划的计划工期等于计算工期,且工作 则该工作(B ) A 为关键工作 C 自由时差为零 、填空题 双代号网络图的基本三要素为: 在双代号网络图中,节点是表示 网络计划的优化有_工期优化、 在网络计划中工期一般有以下三种: 在双代号网络图中, 的逻辑关系。 、名词解释与简答 1.网络图 网络图是指由箭线和节点组成的,用来表示工作流程的有向、有序网状图形。 1. 2. 3. 4. 5. 自由时差等于总时差 自由时差小于总时差 工作、节点 工作之间的逻辑关系 。 .费用优化_和一资源优化_三种。 _计算工期、要求工期 和计划工期_。 和线路° 虚工作既不消耗资源、也不消耗时间,只表示前后相邻工作间

相关文档
相关文档 最新文档