文档库 最新最全的文档下载
当前位置:文档库 › SEEKER_基于关键词的关系数据库信息检索_文继军

SEEKER_基于关键词的关系数据库信息检索_文继军

SEEKER_基于关键词的关系数据库信息检索_文继军
SEEKER_基于关键词的关系数据库信息检索_文继军

V ol.16, No.7

?2005 Journal of Software 软 件 学 报 1000-9825/2005/16(07)1270 SEEKER :基于关键词的关系数据库信息检索

?

文继军+, 王 珊

(中国人民大学 信息学院,北京 100872)

SEEKER: Keyword-Based Information Retrieval over Relational Databases

WEN Ji-Jun +, WANG Shan

(Information School, Renmin University of China, Beijing 100872, China)

+ Corresponding author: Phn: +86-10-84909436, E-mail: wenjj@https://www.wendangku.net/doc/4f16846269.html,, https://www.wendangku.net/doc/4f16846269.html,

Received 2005-01-04; Accepted 2005-03-11

Wen JJ, Wang S. SEEKER: Keyword-Based information retrieval over relational databases. Journal of Software , 2005,16(7):1270?1281. DOI: 10.1360/jos161270

Abstract : Traditionally, SQL is the main interface to access data from relational databases. However, it is difficult for inexperienced end users to learn the complicated syntax of SQL. Enabling keyword-based information retrieval over relational databases will allow users to acquire information from databases without any knowledge of SQL and the underlying database schema, just like the way of common search engines. This paper describes the design and implementation of SEEKER, a system supporting keyword-based information retrieval over relational databases. While there have been some existing systems that support searching text attributes in relational databases, SEEKER can also search database metadata and numeric attributes. Moreover, SEEKER employs an improved ranking function and supports Top-k queries. Experimental results show that SEEKER can achieve good retrieval performance. Key words :

relational database; keyword query; information retrieval; Top-k query

摘 要: 传统上,SQL 是存取关系数据库中数据的主要界面.但是,对于没有经验的用户来说,学习复杂的SQL 语法是一件困难的事情.实现基于关键词的关系数据库信息检索,将使用户不需要任何SQL 语言和底层数据库模式的知识,用搜索引擎的方式来获取数据库中的相关数据.描述了一个基于关键词的关系数据库信息检索系统SEEKER 的设计和实现.现有的关系数据库关键词查询系统只能检索关系数据库中的文本属性,而SEEKER 还可以检索数据库元数据以及数字属性.并且,SEEKER 采用了更合理的排序公式,支持Top-k 查询.实验结果显示,SEEKER 具有良好的查询性能.

关键词: 关系数据库;关键词查询;信息检索;Top-k 查询 中图法分类号: TP311 文献标识码: A

? Supported by the National Natural Science Foundation of China under Grant Nos.60473069, 60496325 (国家自然科学基金); the

National High-Tech Research and Development Plan of China under Grant No.2003AA4Z3030 (国家高技术研究发展计划(863)); the Science and Technology Plan of Beijing of China under Grant No.H030130060011 (北京市科技计划)

作者简介: 文继军(1971-),男,四川西充人,博士生,主要研究领域为数据库,信息检索;王珊(1944-),女,教授,博士生导师,主要研究领域为数据库,知识工程.

文继军等:SEEKER:基于关键词的关系数据库信息检索1271

关系数据库是一种主要的信息存储机制.SQL语言是关系数据库的标准查询语言,对普通用户来说,SQL语言既难学习,又难使用.并且,用户在查询关系数据库中的数据时,必须知道这个数据库的数据模式.当关系数据库隐藏在网页后面或在P2P网络里共享时,用户很难获知它们的数据模式,因此无法用SQL语言进行查询.关键词查询是查询文档和网页的最简单、最流行的信息检索技术,关键词查询直观、易用,不需要学习查询语言,也不需要知道查询对象的底层结构.实现基于关键词的关系数据库信息检索,将使用户不需要任何SQL语言和数据库模式的知识,像使用Google那样通过提交关键词来获取数据库中的相关数据.

本文实现了一个基于关键词的关系数据库信息检索系统SEEKER,与现有的关系数据库关键词查询系统相比,SEEKER不仅可以检索关系数据库里的文本属性(CHAR,VARCHAR等),还可以检索数据库的元数据(关系名、属性名等)以及数字属性(DATE,TIME,INT,FLOAT,NUMERIC等);并且,SEEKER采用了更合理的评分公式对查询结果进行排序,将Top-k结果返回给用户.

本文第1节介绍与本文相关的工作;第2节概略描述SEEKER的基本方法;第3节详细介绍SEEKER的体系结构和算法;第4节用实验来评测SEEKER;第5节总结全文并概述未来的研究方向.

1 相关工作

文本文档和网页的关键词检索已经是成熟的研究领域.近年来,结构化和半结构化数据的关键词查询开始引起研究人员的兴趣.Oracle[1],DB2[2],SQL Server[3]等关系数据库都提供了文本搜索扩展,可以为数据库中的文本建立全文索引(倒排表索引),这为实现关系数据库的关键词查询提供了一个基础.已经有几个关系数据库关键词查询系统被开发出来:BANKS[4],DBXplorer[5],DISCOVER[6],IR-Style[7],EKSO[8]和ObjectRank[9].这些系统的基本思路是一致的,即将数据库看做是由数据库中的元组(顶点)通过主码-外码关系(边)连接而成的图.当用户给出一个关键词查询时,则通过全文索引从图中找出含全部关键词的最小子图作为查询结果.

数据库关键词查询系统可以分为在线查询和离线查询两大类.在线系统将关键词查询转换为SQL查询,通过实时查询数据库来生成查询结果.由于转换而成的SQL查询中有大量的连接操作,所以在线系统的查询速度较慢.在线系统提高查询速度的关键在于减少数据库,尤其是磁盘的访问次数.BANKS解决查询速度慢的方法是将整个数据库都放在内存中,显然这种方法只适用于中小数据库.当用户提交一个关键词查询时,DISCOVER 首先用Oracle的全文索引为每一个关系生成含不同关键词组合的元组集合,然后根据数据库模式图生成元组集合模式图,再从中找出包括全部关键词的子图(树),将子图转换为SQL查询,最后查询数据库得到查询结果.IR-Style对DISCOVER进行了改进,利用信息检索的文本相关排序策略对查询结果进行排序,将Top-k查询结果返回给用户.IR-Style提出了几种算法来提高查询效率,但效果并不理想.

离线系统通过预先计算生成中间结果,当用户提交关键词查询时,根据中间结果生成查询结果,因此,离线查询系统的响应时间较短.但是,由于离线系统需要一个预先计算过程,并且在数据库更新后必须重复这个“昂贵”的计算过程,所以离线系统仅适用于更新很少的数据库.EKSO和ObjectRank是典型的离线系统.

XML数据的关键词查询是对XML查询语言的一个有益扩充.Goldman等人[10]研究了存储在关系数据库中的XML数据的关键词查询.Florescu等人[11]对XML查询语言进行了扩展,实现了元素粒度的关键词查询.Xkeyword[12]将XML数据视作有向标记图,查询结果是XML片断连接成的树,树中包含全部关键词,根据树中边的数量多少进行排序.XRANK[13]用关键词查询XML文档,返回结果是元素形成的树,树中包含所有的关键词,并使用一个排序公式对查询结果进行排序.

现有的关系数据库关键词查询系统的不足之处主要有:(1) 不支持对数据库的元数据的关键词查询.数据库中的一些元数据,比如关系名和属性名,是可以用关键词来查询的.(2) 不支持对非文本属性的关键词查询.现有的系统很好地支持了文本属性的关键词查询,但是关系数据库中还存在着大量的非文本属性.例如,要从图5所示的DBLP数据库里查询Jim Gray在1990年后发表的关于Transaction的论文,用SQL语言表示这个查询: SELECT https://www.wendangku.net/doc/4f16846269.html,, p.Title, p.Year FROM AUTHOR a, PAPER p, WRITE w

a.AuthorId=w.AuthorId AND p.PaperId=w.PaperId AND

WHERE

https://www.wendangku.net/doc/4f16846269.html,=‘Jim Gray’ AND p.Title LIKE ‘%Transaction%’ AND p.Year>=1990

1272 Journal of Software软件学报2005,16(7)

现有的系统无法进行这种查询.(3) 做了一些不必要的限制.例如,现有的系统都要求查询结果包含所有的关键词,这样可以提高查询效率.但是,如果数据库里没有包含某个关键词,用户将得不到任何查询结果.包含部分关键词的查询结果可以帮助用户改进查询.本文的研究目标是构建一个能够有效解决上述问题的关系数据库关键词查询系统.

2 方法概述

2.1 问题定义

一个包含n个关系R1,…,R n的数据库DB,可以将它看成是一个有向图G,DB中的每一个关系就是G的一个顶点,每一个主码-外码关系就是G的一条有向边,方向由主码所在的关系R i∈G指向外码所在的关系R j∈G,记为e(R i,R j),将G称为模式图(schema graph),例如图5所示的DBLP数据库模式图.模式图中允许自环和多重边存在.实际上,有向边可以是两个关系间任意一种连接关系,在SEEKER中暂时只考虑主码-外码连接关系.一个关键词查询Q由一组关键词kw1,…,kw m组成,表示为Q(kw1,…,kw m).

定义1. 连接元组树TT是以数据库DB中的元组为结点的一棵树,树中任意两个相邻的元组t i∈R i,t j∈R j,它们之间的边e(t i,t j)=e(R i,R j)∈G且(t i>

定义2. 查询结果是含有至少一个Q中的关键词且每个叶结点都含有至少一个Q中的关键词的连接元组树.

定义2和BANKS[4],DISCOVER[6]以及IR-Style[7]的定义相类似,但SEEKER不要求查询结果包含全部关键词,只要求查询结果包含关键词的一个非空子集.

2.2 查询语言

SEEKER要实现对数据库的元数据和数字属性的关键词查询,必须对查询语言进行扩展.SEEKER的查询语言包含3类关键词:(1) Keyword;(2) Keyword:Keyword;(3) Keyword:?op?Value.第1类关键词用来查询文本属性.第2类关键词用来对文本属性进行包含元数据的查询,“:”前的Keyword用来匹配关系或属性,“:”后的关键词用来对匹配上的关系或属性进行关键词查询.例如,在关键词查询“Author:‘Jim Gray’”里,对“Jim Gray”的查询将被限制在和“Author”相匹配的关系或属性上.第2类关键词可以帮助用户更精确地表达查询要求.例如,查询“Knuth Algorithm”和“Author:Knuth Algorithm”会产生不同的查询结果,原因是Knuth既可能是作者名,也可能出现论文的标题中.采用第2类关键词将对Knuth的查询限制在Author关系上,有效地消除了这种模糊性.第3类关键词用于对数字属性的查询,“:”前的Keyword用来匹配属性,“?op?Value”部分对匹配上的属性进行条件查询.?op?是关系操作符,可以是=,>,<,≥或≤,Value是属性的值.第1节中的SQL查询可以用SEEKER的查询语言表示为“Jim Gray Transaction Year:>=1990”.第3类关键词将数据库中的数字属性纳入到关键词查询的范围内,使用户可以更精确地表达查询要求.

3 系统体系结构

SEEKER由以下几个模块组成(如图1所示):语法分析、IR引擎、候选评分表连接树集合的生成和Top-k 查询结果生成.本节将详细描述这几个模块,并用关键词查询“Author:‘Jim Gray’ Transaction Year:>=1990”作为实例来说明SEEKER的查询过程.

3.1 语法分析

如第2.2节所述,用户提交的查询是3类关键词的组合,这就需要对查询进行语法分析,将不同形式的关键词识别出来,分别存储,以便于IR引擎采用不同的方法进行处理.对第1类关键词,SEEKER的语法分析器将它们识别出来,放入一个数组中存储.SEEKER允许用户用双引号或单引号将多个单词合并为一个关键词,例如输入“Jim Gray”,SEEKER将把它作为一个单一的关键词来处理.对第2类的关键词,“:”前后的关键词被分别放入不同的数组中,关键词的识别方法与第1类关键词相同.对第3类关键词,Keyword,?op?和Value被分别识别出来,

文继军等:SEEKER:基于关键词的关系数据库信息检索1273

放入不同的数组中存储.对于Value,还要识别出它的数据类型,辅助Keyword匹配相关属性.如果有两个以上的第3类关键词,它们的Keyword相同,语法分析器将把它们合并为一个关键词.例如,对查询“Jim Gray Transaction year:>=1990year:<=2000”,语法分析器将“year:>=1990”和“year:<=2000”这两个关键词合并为一个单一的关键词.

查询实例在语法分析后得到3个关键词:第1类关键词“Transaction”;第2类关键词“Author,Jim Gray”;第3类关键词“Year,GE,1990,INT”,INT表示整数.

Fig.1 Architecture of SEEKER

图1 SEEKER体系结构图

3.2 IR引擎

SEEKER使用Oracle 9i的全文索引来对文本属性进行关键词查询.Oracle 9i不仅可以为关系中的单个属性建立全文索引,还可以为元组建立全文索引,采用的方法是将元组里每一个加入全文索引的分量用属性名进行标注,然后将这些分量串接起来,作为一个虚拟文档进行索引,关系中的所有虚拟文档作为文档集.这种索引同时支持元组级和属性级两种粒度的全文检索.

3.2.1 元数据的关键词查询

为了支持对元数据的关键词查询,在数据库中建立了两个匹配表(如图2所示),分别用于关系名和属性名的关键词匹配.这两个表上也建立了全文索引.关系匹配表的TableName列存储数据库中所有关系的名称,Keywords列给出描述关系的关键词,这两列都在全文索引中.属性匹配表的AttributeName列存储数据库中的所有属性的名称,TableName列存储属性所属关系的名称,Keywords列给出描述属性的关键词,Type列给出属性的类型,其中AttributeName列和Keywords列在全文索引中.用户在对元数据进行关键词查询的时候,可以猜测关系名或属性名,SEEKER将在关系名、属性名以及描述它们的关键词中进行匹配.SEEKER通过全文索引来进行关系和属性的匹配,采用的方法和对文本属性的关键词查询完全一样,匹配表中所有全文索引给出分数大于0的关系或属性都被认为是和关键词相匹配的.

对第2类关键词,关系的匹配优先于属性的匹配:如果只匹配上了某个属性,关键词查询只对该属性进行;如

1274

Journal of Software 软件学报 2005,16(7)

果只匹配上某个关系,查询该关系;如果同时匹配上了某个关系和该关系的属性,查询关系.对第3类关键词,只匹配属性,因为只有确定属性,才能对数字属性进行条件查询.对这类关键词,还需要用关键词里“value”的数据类型对匹配上的属性进行校核,只有当匹配上的属性的数据类型和“value”的数据类型兼容时,才可以确认该属性和关键词是匹配的.

Fig.2 Matching tables (DBLP database)

图2 匹配表(DBLP 数据库)

3.2.2 文本属性评分

文本属性的评分将由Oracle 的全文索引给出.Oracle 的评分算法采用了逆文档频率(inverse document frequency)算法[1].文档的分数与查询词在该文档中的出现频率成正比,而与文档集中的出现频率成反比.Oracle 给出的分数范围为[0,100]. 3.2.3 数字属性评分

为了保持和Oracle 的评分算法的一致性,SEEKER 采用了下面的公式[14]来给数字属性评分:

i j

l l j i j i n N

freq freq log max ,,,×=ω (1)

其中,ωi ,j 为关键词k i 在文档d j 中的权重,freq i ,j 为k i 在d j 中的词频,max l freq l ,j 是d j 中最高的词频,N 是文档的总数,n i 是文档集中出现k i 的文档数.

SEEKER 将整个数字属性作为文档集,属性中的每一个分量作为一个文档.这里,k i 是第3类关键词“Keyword:?op ? Value”,d j 是数字属性中的某个分量,N 是数字属性中的分量的数量,n i 是数字属性中满足条件“?op ? Value”的分量的数量.显然,max l freq l ,j =1;对于满足条件“?op ? Value”的d j ,freq i ,j =1;对于不满足条件“?op ?

Value”的d j ,freq i ,j =0.将ωi ,j 的值映射到区间[0,100]上,设定当n i =1,N =1 000 000时,ωi ,j =100.因此,式(1)变为

i

j i j i n N

freq log 61100,,×××=ω (2)

如果n i =0,则ωi ,j =0;如果n i =N,则ωi ,j =1;如果式(2)计算出的ωi ,j >100,则ωi ,j =100. 3.2.4 基本评分表和评分表

对于关键词查询Q (kw 1,…,kw m )中的每一个关键词kw j ,如果kw j 为第1类

关键词,IR 引擎为数据库中的每一个关系创建一个基本评分表;如果kw j 为第2类或第3类关键词,只为匹配上的关系或匹配上的属性的所在关系创建基本评分表.基本评分表有两列(如图3所示),第1列是Oracle 为每一个元组赋予的一个虚列:ROWID,ROWID 唯一标示一个元组,可以根据ROWID 直接存取一个元组;第2列SCORE 是IR 引擎根据元组和kw j 的相关性评出的分数(由Oracle 的全文索引或式(2)给出).IR 引擎为关系中每一个得分大于0的元组在基本评分表中插入一行,所有为空的基本评分表都将被丢弃.

IR 引擎对每个关系的基本评分表集合进行组合操作生成评分表集合,评分表和基本评分表的结构是一样的.设关系R 的基本评分表集合为BSTSet {BST (kw ′1),…,BST (kw ′p )|0≤p ≤m },其中BST (kw ′j )是关键词kw ′j 对应的R 的基本评分表.首先生成R 的关键词集合KWSet (kw ′1,…,kw ′p )的全部子集,子集的数量为2p ,然后为每个子集KWSet i (i =1,…,2p )生成一个评分表ST i ,该评分表的ROWID 列标示的R 中的元组含且只含KWSet i 里的全部关键

TableName Keywords AUTHOR PAPER WRITE CITE

writer, … thesis, … edit, … reference, …

TableName Keywords AUTHOR AUTHOR … PAPER …

id, …

editor, writer, …… date, … …

AttributeName Type AuthorId Name … Year …

INT VARCHAR … INT …

Relation matching table Attribute matching table

Fig.3 Basic score table 图3 基本评分表

ROWID SCORE Rowid 1 Rowid 2 …

Score 1 Score 2 …

文继军 等:SEEKER:基于关键词的关系数据库信息检索

1275

词,ST i 的SCORE 列的值为参与生成ST i 的所有基本评分表的SCORE 列的值的和.根据下面的公式由BSTSet 生成R 的评分表集合STSet :

?≠?

=

∈?∧∈i KWSet k KWSet k KWSet k i KWSet k BST k BST ST i

i

,

)()(I

U (3)

由定义2可知,R 中不含任意一个关键词的元组可以作为桥梁将含关键词的元组连接起来,这些元组的数量通常超过含关键词的元组的数量,因此,将它们在R 中的补集存入评分表中.

U KWSet

k i i KWSet k BST ST ∈?==

)

( (4)

显然,任意两个评分表之间没有交集,数据库中的任意一个元组只能存在一个评分表中.在最坏的情况下,一个关系的评分表数量为2m 个.但在一般情况下,关键词的数量并不会太大.当关系中不含某个关键词时,这个关键词对应的基本评分表为空,会被删除,不会用来产生评分表.并且,当评分表的元组数为空时,也会被删除.因此,评分表的数量通常不会太大.

查询实例经过IR 引擎后生成的基本评分表是:AUTHOR {“Jim Gray”},PAPER {“Transaction”},PAPER {“Year:>=1990”};生成的评分表是:AUTHOR {“Jim Gray”},AUTHOR {},PAPER {“Transaction”&&“Year:>=1990”},PAPER {“Transaction”},PAPER {“Year:>=1990”},PAPER {}, WRITE {},CITE {}.

3.3 候选评分表连接树集合的生成

在本模块,首先根据数据库模式图G 以及IR 引擎生成的评分表集合STSet 来创建评分表图G ST .评分表图G ST 是有向图,顶点是评分表.如果在数据库模式图G 中,关系R i 和R j 之间有一条边e (R i ,R j ),那么在R i 的任意一个评分表ST i ,p 和R j 的任意一个评分表ST j ,q 间添加一条边e (ST i ,p ,ST j ,q );如果i =j ,即在自环的情况下,不添加边e (ST i ,p ,ST j ,p ).因此,在评分表图G ST 中可能存在多重边,但没有自环.图4是查询实例生成的评分表图.

Fig.4 Score table graph of query example

图4 查询实例的评分表图

定义3. 候选评分表连接树是评分表图的一棵子树,它至少含一个Q 中的关键词且所有叶结点都至少含一个Q 中的关键词.候选评分表连接树CT 的大小是CT 中的评分表的数量,记为sizeof(CT ).

因为评分表图允许多重边和回路的存在,必须对候选评分表连接树的大小进行限制,否则将会产生过多的候选评分表连接树.SEEKER 用宽度优先搜索(BFS)算法来生成候选评分表连接树集合.

算法1. 候选评分表连接树集合CTSet 的生成算法(BFS 算法).

输入:评分表图G ST ,候选评分表连接树最大允许大小Max CTSize ,关键词查询Q (kw 1,…,kw m ). 输出:候选评分表连接树集合CTSet . V :队列,用来存储已经访问过的评分表. Q :队列,用来存储中间结果. Begin

1 for 评分表图G ST 中的每一个评分表ST i ,i =1,…,n do

2 将ST i 插入V 的队尾

{“Transaction”&&“Year:>=1990”}

{}

1276

Journal of Software 软件学报 2005,16(7)

3 将ST i 插入Q 的队尾

4 while Q 不为空do

5 从Q 的队头取出一个中间结果CT

6 if CTSet 中没有CT then

7 if CT 满足定义3 then 将CT 加入CTSet 中 8 if CT 的大小

10 for ST j 上的每一条边连接的邻居评分表AdjST k do /*存在多重边*/ 11 if CT 中没有AdjST k AND V 中没有AdjST k then

12 将CT 复制到CT ′,将AdjST k 连接到CT ′上,然后将CT ′插入Q 的队尾 End

算法1产生的候选评分表连接树集合CTSet 是一个有序数组,排序的规则是:含关键词数量多的候选评分表连接树排在前面;如果关键词数量相同,较小的候选评分表连接树排在前面.可以证明,算法1满足以下定理:

定理1(完全性和无重复性). 算法1生成的候选评分表连接树集合CTSet 里无重复地包含所有满足条件sizeof(CT )≤Max CTSize 的候选评分表连接树CT ∈G ST (证明略).

查询实例生成的候选评分表连接树有AUTHOR {“Jim Gray”}>=1990”}, PAPER {“Transaction”&&“Year:>=1990”},AUTHOR {“Jim Gray”}>

Top-k 查询结果生成模块的主要功能是将候选评分表连接树转换为SQL 查询,从数据库中查询出数据,将k 个得分最高的结果返回给用户. 3.4.1 评分公式(scoring function)

SEEKER 只将Top-k 查询结果返回给用户,因此需要给查询结果评分,然后根据分数高低来对查询结果排序.查询结果所含关键词的数量不尽相同,显然,含关键词越多,得分应该越高.SEEKER 采用了以下的评分公式:

∑∑==???????′?=)(sizeof 11

),()(sizeof 1),(TT i m

j j i a

kw T Score m m TT Q TT Score (5)

其中,TT 是构成查询结果的一个连接元组树;sizeof(TT )是TT 中所含元组的个数,它与该结果的得分成反比;T i 是TT 中的元组;Q 是一个关键词查询,m 是Q 中关键词的个数,kw j ∈Q ;m ′是TT 中所含关键词的数量;a 是常数,取大值(例如10)来保证含关键词多的查询结果比含关键词少的查询结果的得分高;Score (T i ,kw j )是元组T i 对于关键词kw j 所得的分数,∑=m

j j i kw T Score 1),(是元组T i 所在评分表的SCORE 列的值.

推论1(查询结果比较). 对关键词查询Q 产生的两个查询结果TT 1和TT 2,如果TT 1所含的关键词数量小于

TT 2所含的关键词数量,则Score (TT 1,Q )

DBXplore [5]和DISCOVER [6]采用了简单的评分策略:查询结果包含的元组越少越好.IR-Style [7]的评分公式不仅考虑了查询结果的大小,还考虑了查询结果和关键词查询的相关性,但由于要求查询结果包含全部关键词,因此没有考虑含部分关键词的查询结果的评分.BANKS [4]和ObjectRank [9]采用了类似PageRank 的评分方法,PageRank 对于网页排序是非常有效的,但对关系数据库中的元组排序的有效性还有待验证.

3.4.2 Top-k 查询结果生成算法

候选评分表连接树CT (ST 1,…,ST n )的最大可能分数是组成它的所有评分表的最大分数之和,即∑==n

i i score ST Q CT Score 1)}(max{),(Max π,π是投影关系运算.在查询过程中,假设当前的Top-k 查询结果中的第k 个

结果的分数为Score k ,如果Max Score (CT ,Q )≤Score k ,那么CT 可以安全地移除而不会对Top-k 查询结果有任何影响.为了提高连接操作的效率,应该尽可能地减少参与连接操作的元组数.对参与连接的某一个评分表ST j 来说,要产生比Score k 得分更高的查询结果,只有满足以下条件的行row 才有可能:>)(row score π?k Score

文继军 等:SEEKER:基于关键词的关系数据库信息检索

1277

∑≠=n

j

i i i score ST ,1)}(max{π.同理,对于两个相邻的评分表

ST p 和ST q ,它们的行row p 和row q 应该满足以下条件

∑≠=?

>+n q

p i i i score k q score p score ST Score row row ,,1)}(max{)()(πππ.这些条件都被加入SQL 查询中来以加快查询速度.查询

结果根据分数高低来排序.

算法2. Top-k 查询结果生成.

输入:有序的候选评分表连接树集合CTSet ,关键词查询Q (kw 1,…,kw m ). 输出:Top-k 查询结果.

Results [1,…,k ]:有序数组,用来存储查询结果,数组里的查询结果按分数高低来排序. Results [k ].kws :Results [k ]所含Q 中关键词的数量,查询结果数

1 for 候选评分表连接树集合CTSet 中的每一个候选评分表连接树CT i ,i =1,…,n do

2 if CT i 所含关键词数量

3 if CT i 所含关键词数量=Results [k ].kws AND CT i 的最大可能分数≤Results [k ].score then goto 1

4 将CT i 转换为SQL 查询

5 执行SQL 查询 /*查询结果按分数高低排序*/

6 while 查询结果不为空 do

7 取出查询结果TT

8 if Score (TT ,Q )>Results [k ].score then 将TT 插入Results 9 else goto 1 10 返回Results End

表1是SEEKER 给出的查询实例的Top-5结果.

Table 1 Top-5 results of query example

表1 查询实例的Top-5结果

No. Score AUTHOR WRITE

PAPER

2 8.3

3 Jim Gray…… The benchmark handbook for database and transaction systems (1st Edition). 1991… 3 8.33 Jim Gray…… The benchmark handbook for database and transaction systems (2nd Edition). 1993…

4 8.33 Jim Gray…… Database and transaction processing performance handbook. 1993…

5 8.33 Jim Gray…

….

Transaction processing: Concepts and techniques. 1993…

4 实 验

4.1 实验设置

SEEKER 是在Oracle 9i 上开发的,采用JAVA 语言编写,语法分析部分用JAVACC 编写,和Oracle 的接口是JDBC.我们用实验评测了SEEKER,评测是在DBLP [15]数据集上进行的.我们将DBLP 网站提供的XML 文件按照图5所示的模式分解成4个关系:AUTHOR 中有294 062个元组;PAPER 中有446 409个元组;WRITE 中有

1 000 099个元组;CITE 中有111 357个元组.AUTHOR 和PAPER 上建立了全文索引,所有的外码和数字属性上也都建立了索引.实验是在一台有512M 内存的Pentium IV 2.5 GHz 的微机上进行的,操作系统是Windows XP.

1278 Journal of Software 软件学报 2005,16(7)

Fig.5 The DBLP database schema graph

图5 DBLP 数据库模式图

4.2 查询效果

本节用查准率(precision)和查全率(recall)来衡量SEEKER 的查询效果,查准率和查全率的计算公式如下:

A R ecision Pr a = (6)

R

R call Re a

=

(7)

其中,|R a |是返回的查询结果集中与查询相关的连接元组树的数量;|A |是查询结果集中的连接元组树的数量;|R |是数据库中与查询相关的连接元组树的数量.

4.2.1 元数据对查询效果的影响

我们构造了一个包含10个SQL 查询的测试集,其中的SQL 语句都是查询某个作者发表的关于某个主题的论文.在实验中,我们用关键词查询来完成SQL 查询同样的任务,以测试集的查询结果作为基准来计算关键词查询的查准率和查全率,即将SQL 查询的结果作为|R |.表2和表3是根据测试集中的SQL 查询给出的两组关键词查询,表2用第1类关键词表述,表3用第1类和第2类关键词共同表述.

Table 2 Keyword queries without metadata Table 3 Keyword queries with metadata

表2 不考虑元数据的关键词查询 表3 考虑元数据的关键词查询

Knuth algorithm Dijkstra programming Author: Knuth algorithm Author: Dijkstra programming Turing article “Jim Gray”Article

Author: Turing article Author: “Jim Gray” article

Codd relational Salton “Information Retrieval” Author: Codd relational Author: Salton “Information Retrieval” Fagin proceeding “C. J. Date” database Author: Fagin proceeding Author: “C. J. Date” database Hartmanis NP

“Marvin Minsky” article

Author: Hartmanis NP

Author: “Marvin Minsky” article

分别执行测试集中的SQL 查询和两组关键词查询.图6给出了Top-k 取不同值时,两组关键词查询的平均查准率和平均查全率.从图中可以看出,实现对元数据的关键词查询,提高了查准率和查全率,尤其是在Top-k 较小的时候更加明显.因此,第2类关键词可以帮助用户更精确地表达查询要求,减少查询模糊性.

(a) Average precision (b) Average recall (a) 平均查准率 (b) 平均查全率

Fig.6 Metadata’s impact on query effectiveness

图6 元数据对查询效果的影响

4.2.2 数字属性对查询效果的影响

我们构造了一个包含10个SQL 查询的测试集,测试集中的SQL 语句都是查询某个作者在某段时间内发表的关于某个主题的论文,将SQL 查询的结果作为|R |.表4和表5是根据测试集中的SQL 查询给出的两组关键词查询,表4用第1类关键词表述,表5用第1类和第3类关键词共同表述.

5 10 1520253035 4045 50 Top-k A v e r a g e p r e c i s i o n (%)

5101520253035 40 45 50 Top-k

A v e r a g e r e c a l l (%)

文继军 等:SEEKER:基于关键词的关系数据库信息检索

1279

分别执行测试集中的SQL 查询和两组关键词查询.图7给出了Top-k 取不同值时,两组关键词查询的平均查准率和平均查全率.实验结果证明,采用第3类关键词可以提高查准率和查全率,尤其是在Top-k 较小的时候更为明显.第3类关键词增强了关键词查询的表达能力,将数据库中的数字属性纳入到关键词查询的范围内,帮助用户更精确地表达查询要求.

以上两个实验证明了SEEKER 对关键词查询语言的扩展是有效的.

Table 4 Keyword queries over Table 5 Keyword queries over text and numeric attributes

text attributes

表4 只考虑文本属性的关键词查询 表5 考虑文本和数字属性的关键词查询 Dewitt database Foster grid Dewitt database year:>1990 Foster grid year:=2003 Molina ‘peer-to-peer’ Stonebraker object Molina ‘peer-to-peer’ year:>=2002 Stonebraker object year:>1993 ‘Jennifer Widom’ database Year:>1995 ‘Jiawei Han’ ‘Data Mining’ ‘Jiawei Han’ ‘Data Mining’ Year:>=2000 Bernstein concurrency Bernstein concurrency year:>=1970 year:<=1985 Ullman database Ullman database year:>1980 Year:<2000 ‘Rakesh Agrawal’ ‘Data Mining’ ‘Rakesh Agrawal’ ‘Data Mining’ year:>=1997 ‘Juris Hartmanis’ complexity

‘Juris Hartmanis’ complexity year:>1990

(a) Average precision (b) Average recall (a) 平均查准率 (b) 平均查全率

Fig.7 Numeric attribute’s impact on query effectiveness

图7 数字属性对查询效果的影响

4.3 各参数对查询响应时间的影响

以下3个实验的目的是分析SEEKER 的几个主要参数对查询响应时间的影响,并比较查询过程中各模块耗费的时间.实验中所用关键词都是从DBLP 数据库中随机抽取出来的.

4.3.1 候选评分表连接树最大允许大小Max CTSiz e 对查询响应时间的影响

图8显示了候选评分表树最大允许大小对查询响应时间的影响,响应时间是500次查询的平均值,查询的关键词数量为2,Top-k 的k 值为10.从图中可以看出,随着Max CTSize 的增大,查询响应时间也随之增加,这主要是因为候选评分表树数量增大的缘故.我们注意到,当Max CTSize 分别为1和2,3和4,5和6时,响应时间几乎相同,原因是对DBLP 数据库,算法1生成的候选评分表连接树集合CTSet 几乎是相同的.

Fig.8 Effect of maximum allowed CT size Fig.9 Effect of Top-k 图8 候选评分表树最大允许大小的影响 图9 Top-k 的k 值的影响

5 10 15 20253035 4045 50 Top-k A v e r a g e p r e c i s i o n (%)

51015202530 35 40 45 50

Top-k

A v e r a g e r e c a l l (%)

1 2 3

4

5 6 Max CTSize

T i m e (m s )

1

5

10 15 20

Top-k

T i m e (m s )

1280

Journal of Software 软件学报 2005,16(7)

4.3.2 Top-k 的k 值对响应时间的影响

图9是Top-k 的k 值对查询响应时间的影响,响应时间是500次查询的平均值,查询的关键词数量为2,候选评分表树最大允许大小为4.k 值的增大使得查询时间随之增大,主要原因是用户要求的查询结果越多,算法2需要执行的SQL 查询也越多.

4.3.3 查询关键词数量对响应时间的影响

图10是关键词数量对查询响应时间的影响,响应时间是500次查询的平均值,候选评分表树最大允许大小为4,Top-k 的k 值为10.从图中可以看出,随着关键词数量的增加,响应时间迅速增加.关键词数量对响应时间的影响要更大一些,这是因为关键词数量的增加使得基本评分表和评分表的数量也随之增加,在最坏的情况下呈指数增长,使得候选评分表树数量迅速增加,造成查询时间的迅速增加.

Fig.10 Effect of number of keywords Fig.11 Time consumed by different query steps

图10 关键词数量的影响 图11 查询过程各阶段耗费时间比较

4.3.4 查询过程中各模块耗费时间的分析比较

图10和图11是同一个实验的结果.从图中可以看出,查询过程中最耗费时间的模块是Top-k 查询结果生成,其次是IR 引擎.这两个模块都包含对数据库的大量查询和操作,其他模块的工作主要在内存中进行,很少访问数据库,耗费的时间与之相比可以忽略不计.显然,要想进一步减少查询响应时间,应该在这两个模块上下功夫.

5 结论和未来工作

本文描述了一个基于关键词的关系数据库信息检索系统SEEKER 的设计和实现.SEEKER 不仅可以检索关系数据库里的文本属性,还可以检索数据库的元数据以及数字属性.SEEKER 虽然是在Oracle 9i 上实现的,但经过简单修改,就可以用于其他关系数据库.

我们计划在未来的工作中完成以下工作:提高算法效率,使系统能够更快地响应用户的查询;实现对数字属性的模糊查询,例如用“Jim Gray Transaction Year:1990”这样的查询来获取Jim Gray 在1990年左右发表的关于

Transaction 的论文,论文发表的年代越接近1990年,排名应该越靠前. References :

[1] Oracle text. 2004. https://www.wendangku.net/doc/4f16846269.html,/products/text/index.html

[2] DB2 text information extender. 2004. https://www.wendangku.net/doc/4f16846269.html,/software/data/db2/extenders/textinformation/index.html [3] SQL server full-text query. 2004. https://www.wendangku.net/doc/4f16846269.html,/library/default.asp?url=/library/en-us/architec/8_ar_sa2_0ehx.asp [4] Halotia G, Hulgeri A, Nakhey C, Chakrabarti S, Sudar-Shan S. Keyword searching and browsing in databases using BANKS. In:

Agrawal R, et al ., eds. Proc. of the 18th Int’l Conf. on Data Engineering. San Jose: IEEE Press, 2002. 431?440.

[5] Agrawal S, Chaudhuri S, Das G. DBXplorer: A system for keyword-based search over relational databases. In: Agrawal R, et al .,

eds. Proc. of the 18th Int’l Conf. on Data Engineering. San Jose: IEEE Press, 2002. 5?16.

[6] Hristidis V, Papakonstantinou Y. DISCOVER: Keyword search in relational databases. In: Bernstein PA, et al ., eds. Proc. of the

28th Int’l Conf. on Very Large Data Bases. Hong Kong: Morgan Kaufmann Publishers, 2002. 670?681.

[7] Hristidis V, Gravano L, Papakonstantinou Y. Efficient IR-style keyword search over relational databases. In: Freytag JC, et al ., eds.

Proc. of the 29th Int’l Conf. on Very Large Data Bases. Berlin: Morgan Kaufmann Publishers, 2003. 850?861.

Number of keywords

1 23 4 5

T i m e (m s )

Number of keywords

T i m e (m s )

文继军等:SEEKER:基于关键词的关系数据库信息检索1281

[8] Su Q, Widom J. Indexing relational database content offline for efficient keyword-based search. Technical Report, Stanford:

Stanford University, 2003. https://www.wendangku.net/doc/4f16846269.html,/pub/2003-13

[9] Balmin A, Hristidis V, Papakonstantinou Y. ObjectRank: Authority-Based keyword search in databases. In: Nascimento MA, et al.,

eds. Proc. of the 30th Int’l Conf. on Very Large Data Bases. Toronto: Morgan Kaufmann Publishers, 2004. 564?575.

[10] Goldman R, Shivakumar N, Venkatasubramanian S, Garcia-Molina H. Proximity search in databases. In: Gupta A, et al., eds. Proc.

of the 24th Int’l Conf. on Very Large Data Bases. New York: Morgan Kaufmann Publishers, 1998. 564?575.

[11] Florescu D, Kossmann D, Manolescu I. Integrating keyword search into XML query processing. In: Albert V, et al., eds. Proc. of

the 9th Int’l World Wide Web Conf. Amsterdam: ACM Press, 2000. 119?136.

[12] Hristidis V, Papakonstantinou Y, Balmin A. Keyword proximity search on XML graphs. In: Dayal U, et al., eds. Proc. of the 19th

Int’l Conf. on Data Engineering. Bangalore: IEEE Press, 2003. 367?378.

[13] Guo L, Shao F, Botev C, Shanmugasundaram J. XRANK: Ranked keyword search over XML documents. In: Halevy AY, et al., eds.

Proc. of the 2003 ACM SIGMOD Int’l Conf. on Management of Data. San Diego: ACM Press, 2003. 16?27.

[14] Baeza-Yates R, Riberio-Neto B. Modern Information Retrieval. New York: Addison-Wesley, 1999. 29.

[15] DBLP bibliography. 2004. https://www.wendangku.net/doc/4f16846269.html,rmatik.uni-trier.de/~ley/db/index.html

《软件学报》有关长文的征文通知

本刊长期征集长文,长文的长度至少在15页以上,侧重于鼓励科学工作者在结合国家需求,把握世界科学前沿的基础上,在重要研究领域或新学科生长点上开展深入、系统的创新性研究工作;鼓励有重大创新,有新观点和见解,可推动或丰富该领域的研究与发展。有关须知如下:

一、投稿、审查程序

1.长文的审稿人数比一般文章多出2人;

2.所有专家意见返回之后,编委会根据审稿专家意见,决定是否按长文发表;

3.若编委会确认按长文发表,作者必须根据编委会的综合修改意见,认真修改补充论文,必要时再送同行评议,经反复修改直至满足修改要求为止;

4.长文的最终定稿由编委会审定签发。

二、优惠条件

1.长文录用之后,将优先安排发表;

2.收取额定版面费,超出额定版面费用不再收取。

请在投稿时,在备注栏中注明:“长文投稿”字样。

导航系统及导航方法与设计方案

本技术适于导航领域,提供一种导航系统及导航方法,包括:导航硬件,用于将采集到得导航数据发送给MCU;MCU,用于将导航硬件发送的导航数据读取、并且暂存,当车载电 脑启动完毕时,将导航数据发送给车载电脑;车载电脑,用于接收MCU发送的导航数据,并且完成导航数据的导航应用。通过在导航系统中加入MCU,在系统上电后,MCU瞬间启动,且MCU读取和缓存导航数据,实现导航系统启动即读取导航数据。并且MCU连接的是车载电脑的CPU,将导航数据直接发送到操作系统的硬件抽象层,实现了读取导航数据不与操作系统内核空间打交道,仅从用户空间即可获取导航数据,扩展了应用。 技术要求 1.一种导航系统,其特征在于,包括: 导航硬件, 用于将采集到的导航数据发送给MCU; MCU,用于将导航硬件发送的导航数据读取、并且暂存,当车载电脑启动完毕时,将导航数据发送给车载电脑; 车载电脑,用于接收MCU发送的导航数据,并且完成导航数据的导航应用;MCU将导航数据传递给车载电脑操作系统的硬件抽象层,硬件抽象层将导航数据上报给框架层,框 架层将导航数据上报给应用层,在应用层完成导航数据的导航应用; 所述车载电脑安装的是Android操作系统; 所述导航硬件与所述MCU之间的数据通讯采用串行通信方式; 所述MCU与所述车载电脑的CPU之间数据通讯采用串行通信方式;

所述车载电脑的存储器采用的是阵列硬盘存储。 2.一种导航方法,其特征在于,该导航方法包括以下步骤: A、导航硬件采集导航数据,并且将采集到的导航数据发送给MCU; B、MCU读取导航数据、且暂存导航数据,并且MCU将导航硬件发送的导航数据发送给车载电脑操作系统的硬件抽象层; C、车载电脑操作系统的硬件抽象层将导航数据上报给车载电脑操作系统的框架层,车载电脑操作系统的框架层将导航数据上报给车载电脑操作系统的应用层; D、在车载电脑操作系统的应用层将导航数据完成导航应用; 所述步骤A包括以下步骤: A1、导航硬件采集导航数据; A2、如果导航硬件采集到导航数据,则执行步骤A3,如果导航硬件没有采集到导航数据,则重复执行步骤A1; A3、导航硬件将采集的导航数据发送给MCU。 3.根据权利要求2所述的导航方法,其特征在于,所述步骤B还包括以下步骤: B1、MCU读取导航数据、且暂存导航数据; B2、如果车载电脑操作系统启动完毕,则执行步骤B3,如果车载电脑操作系统未启动完毕,则等待车载电脑操作系统启动完毕; B3、MCU将导航数据发送给车载电脑操作系统的硬件抽象层。 4.根据权利要求2或3所述的导航方法,其特征在于,所述车载电脑操作系统运行的是Android系统。 技术说明书

文献检索有几种适用方法

1.确定检索策略。通过概念或主体分析,先确定检索用词和检索途径,明确各词之间的逻辑关系,然后对查找步骤做出科学安排,在检索过程中还要对方案不断做出调整。概况起来,有以下几个步骤:分析研究课题、编制检索策略、使用检索工具、查找文献检索、索取原始文献、满足课题检索。 2.掌握快速查找与阅读文献方法。在文献检索时往往会有大量的资料与所检索主题或关键词相类似, 我们又没有充足的时间去逐一通读,在这种情况下,快速查找和阅读的基本原则是:先综述后论著,先摘要后全文。多数文章看片段,少数文章看全文,对于自己感兴趣的问题,不仅要看全文,还要看它的参考文献。图表帮助了解主要数据和解释,讨论和结论将图表和结论相联系,根据图表判断结论是否正确。应当重视阅读文献的数量,并养成了解阅读英文文献的习惯,积累多了,自然就由量变发展为质变。 3.掌握快速筛查的能力。文献检索的过程其实就是搜集资料的过程,在整个搜索过程中,必须保持一种辩证分析的态度,具有辨别是非评判标准的能力。同时检索的过程也是不断制造问题的过程,这样就扩大了搜寻的目标和范围,缩小关键词范围,将检索范围缩在一个可控的范围之内。 4.选择适当的阅读方式。由于文献的广泛和杂乱性,对于同一内容的文献最好要集中时间看,这样看过的文献不会被遗忘,集中时间更有利于前后逻辑思路的衔接,并可根据文献对自己的利用价值程度和自己感兴趣的地方分为粗读、跳读和精读。 5.正确确定关键词。检索的关键词确定对于没有太多经验的大学生来说是一个难点,比如这篇论文, 如果把关键词确定为“大学生毕业论文文献检索方法”则什么都检索不到,根本无法找到你要找的文献资料。如果确定为“文献检索+空格+要找的目的关键字”,就会检索到大量的文章或图书。 6.关注文献被引用的次数。在检索过程中会出现众多文章或图书,下载哪些更有助于自己的写作呢? 这时一定要看下载旁写的引频次数,它表示该文献被引用的次数,被引用的次数越多,说明文献权威性就越大,对我们的论文写作也就越有参考价值。 7.掌握文献的筛选方法。天下文章一大堆,下载容易,但是下载后看到一堆的电子书你怎么化繁为易呢?最好的办法是把最核心的部分下到四五篇时要停顿一下,关掉所有的检索资料,打开下载的文章,做第一次初步筛选,将原文转化为word形式,把无聊的可有可无的话全部删掉,同时删掉各种修饰词。这样筛选完的资料基本上都是核心价值的资料。 8.做好标记和笔记。阅读时,要边阅读边做好标记和笔记,这也会为接下来的文章整理提供比较高的效率,有助于提高对已阅内容的理解和记忆。

整理文献检索方法

文献检索的方法 文献检索目的是通过查阅各国药典、药政部门的公开信息、生产厂家的公开信息以及各类公开的期刊文献等一切可得资源,全面了解待研药物的有关物质信息,为产品的有关物质研究提供依据。 1、各国药典及国家标准 对3类化学药物,目前可供查阅的国外药典包括英国药典(BP)、美国药典(USP)、欧洲药典(EP)、日本药局方(JP)。主要查阅最新版次的药典,同时在检索时对各药典的增补也应关注。可在各国药典的官方网站进行检索。还有一些其他国家的药典也可检索(主要是上市国家)。 对6类化学药物,除检索上述国外药典外,还应检索中国药典、新药转正标准、部颁标准、新药注册标准及进口药品注册标准。其中前三项国家标准公司内部可查。 2、各国药政网站检索 分别检索FDA(美国)、EMA(欧盟)、PMDA(日本)等最新关于研制品种的信息。特别关注FDA(https://www.wendangku.net/doc/4f16846269.html,)公布的NDA的REVIEW相关内容;EMA (www.emea.europa.eu)公布的scientific discussion中的相关内容;PMDA (www.pmda.go.jp)中的审查报告的相关内容。 第一部分:美国文献 1FDA文献查阅 https://www.wendangku.net/doc/4f16846269.html,/default.htm

1.1 Drugs@FDA

1.2 Orange Book Seach 主要用来搜索专利 1、点击进入Orange Book Seach 2、选择检索方式 3、选择商品名搜索,输入商品名,点击Submit提交 4、点击申请号

6、复制专利号到soopat(非免费网站)检索:https://www.wendangku.net/doc/4f16846269.html,/ 1.3 溶出度方法数据 回到“Drugs”首页,点击以下位置

文献检索的方法

文献检索的方法 一、文献检索方法 查找文献的方法分为如下三种: 1. 直接法 直接利用检索工具(系统)检索文献信息的方法,这是文献检索中最常用的一种方法。它又分为顺查法、倒查法和抽查法。 (1)顺查法 按照时间的顺序,由远及近地利用检索系统进行文献信息检索的方法。这种方法能收集到某一课题的系统文献,它适用于较大课题的文献检索。例如,已知某课题的起始年代,现在需要了解其发展的全过程,就可以用顺查法从最初的年代开始,逐渐向近期查找。 (2)倒查法 倒查法是由近及远,从新到旧,逆着时间的顺序利用检索工具进行文献检索的方法。此法的重点是放在近期文献上。使用这种方法可以最快地获得最新资料。 (3)抽查法 抽查法是指针对项目的特点,选择有关该项目的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法。 2. 追溯法 不利用一般的检索工具,而是利用已经掌握的文献末尾所列的参考文献,进行逐一地追溯查找“引文”的一种最简便的扩大信息来源的方法。它还可以从查到的“引文”中再追溯查找“引文”,像滚雪球一样,依据文献间的引用关系,获得越来越多的相关文献。 3. 综合法 综合法又称为循环法,它是把上述两种方法加以综合运用的方法。综合法既要利用检索工具进行常规检索,又要利用文献后所附参考文献进行追溯检索,分期分段地交替使用这两种方法。即先利用检索工具(系统)检到一批文献,再以这些文献末尾的参考目录为线索进行查找,如此循环进行,直到满足要求时为止。 综合法兼有常用法和追溯法的优点,可以查得较为全面而准确的文献,是实际中采用较多的方法。对于查新工作中的文献检索,可以根据查新项目的性质和检索要求将上述检索方法融汇在一起,灵活处理。 二、文献检索途径

检索文献常用网站及搜索方法

分享 1、https://www.wendangku.net/doc/4f16846269.html,/ 这个不多讲了. 2、https://www.wendangku.net/doc/4f16846269.html,/ 后起之秀,科研人员的良好助手,上此网站的90%是从事科研的学生与老师。其词典搜索集成了目前市面上最好的在线英汉写作及科研词典,用此搜索引擎写作英文论文相当方便;其文献搜索集成了目前最优秀的数据库。 3、https://www.wendangku.net/doc/4f16846269.html, Scirus是目前互联网上最全面、综合性最强的科技文献搜索引擎之一,由Elsevier科学出版社开发,用于搜索期刊和专利,效果很不错!Scirus覆盖的学科范围包括:农业与生物学,天文学,生物科学,化学与化工,计算机科学,地球与行星科学,经济、金融与管理科学,工程、能源与技术,环境科学,语言学,法学,生命科学,材料科学,数学,医学,神经系统科学,药理学,物理学,心理学,社会与行为科学,社会学等。 4、https://www.wendangku.net/doc/4f16846269.html,/ BASE是德国比勒费尔德(Bielefeld)大学图书馆开发的一个多学科的学术搜索引擎,提供对全球异构学术资源的集成检索服务。它整合了德国比勒费尔德大学图书馆的图书馆目录和大约160 个开放资源(超过200 万个文档)的数据。 5、http://www.vascoda.de/ Vascoda是一个交叉学科门户网站的原型,它注重特定主题的聚合,集成了图书馆的收藏、

文献数据库和附加的学术内容。 6、https://www.wendangku.net/doc/4f16846269.html,/ 与google比较了一下发现,能搜索到一些google搜索不到的好东东。它界面简洁,功能强 大,速度快,YAHOO、网易都采用了它的搜索技术。各位可以一试。 7、 https://www.wendangku.net/doc/4f16846269.html, Google在同一水平的搜索引擎。是https://www.wendangku.net/doc/4f16846269.html,推出的,Web result部分是基于Google 的, 所以保证和Google在同一水平,另外增加了Amazon的在书本内搜索的功能和个性化功能: 主要是可以记录你的搜索历史。现在还是Beta,不过试用后感觉很好,向大家推荐一试,不过缺憾是现在书本内搜索没有中文内容。 8、https://www.wendangku.net/doc/4f16846269.html, 严格意义上讲不是搜索引擎,是连接搜索引擎和网络用户的信息立交桥。新一代的搜索引 擎应运而生,Ixquick meta-search正是目前最具光芒的新星。但是对于大多数国内用户 来说,Ixquick还很陌生。Ixquick众多独特的功能我不一一介绍了,只介绍我们最关心的 ,搜索数据库密码。 使用方法:先进入Ixquick,以“Proquest”数据库为例。填入Proquest Username Passw ord History Online后点击search,看看出来的结果,第一页中第6个,proquest的usern ame和password赫然在目,别急,再看第4个结果“HB Thompson Subscription Online

《文献检索》检索报告要求及范例

《文献检索》检索报告 1、检索目的:通过检索检索,加深对课堂所学检索知识和检索方法的巩固,对 我馆订购的重要中外文数据库有形象而直观的认识,并熟练掌握有关中外文数据库的检索方法,通过检索掌握各种搜索语法的使用,提高针对专业课题进行检索的实际操作能力,特别是计算机信息检索的能力。 2、检索内容: 结合自己所学专业自选题目(课题不许重复),注意选题不要太大,一般应包含两个以上的关键词,并列出此选题的中英文题名。按照自选课题,进行文献检索,要求使用不同的检索方法和手段,给出检索结果页面截图,并列出检索结果条数和结果举例(5个为宜)。 4、检索说明及要求 1)本报告中的题录格式书写参照参考文献格式(见下页)。 2)检出篇(条)数指按检索词或检索式实际检出的篇(条)数,而非经人 工筛选的切题篇数。 3)检索步骤描述包括检索词、字段限定、检索途径(简单或高级检索等) 及因检索结果不理想而调整检索策略的过程。 4)在检索结果不理想时,如检出篇数为零时可进行检索词调整,在报告中 应对检索策略作说明。 5)“检索报告”为本课程考核形式,课程结束时统一打印上交。如两份检 索报告相同,两份均记为零分。 6)“检索报告”格式,封面如下下页所示,A4纸打印,正文部分中文宋体、 西文和数字Times New Roman,小四号,1.5倍行距。 7)检索报告在10-15页,打印成册上交。

期刊类[序号]主要责任者.文献题名[J].刊名,出版年份,卷号(期号):起止页码.例:[1]袁庆龙,候文义.Ni-P合金镀层组织形貌及显微硬度研究[J].太原理工大学学报,2001,32(1):51-53. 专著类 [序号] 作者.书名[M].出版地:出版社,出版年份.起止页码. 例:[1] 刘国钧,陈绍业,王凤翥.图书馆目录[M].北京:高等教育出版社,1957.15–18. 论文集[序号]主要责任者.文献题名[C].主编.论文集名.出版地:出版者,出版年:起止页码. 例:[6]孙品一.高校学报编辑工作现代化特征[C].中国高等学校自然科学学报研究会.科技编辑学论文集(2).北京:北京师范大学出版社,1998:10-22. 学位论文 [序号]主要责任.文献题名[D].保存地:保存单位,年份. 例:[7]张和生.地质力学系统理论[D].太原:太原理工大学,1998. 报告[序号]主要责任.文献题名[R].报告地:报告会主办单位,年份. 例:[9]冯西桥.核反应堆压力容器的LBB分析[R].北京:清华大学核能技术设计研究院,1997. 报纸类 [序号]主要责任者.文献题名[N].报纸名,出版日期(版次). 例:[13]谢希德.创造学习的思路[N].人民日报,1998-12-25(10). 专利 [序号]专利所有者.专利题名[P].专利国别:专利号,发布日期. 例:[11]姜锡洲.一种温热外敷药制备方案[P].中国专利:881056078,1983-08-12. 标准[序号]标准代号,标准名称[S].出版地:出版者,出版年. 例:[1] GB/T 16159—1996,汉语拼音正词法基本规则[S].北京:中国标准出版社,1996. 电子文献[序号]主要责任者.电子文献题名[文献类型/载体类型].电子文献的出版或可获得地址,发表或更新的期/引用日期(任选). 例:[21] 王明亮.中国学术期刊标准化数据库系统工程的[EB/OL].https://www.wendangku.net/doc/4f16846269.html,/pub/wml.txt/9808 10-2.html,1998-08-16/1998-10-04.

基于GPS的汽车导航系统的设计与实现

邮局订阅号:82-946360元/年技术 创新 汽车电子 《PLC 技术应用200例》 您的论文得到两院院士关注 基于GPS 的汽车导航系统的设计与实现 Realization and design of automobile guidance system based on GPS (吉林工程技术师范学院)张丹彤 ZHANG Dan-tong 摘要:设计并实现了一种以单片机为主要控制器件、基于GSP 模块的新型智能电动汽车底盘的导航系统。GPS 定位系统主 要采用技术非常成熟的GPS 模块进行与单片机的接口通信完成,使用更方便,定位也更准确。所设计的电动导航系统具有全球定位、自动控制、实时性好等多方面优点为一体,应用在当今的汽车上有较好的发展前景。关键词:GPS;导航;数据采集中图分类号:U49文献标识码:A Abstract:The present paper introduced one kind take the monolithic integrated circuit as the primary control component,based on GSP module new intelligent electric automobile chassis guidance system design.The GPS localization mainly uses the technical ex -tremely mature GPS module to carry on with the monolithic integrated circuit connection correspondence completes,use more conve -nient,the localization is also more accurate.This chassis collection whole world localization,the automatic control,timeliness good and so on the various merit is a body,applies has the good prospects for development on the now automobile.Keywords:GPS;navigation;data acquisition 文章编号:1008-0570(2008)11-2-0255-02 近年来,我国私人小轿车拥有量呈上升趋势,单位用轿车拥有量也在快速发展,对于这一类车辆,GPS 领航系统侧重于电子地图领航,对运行路线不固定的车辆,可预先设置到达目的地,在运行中告知运行路线,起到领航的重要作用。本论文介绍了一种以单片机为主要控制器件,基于GSP 模块的新型智能电动汽车底盘的导航系统设计。 1主体控制方案 本系统是以单片机为主要控制器件,基于GSP 模块的新型智 能电动汽车底盘的导航系统设计。该车底盘具有智能避障、 寻迹、测距、报警、寻光、行驶路程显示、行驶时间显示、车体所在环境温度显示、车体所在环境湿度显示、人工定位等功能。可以使用无线遥控器控制,并可以在上位机显示出它所在的位置等数据信息。本系统设计主要包括硬件电路的设计、实时操作系统程序设计、多机通信设计与总线接口的设计。系统框图如图1所示。 图1系统框图 本系统硬件电路主要包括控制模块、GPS 定位模块、电机 驱动模块、传感器数据采集模块、网络节点接口模块、光报警模 块、 显示驱动模块、时间模块、键盘模块与无线通信模块组成。传感器数据采集模块由光电传感器进行对光线的跟踪,红外传 感器进行对近距离的数据采集,声纳传感器进行对远距离的数 据采集,温度传感器对车体周围的环境温度采集,湿度传感器 对周围环境的相对湿度采集等。网络接口采用串行通信方式。 显示驱动模块由LED 数码管与液晶共同显示。无线通信模块采用FSK 方式进行无线传输。 2GPS 定位系统设计 GPS 定位主要采用技术非常成熟的GPS 模块进行与单片机的接口通信完成。电机驱动电路模块主要采用H 型电路构建而成。GPS 模块的电源接口供电有15v 、12v 、5v 、3.3v 不等,本系统为了设计简单采用全新台湾HOLUX 公司推出的SIRF 第三代高灵敏度超小型GPS 接收模块这是最新推出的产品,采用 SiRF 第三代芯片, 主要是定位灵敏度大大提高,例如在汽车上应用时,只要靠近车窗就能较好工作,使用更方便,定位也更准确。本模块主要是提供给从事GPS 模块二次开发的客户使用的,GPS 模块使用3.3伏 (70毫安)直流工作电压,默认每秒输出一次TTL 的NMEA-0183信号。 此模块接口定义如表1所示。GPS 控制模块口控制模块方框图如图2所示。为了使车具 有导航系统,所以在车体上安装了GPS 模块,本设计采用全新台湾HOLUX 公司推出的SIRF 第三代高灵敏度超小型GPS 接 收模块,该模块由6个控制脚组成。为了减轻主控CPU 的负担,并且为了模块化硬件,所以该GPS 模块由一块STC12C2052单 片机进行单独的控制,并且通过74HS573与主单片机进行总线通信。STC12C2052单片机与GPS 通过串行口连接,并且以4800bps 的波特率进行通信。单片机的P1口与74HC573的数据输入口相连接,作为并行的8为数据总线使用,而LE 端口通过一个反响器与STC12C2052单片机的P3.7连接,并且P3.7口 通过一个74HC14与主控单片机的INT0相连。这样当P3.7为张丹彤:副教授 255--

论文关键词的写法

论文关键词的写法 关键词是科技论文的文献检索标识,是表达文献主题概念的自然语言词汇。科技论文的关键词是从其题名、层次标题和正文中选出来的,能反映论文主题概念的词或词组。 关键词是为了适应计算机检索的需要而提出来的,位置在摘要之后。早在1963年,美国chemical abstracts从第58卷起,就开始采用电子计算机编制关键词索引,提供快速检索文献资料主题的途径。在科学技术信息迅猛发展的今天,全世界每天有几十万篇科技论文发表,学术界早已约定利用主题概念词去检索最新发表的论文。作者发表的论文不标注关键词或叙词,文献数据库就不会收录此类文章,读者就检索不到。关键词选得是否恰当,关系到该文被检索和该成果的利用率。 1 关键词分类 关键词包括叙词和自由词。 1) 叙词——指收入《汉语主题词表》、《mesh》等词表中可用于标引文献主题概念的即经过规范化的词或词组。 2) 自由词——反映该论文主题中新技术、新学科尚未被主题词表收录的新产生的名词术语或在叙词表中找不到

的词。 2 关键词标引 为适应计算机自动检索的需要,gb/t 3179—92规定,现代科技期刊都应在学术论文的摘要后面给出3~8个关键词(或叙词)。关键词的标引应按gb/t 3860-1995《文献叙词标引规则》的原则和方法,参照各种词表和工具书选取;未被词表收录的新学科、新技术中的重要术语以及文章题名的人名、地名也可作为关键词标出(自由词)。 所谓标引,系指对文献和某些具有检索意义的特征如:研究对象,处理方法和实验设备等进行主题分析,并利用主题词表给出主题检索标识的过程。对文献进行主题分析,是为了从内容复杂的文献中通过分析找出构成文献主题的基本要素,以便准确地标引所需的叙词。标引是检索的前提,没有正确的标引,也就不可能有正确的检索。科技论文应按照叙词的标引方法标引关键词,并尽可能将自由词规范为叙词。 3 标引关键词应遵循的基本原则 专指性原则 一个词只能表达一个主题概念为专指性。只要在叙词表中找到相应的专指性叙词,就不允许用词表中的上位词(s项)或下位词(f项);若找不到与主题概念直接对应的叙词,而

国内三大文献检索网站(新版)学术论文检索方法及显示结果比较

国内三大文献检索网站(新版)学术论文检索方法及显示结果的 比较 摘要:本文通过访问、查询、操作实践,对维普资讯网、中国 知网、万方数据网,这国内三大文献检索网站论文检索方法进行较为全面的比较,揭示出了它们的共性和特点。所做出的分析结论,可作为相关研究的依据与参考。 abstract: through the access, query, and the operation practice, the thesis retrieval methods of the three major domestic literature retrieval site: the vip information net,cnki, and wanfang data net are compared, their commonness and characteristics are revealed. the conclusion and analysis can be used as basis and reference to the related studies. 关键词:文献检索;著录格式;相关文献 key words: literature retrieval;description format;related literature 中图分类号:g252.7 文献标识码:a 文章编号:1006-4311(2013)19-0184-02 1 三大文献检索网站简介 1.1 维普资讯网[1]https://www.wendangku.net/doc/4f16846269.html, 成立于1989年。是维普资讯公司在科学技术部西南情报中心的情报分析网站基础上发展起来的。首页为“vip维普网-全储式在线出版平台”。点击首页中的“专业版”,在打开的“维普期刊资源整合服务平台”中点击“english”

【CN109889982A】定位导航数据采集系统及方法【专利】

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910176664.6 (22)申请日 2019.03.08 (71)申请人 芋头科技(杭州)有限公司 地址 310000 浙江省杭州市余杭区五常街 道西溪艺术集合村莲公荡路10号101 室 (72)发明人 吕诚 霍志宇  (74)专利代理机构 北京中原华和知识产权代理 有限责任公司 11019 代理人 孙磊 寿宁 (51)Int.Cl. H04W 4/02(2018.01) H04W 4/024(2018.01) H04W 64/00(2009.01) (54)发明名称定位导航数据采集系统及方法(57)摘要本发明涉及一种定位导航数据采集系统及方法,该系统包括:一个或多个机器人,所述机器人用于获取场所的坐标信息,以及遍历所述场所中的多个关键点,其中,所述坐标信息包括所述关键点的坐标值;一个或多个数据采集设备,设置于所述机器人上,用于在所述机器人到达所述关键点后、和/或在所述机器人移动过程中采集定位导航数据;数据存储模块,用于记录所述定位导航数据、和与所述定位导航数据的采集位置对应的所述坐标信息。利用本发明的定位导航数据采集系统及方法,实现了自动采集数据,能够极大地节省数据采集的时间和成本、提高效率, 并能够大规模推广。权利要求书4页 说明书17页 附图4页CN 109889982 A 2019.06.14 C N 109889982 A

权 利 要 求 书1/4页CN 109889982 A 1.一种定位导航数据采集系统,其特征在于,所述系统包括: 一个或多个机器人,所述机器人用于获取场所的坐标信息,以及遍历所述场所中的多个关键点,其中,所述坐标信息包括所述关键点的坐标值; 一个或多个数据采集设备,设置于所述机器人上,用于在所述机器人到达所述关键点后、和/或在所述机器人的移动过程中采集定位导航数据; 数据存储模块,用于记录所述定位导航数据、和与所述定位导航数据的采集位置对应的所述坐标信息。 2.根据权利要求1所述的定位导航数据采集系统,其特征在于,所述机器人具体用于: 利用基于视觉惯性里程计的即时定位与地图构建技术对所述场所建图得到所述坐标信息; 利用基于视觉惯性里程计的即时定位与地图构建技术进行自动导航并遍历所述关键点。 3.根据权利要求1所述的定位导航数据采集系统,其特征在于: 所述机器人包括第一建图单元和第一遍历单元; 所述第一建图单元用于通过对设置于所述场所中的关键点标记进行自动寻找和识别,自动地对所述场所建图得到所述关键点的坐标值;其中,所述关键点标记是用于标识出所述关键点的视觉标记、红外标记或电磁标记; 所述第一遍历单元用于根据所述关键点的坐标值,自动导航并遍历所述关键点。 4.根据权利要求1所述的定位导航数据采集系统,其特征在于,所述系统还包括: 远程终端,与所述机器人和所述数据采集设备通信连接,用于展示所述机器人和所述数据采集设备的状态、展示采集到的数据、对所述机器人的运动和所述数据采集设备的数据采集进行远程监控、在出现故障时接管所述机器人和所述数据采集设备的控制、以及遥控所述机器人建图。 5.根据权利要求4所述的定位导航数据采集系统,其特征在于: 所述机器人包括第二建图单元、第二遍历单元的一个或多个; 所述第二建图单元用于根据所述远程终端的控制指令所指定的所述关键点的位置,对所述场所建图得到所述关键点的坐标值; 所述第二遍历单元用于根据所述远程终端的控制指令所指定的所述关键点的位置,在所述场所中移动并遍历所述关键点; 所述数据采集设备具体用于根据所述远程终端的控制指令,在所述机器人到达所述关键点后、和/或在所述机器人移动过程中采集定位导航数据。 6.根据权利要求1到5中任意一项权利要求所述的定位导航数据采集系统,其特征在于: 所述数据采集设备包括无线信号采集单元、运动参数采集单元、视觉数据采集单元的一个或多个; 所述无线信号采集单元用于在所述机器人到达所述关键点后、和/或在所述机器人移动过程中,采集无线信号数据; 所述运动参数采集单元用于在所述机器人到达所述关键点后、和/或在所述机器人移动过程中,采集所述数据采集设备的运动参数; 2

一般关键词论文题目中的常见写法

一般关键词论文题目中的常见写法 关键词是科技论文的文献检索标识,是表达文献主题概念的自然语言词汇。科技论文的关键词是从其题名、层次标题和正文中选出来的,能反映论文主题概念的词或词组。 关键词是为了适应计算机检索的需要而提出来的,位置在摘要之后。早在1963年,美国Chemical Abstracts从第58卷起,就开始采用电子计算机编制关键词索引,提供快速检索文献资料主题的途径。在科学技术信息迅猛发展的今天,全世界每天有几十万篇科技论文发表,学术界早已约定利用主题概念词去检索最新发表的论文。作者发表的论文不标注关键词或叙词,文献数据库就不会收录此类*,读者就检索不到。关键词选得是否恰当,关系到该文被检索和该成果的利用率。 1 关键词分类 关键词包括叙词和自由词。

?1) 叙词——指收入《汉语主题词表》、《MeSH》等词表中可用于标引文献主题概念的即经过规范化的词或词组。 2) 自由词——反映该论文主题中新技术、新学科尚未被主题词表收录的新产生的名词术语或在叙词表中找不到的词。 2 关键词标引 为适应计算机自动检索的需要,GB/T 3179—92规定,现代科技期刊都应在学术论文的摘要后面给出3~8个关键词(或叙词)。关键词的标引应按GB/T 3860-1995《文献叙词标引规则》的原则和方法,参照各种词表和工具书选取;未被词表收录的新学科、新技术中的重要术语以及*题名的人名、地名也可作为关键词标出(自由词)。 所谓标引,系指对文献和某些具有检索意义的特征如:研究对象,处理方法和实验设备等进行主题分析,并利用主题词表给出主题检索标识的过程。对文献进行主题分析,是为了从内容复杂的文献中通过分析找出构成文献主题的基本要素,以便准确地标引所需的叙词。标引是检索的前提,没有正确的标引,也就不

中国知网等文献检索的一般方法

文献检索一般方法 同学们: 可能你们目前接触到的文献并不多,但以后你的作业和设计很大一部分要求自己查阅文献,期刊,论文来解决(比如说:微生物学,微生物工程工艺原理,酶工程,白酒工艺学,啤酒工艺学,食品安全学,白酒勾兑等)。在四川理工学院我们检索文献的方式不外乎在图书馆找纸质档案和网络检索两种,因为我们通常使用的文献都要求是近三年核心期刊发表的文章,因为只有这些才能反映某个领域目前发展的现状,所以我们一般都偏向于跟新更快的网络搜索,其中又以知网和超星使用最多。下面简单介绍文献检索的一般方法,希望能给大家的学习,包括实验室学习带来一点帮助,有不明白的地方请直接联系我。 1、检索课题名称(中英文) 计算机在中学物理中的应用 The application of computer to physics in middle school 2、分析研究课题 随着计算机技术的不断发展,计算机在教育中的作用愈发突出。在中学物理教育 中,同样可以引入计算的先进技术,改进教育方法,提高教学效率。如今,计算机在 中学物理中的应用主要体现在以下几个方面: 1)计算机技术在课件制作中的应用。 2)计算机在实验仿真中的应用。 3)计算机在教学数据处理中的应用。 根据以上分析,本课题主要是根据计算机在中学物理教学中的几个应用进行相关 材料的查找。 3、检索策略 3.1 检索工具 1)利用“中国知网”查找有关硕士、博士论文。 2)利用“中国期刊全文数据库”查找相关期刊论文。 3)利用“维普科技期刊数据库”查找相关期刊论文。 4)利用“超星数字图书馆”查找相关图书。 5)利用“SpringLink”查找相关论文。

一种惯性导航肢体动作捕捉系统采集方法

- 5 - 第7期2018年4月No.7April,2018 无线互联科技 Wireless Internet Technology 1 动作捕捉技术概述 动作捕捉技术(Motion Capture ,Mocap )的出现可追溯到20世纪70年代,国外的动画制作公司利用光学式的动作捕捉技术把表演者的姿势投射到计算机屏幕上,作为动画制作的参考。随着技术的发展,该技术已经广泛应用于3D 影视制作、步态分析、生物力学研究、人机工程、虚拟现实等新兴行业市场。 常用的动作捕捉技术从原理上说可分为机械式、声学式、电磁式、主动光学式、被动光学式、惯性导航式。本文的主要研究内容是惯性导航式肢体动作捕捉的采集方法实现。2 系统方案2.1 系统原理 动作捕捉系统的一般性结构主要分为3个部分:数据采集设备、数据传输设备、数据处理单元。惯性导航式动作捕捉系统既是将惯性传感器应用到数据采集设备,从而完成运动目标的姿态、角度的测量。 要完成对人体肢体动作的捕捉需要对人体的头部、肩部、大臂、小臂、手、胸口、尾椎、大腿、小腿、脚踝等共计17个部位进行动作跟踪,参考图1所述。在这17处重要部位佩戴集成加速计、陀螺仪、磁力计等惯性传感器的数据采集设备,加速计是用来检测传感器受到的加速度的大小和方向,它通过测量传感器在某个轴向的加速度大小和方向,但是相对于地面的姿态则精度不高。加速计的不足由陀螺仪来弥补,陀螺仪是通过测量三维坐标体系内内部陀螺转子的垂直轴与传感器的夹角,并计算角速度,通过夹角和角速度来判断物体在三维空间的运动状态,因为内部陀螺转子的垂直轴永远垂直地面,也就能保证对地面的姿态精度,但是不能测量同东西南北4个方向的姿态。那么陀螺仪的不足由磁力计来弥补,磁力计就是个小型的电子罗盘,由它来测量传感器同南北磁极的角度并确定4个方向的姿态。 数据传输设备是为了解决把采集到的动作数据传递给数据处理单元,同时也是上述17个数据采集设备的数据交汇点,这一特质决定了数据传输设备不可避免地要与数据采集设备就近部署。从使用舒适性、可穿戴性方面考虑,数据传输设备应采用无线通信技术回传数据给数据处理单元以减 少线缆数量和穿戴者的负担。目前主流的无线通信技术有ZigBee ,Bluetooth ,RFID ,WiFi 等,根据数据吞吐量来决定系统的通信子系统的设计,1个数据采集设备集成加速计、陀螺仪、磁力计,其中现在主流MEMS 芯片集成了加速计和陀螺仪,磁力计单独一颗芯片,芯片数据接口为I2C 总线,I2C 总线最大码流400 kbps ,那么数据量参考公式1所述。 传输数据吞吐量=17×2×400 kbps ≈13.6 Mbps (1)根据公式1所述的吞吐量要求,WiFi 支持11~54 Mbps ,其余技术传输速率不及1 Mbps ,故此数据传输设备采用WiFi 回传数据,在穿戴者身上部署数据传输设备(穿戴侧),在数据处理单元侧对称部署数据传输设备(处理侧),二者实现WiFi 无线传输数据,数据传输设备(处理侧)与数 据处理单元通过USB 传输数据。 数据处理单元采用图形工作站,工作站运行动作捕捉软件完成行动作捕捉。 图1 惯性导航式动作捕捉系统示意 2.2 系统设计 2.2.1 数据采集设备 数据采集设备是通过弹性束带固定在人体的运动部位,由于部署位置涉及人体接触,从舒适性和可穿戴性上决定了数据采集设备有体积小、功耗低的要求,数据采集设备如图 作者简介:韦宇(1980— ),男,广西柳州人,工程师,学士;研究方向:国防通信系统设计。 一种惯性导航肢体动作捕捉系统采集方法 韦 宇 (广州海格通信集团股份有限公司,广东 广州 510663) 摘 要:动作捕捉技术是运动物体的关键部位设置跟踪器,涉及尺寸测量、物理空间里物体的定位及方位测定等方面可以由计 算机直接理解处理的数据。惯性导航通过测量对象的加速度、运动角度、方位,通过积分运算获得对象的瞬时速度、瞬时位置数据的技术。文章对一种惯性导航肢体动作捕捉系统采集方法进行了研究。关键词:动作捕捉;惯性导航;采集方法

关键词索引

2009年15卷第11期关键词索引 自然科学 数学 (Q,r)模型 09110069 Box-Cox变换 09110063 Choquet积分 09110089 E-T问题 09110083 GIC准则 09110063 GM(1,1) 09110064 gλ测度 09110089 Kendall 09110065 Lemke-Howson方法 09110077 MC2 0-1线性规划 09110078 Nash均衡 09110089 Nash均解 09110077 Newsvendor型产品 09110071 Spearman 09110065 白指数律 09110064 变质期 09110066 博弈论 09110075 09110077 部分可续型 09110068 差分进化 09110067 车辆路径问题 09110067 城市物流网络 09110084 促销 09110070 代发货 09110069 单机调度 09110068 第三方物流 09110075 定价 09110066 定期控制策略 09110080 动态规划 09110066 09110068 多层次决策 09110078 多目标 09110074 多项式算法 09110083 多元评估 09110062 二元超阈值模型 09110065 返利 09110073 分支定界算法 09110078 分枝定界 09110068 负指数折扣 09110072 公共部门 09110062 功能模拟 09110088 供应链 09110070 09110071 09110072 09110081 09110082 供应链管理 09110073 供应链合作关系 09110079 供应商管理库存 09110073 供应商选择 09110078 管理复原 09110080 管理运筹学 09110085 合作博弈 09110081 合作广告 09110071 核心矩阵 09110076 互惠机制 09110079 灰导数 09110064 灰色关联度 09110090 灰色系统 09110090 机制 09110073 机制演化 09110079 绩效评估 09110062 加权最短加工时间 优先规则 09110068 客户关系管理 09110087 客户终生价值 09110087 客户资产 09110087 库存分配 09110069 库存控制 09110070 库存模型 09110080 利益分配 09110081 联盟 09110081 两层决策系统 09110072 路径选择 09110085 脉冲微分方程 09110061 蒙特卡罗仿真 09110087 模糊集 09110074 模糊可信性 09110067 模糊两人零和博弈 09110089 模糊模拟 09110072 模型选择 09110063 能力规划 09110070 能力受限批量问题 09110066 偏最小二乘法 09110062 奇异 09110061 契约机制 09110079 三参数区间灰数 09110090 熵 09110082 收益共享 09110073 疏散计划 09110085 双矩阵对策 09110077 随机模拟 09110067 随机排序 09110083 贪婪算法 09110083 特征值问题 09110061 贴近度 09110090 投影寻踪 09110090 退货价 09110080 退货物流 09110080 网络零售 09110069 尾部相关性度量 09110065 物流工程 09110084 物流配送 09110067 物流系统规划 09110084 线性规划 09110076 相关结构函数 09110065 项目调度 09110074 协调 09110073 需求 09110072 延迟策略 09110082 演化博弈模型 09110079 遗传局域搜索 09110074 遗传算法 09110072 09110084 异常点 09110063 优化模型 09110085 油田开发 09110088 阈值 09110069 原始对偶算法 09110076 约束理论 09110082 运筹学 09110086 正解 09110061 直达矩阵 09110086 直营店 09110071 锥 09110061 资金约束 09110072 最短路 09110086 最优路线 09110086 信息科学与系统科学 Cholesky分解更新 09110098 DGPS 09110098 JACK 09110099 备品库 09110091 不确定性 09110094 布局 09110099 长期表 09110092 脆性 09110096 脆性函数 09110096 萃取 09110097 多目标规划 09110094 多目标优化 09110091 分配问题 09110092 工效评价 09110099 公司债券 09110095 核函数 09110097 混合模型 09110097 货位优化 09110091 驾驶舱 09110099 进化博弈 09110093 理性羊群行为 09110093 利他行为 09110093 民机 09110099 偏最小二乘法 09110097 区间数 09110094 全球定位系统 09110098 失真度 09110096 湿法冶金 09110097 双方互相担保 09110095 通信系统 09110096 土地利用 09110094 违约强度 09110095 无导数卡尔曼滤波 09110098 行为经济学 09110093 蚁群算法 09110091 约化法 09110095 振荡策略 09110092 力学 Lagrange乘子 09110100 Navier-Stokes方程 09110119 PIV 09110115 RAMP 09110104 Starling力 09110117 T.L. 描述 09110103 伴生体力 09110103 壁面摩擦应力 09110114 变形 09110111 波高 09110115 薄膜基底 09110108 超声空化 09110120 穿甲 09110102 大变形固结 09110103 弹黏塑性材料 09110110 弹塑性 09110109 弹塑性屈曲 09110109 弹性动力学 09110107 低速冲击 09110106 动量损失厚度 09110114 动态扩展 09110110 对流 09110115 多尺度法 09110101 多孔介质渗流 09110117 多体系统 09110100 非保守体力 09110103 非局部理论 09110108 分岔 09110101 干摩擦 09110100 高超声速 09110113 混沌动力学 09110101 脊状表面 09110114 计算土力学 09110103 夹层梁 09110106 减阻 09110114 剪切冲塞 09110102 建模方法 09110100 交通流 09110118 接触定律 09110106 结构响应 09110106 金属板 09110102 径向基函数 09110107 绝热剪切 09110102 空化气泡 09110120 扩散 09110115 离散模型 09110106 连续多点成形 09110105 连续模型 09110106 连续体结构 09110104 联合控制方程 09110119 裂纹尖端场 09110110 流固耦合 09110119 流体力学 09110121 脉冲爆轰发动机 09110116 敏度过滤 09110104 摩擦速度 09110114

相关文档