文档库 最新最全的文档下载
当前位置:文档库 › 武汉大学2010-2011数理统计考试

武汉大学2010-2011数理统计考试

武汉大学2010-2011数理统计考试
武汉大学2010-2011数理统计考试

1.武汉大学《信息检索》试卷及答案(两套)

武汉大学信息管理学院2008-2009学年度第二学期 《信息检索》课程考试卷(A卷) 年级专业图书馆学姓名学号 (请务必将答案写在答题纸上,否则无效) 一、名词解释(5 x 4分=20分) 1.信息检索 2.引文索引 3.CALIS 4.邻近检索 5.搜索引擎 二.简答(5 x 6分=30分) 1.电子图书有哪些特点? 2.对搜索引擎的选择与比较主要从哪些方面考虑? 3.网络信息选择的标准有哪些? 4.查找国内外引文与学位论文分别有哪些数据库?每类中分别举2个英文数据库(包括全称、简称与中译)和1个中文数据库。 5.除商业数据库和搜索引擎外,还可以从哪些途径获取网络信息资源?请至少给出5种,每种举一例。三.选择填空(4 x 5分=20分) 此题为多项选择题,选错者不倒扣分,但所选答案不得多于5个。 1.下列中不能用于查找期刊论文引用信息的有: a. SSCI b. CSSCI c. Journal Citation Report d. Ulrich’s International Directory of Pe riodicals e. SCI f. A&HCI g. ProQuest Digital Dissertations h. Web of Knowledge i.VIP Chinese Scientific Journal Database j.Chinese Enterprises and Companies Database 2.检索图书馆学、信息管理学的期刊论文,可用的检索工具有: a. LISA b. ISA c. BA d. CA e. Web of Knowledge f. Ei g. SSCI h. SCI i. ProQuest Digital Dissertations 3.下列中可用于查找机构信息的有: a. ProQuest Digital Dissertations b. Ulrich’s International Directory of Periodicals c.Chinese Enterprises and Companies Database d. Foundation Directory e. Peterson’s Gradline f. Who is Who g. World of Learning h. Encyclopedia of Associations 4.下列中可用于查找期刊论文信息的有: a. ProQuest Digital Dissertations b. Ulrich’s International Directory of Periodicals

武汉大学【统计学】习题活页及答案

第三章统计表与统计图 1. 根据数据集03,按“性别”和“教育程度”计算相应的平均工资。用标准的统计表表现用Excel操作所得出的结果。 问:(1)男性的平均工资为______________;女性的平均工资为_____________。 (2)平均工资最低的是哪类人?_____________ 最高的是哪类人? ________________ 2. 根据数据集03,按“教育程度”和“性别”计算2007年考核时各个档次的人数。用标准的统计表表现按“教育程度”和“性别”分类的2007年考核为“优”的人数。 3. 根据王小毛、吴燕燕和朱青新三人的一年的销售记录,汇总出各种产品的销售量。问: (1)一月份A产品的销售总量是_________,其原始资料是: (2)八月份F产品的销售总量是_________,其原始资料是: (3)十一月份F产品的销售总量是_________,其原始资料是: 4. 根据数据集01中C列的“国内生产总值”指标,绘制1952-2006年GDP的趋势图。根据Excel作出的图形,手绘出该趋势图的大概形状。 5. 仿照例题3.3,根据数据集01中的相关资料,编制1953、1963、1973、1983和1993年的饼图,比较这六年产业结构的变化状态,并根据这六年的资料绘制三维百分比堆积柱形图。根据Excel作出的图形,手绘出1953年的饼图和六年的三维百分比堆积柱形图的大概形状。 第四章数据的描述性分析 1.一个车间200名工人某日生产零件的分组资料如下: 零件分组(个)工人数(人) 40-50 50-60 60-70 70-80 80-90 20 40 80 50 10

武汉大学统计学复习题

第一章 绪论 思考题: 1. 医药统计研究的过程是什么? 2. 统计资料主要分为哪几种类型? 3. 什么是总体;什么是样本。 4. 概率与常用概率分布 练习与思考 1.瓶中装有100片药片,其中有5片次品,从中任取10片,求: (1)10片全是正品的概率; (2)恰有2片次品的概率。 2.10把钥匙中有3把能打开锁,任取2把,求能打开锁的概率。 3.设A ,B ,C 是三个随机事件,试用A ,B ,C 表示下列事件: (1)A 不发生而B ,C 都发生; (2)A 不发生而B ,C 中至少有一个发生; (3)A ,B ,C 中至少有两个发生; (4)A ,B ,C 中恰有两个发生。 4.某药厂的针剂车间灌注一批注射液,需4道工序,已知由于割瓶时掉入玻璃屑而成废品的概率为0.5,由于安瓿洗涤不洁而造成废品的概率为0.2,由于灌药时污染而成废品的概率为0.1,由于封口不严而成废品的概率为0.8,试求产品合格的概率。 5.甲乙两个反应罐在1小时内需要工人照顾的概率分别为0.1和0.2。求在1小时内: (1)甲乙两罐都需要照顾的概率; (2)甲乙两罐都不需要照顾的概率; (3)一罐需要照顾而一罐不需要照顾的概率。 6.设()0.2, ()0.3, (/)0.3,P A P B P A B ===试求: (1)()P AB ; (2)(/)P B A ; (3)()P AB ; (4)()P A B +。 7.三个射手向一敌机射击,射中的概率分别为0.4,0.6,0.7。如果一人射中,敌机被击落的概率为0.2;二人射中,敌机被击落的概率为0.6;三人射中则必被击落。已知敌机被击中,求该机是三人击中的概率? 8.已知X 的可能取值为0,±1,±2,且 }1|{|}2{,6.0}1|{|,3.0}0{,4.0}21{==≥=≤===<<-X P X P X P X P X P 试求:X 的概率分布? 9.已知在8次独立试验中,事件A 至少发生一次的概率为0.57,试求在一次试验中事件A 发生的概率? 10.当投掷五枚分币时,已知至少出现两个正面,问:正面数刚好是三个的条件概率? 11.设X 服从泊松分布,且已知{}{}12P X P X ===,求{}4P X =。 12.设k 在[0,5]上服从均匀分布,求方程02442 =+++k kx x 有实根的概率? 13.设随机变量X 的概率密度函数为

信息检索基本方法教案.doc

布尔逻辑检索 Boolean logic 由 GEORGE BOOLE 1815-1864提出,目前大多数搜索引擎都 采用与AND,*,& 或OR,+ ,︱ 非 NOT,—, ! 逻辑“与” : 用关系词 AND表示 ( 可写作“ * ”或“ &”) 。逻辑“与”表示 AND 所连接的两个检索词必须同时在结果中出现才满足检索条件。 逻辑“或” : 用关系词 OR表示 ( 可写作“ +”或“︱” ), 逻辑“或”表示 OR所连接的两个检索词只要有一个能出现在结果中就算满足了检索条件。 逻辑“非” : 用关系词 NOT表示 ( 可写作“ and not ”“ —”或“ ! ” ), 逻辑“非”表示 NOT后面的那个检索词一定不能在检索结果中出现。 例如:校庆AND武汉大学 高等教育 *中国 湖南 OR 湖北 移动学习 + 泛在学习 大学 NOT 武汉大学 玉米–甜玉米 例如,用 GFsoso检索,电子AND读书笔记 电子读书笔记 OR 读书笔记软件 位置限制检索 临近检索( Proximity Search) 以 Dialog 为例,收 900 多个数据库 (1)PRE/0, P/0表示前后词序不能颠倒,中间不能插入其他词,但可以插 入符号。 With,(W) 例如: Wuhan P/0 University (2)PRE/#, P/#表示前后词序不能颠倒,中间可插入一定数量的单词,即

插入 #个单词。 例如: Wuhan P/1 University 检索结果:Wuhan Medical University ; Wuhan Agriculture University ; Wuhan Technology University ; (3)NEAR/0,N/0表示前后词序可以颠倒,但中间不能插入单词。 例如:Wuhan N/0 University 检索结果: Wuhan University;Wuhan–University;Wuhan,University University, Wuhan; University-Wuhan; University Wuhan (4)NEAR/#,N/#表示前后词序可以颠倒,中间可以插入#个单词。 例如: Wuhan N/1 University 检索结果: Wuhan Medical University; Wuhan Agriculture University; Wuhan Technology University; University of Wuhan; University in Wuhan; University at Wuhan (5)(s)是 sentence 的缩写, A( s) B 表示 A 和 B 必须同时出现在记录的同一个句子或短语中,但次序可以随意改变, A 与 B 之间可以有若干个其他的词。 如: resin (s) ester (酯化树脂) 【练习】 1、查找 computer 和 game的间隔不大于 100 个单词的网页 2、检索“杂交玉米”的外文文献,要求两词间隔 1 个词,前后次序固 定。 hybrid 、corn 答案: 1、computer near/100 game 2、hybrid p/1 corn hybrid w/1 corn

信息检索论文

信息污染研究综述 [论文关键词]信息污染网络信息对策 [论文摘要] 随着互联网技术的迅速发展和知识经济的到来,信息作为一种社会发展的战略资源,越来越受到人们的重视。由于网络环境下信息量的激增,信息传递的无序性和失控性,导致信息污染日益加剧,给社会造成了严重危害。因此,必须采取有效措施,进行网络环境下信息控污,净化网络信息空间,为更好地利用网络信息资源创造有利条件。针对网络信息环境,分析了信息污染的内涵、外在表现、污染原因,指出了信息污染的危害,给出了相关的解决对策。 一.信息污染类型 信息超载或信息过剩。 是指个人或系统所接受的信息超过其处理能力或有效应用的情况。这往往使信息用户无所适从。信息本来是用以消除不确定性的,过量的信息却增加了人们的不确定性和不安全感。每个人或结构的信息负载量是有一定限度的,当人们接受的信息超过其所能消化的信息量时,往往会患上“信息超载焦虑症”,带来财力、物力和人力的浪费。而且,信息超载又使人们面临新的信息匮乏。由于信息量太大,身处信息的海洋却找不到自己所需要的信息,致使社会信息吸收利用率反而下降。在网络信息技术十分发达的美国和日本,近年来的信息吸收率仅为10%左右。 信息垃圾 根据资料分析,在全球信息系统中,文献中信息垃圾( 包括冗余信息、盗版信息、虚假信息、过时老化信息、污秽信息等) 所占的比例不少于50%, 在个别学科领域甚至高达80%, 严重污染了互联网中的信息源和信息环境, 干扰了对有效信息的开发和利用。冗余信息即多余的、重复的、无价值的信息,包括期刊、书籍、因特网都有一些内容空洞、言之无物的东西。有的是剽窃、抄袭、拼揍之作,有的是多次重复发布,成为人们信息处理的负担。盗版信息是指在未经版权所有人同意或授权的情况下,对其拥有著作权的作品、出版物等进行复制所形成的信息。虚假信息传播布者有意识地传递的虚假错误信息,误导、诱骗他人。过时老化信息,即失去时效、老化无用信息。由于科学技术飞速发展,知识更新速度不断加快,据统计,化学专业文献在出版后8.1年出现老化,化工文献经过4.8年就老化,地理学、地质学、植物学分别经过16.0、11.8、10.0年而变得老化。污秽信息要指带有巫术、迷信等内容的信息,还有无从证实的传闻、流言、诽谤等恶意传递的污垢信息。 计算机病毒 它给整个因特网乃至整个社会带来难以估量的危害。世界上已有几千种病毒传播流行,它们被指令插入磁盘引导区、引导程序或应用程序中,捣乱甚至销毁系统中的数据、删除文件等,不仅造成电子信息污染,更严重是引发计算机犯罪,威胁着人类的生存社会的发展。对于信息污染,必须严加控制和治理,这已引起国际社会的高度重视。国际环球网联合会要求世界各国推行因特网监控软件,对信息标记进行审查。由欧洲和美国微软等大公司开发了PICS(Platform for Internet Content Selection),即“因特网络内容选择平台”,这一监控软件可以根据要求限制对网络信息调阅,也可以实现对特定信息监控。

应用数理统计(武汉大学研究生)2009-2010试题

武汉大学2009-2010年度上学期研究生公共课 《应用数理统计》期末考试试题 (每题25分,共计100分) (请将答案写在答题纸上) 1设X 服从),0(θ上的均匀分布,其密度函数为 ?????<<=其它0 01)(θθx x f n X X X ,,,21" 为样本, (1)求θ的矩估计量1?θ和最大似然估计量2 ?θ; (2)讨论1?θ、2?θ的无偏性,1?θ、2?θ是否为θ的无偏估计量?若不是,求使得i c ?i i c θ为θ的无偏估计量,; 1,2i =(3)讨论1?θ、2 ?θ的相合性; (4)比较11?c θ和22?c θ的有效性. 2. 假设某种产品来自甲、乙两个厂家,为考查产品性能的差异,现从甲乙两厂产品中分别抽取了8件和9件产品,测其性能指标X 得到两组数据,经对其作相应运算得 2110.190,0.006,x s == 2220.238,0.008x s == 假设测定结果服从正态分布()()2~,1,2i i X i μσ=, (1).在显著性水平0.10α=下,能否认为2212σσ=? (2).求12μμ?的置信度为90%的置信区间,并从置信区间和假设检验的关系角度分析甲乙两厂生产产品的性能指标有无显著差异。 3.设是来自正态总体的样本, 总体均值n X X X ,,,21"),(2 σμN μ和方差未知,样本均值和方差分别记为2σ2211 11,(1n n i i i i )X X S X X n n ====?∑∑?

(1) 求2211 (n i i X )μσ=?∑的分布; (2)若0μ=,求212212()() X X X X +?的分布; (3)方差的置信度为12σα?的置信区间的长度记为L ,求()E L ; (4)1n X + 的分布。 4.为进行病虫害预报, 考察一只红铃虫一代产卵量Y (单位:粒)与温度x (单位:)的关系, 得到资料如下: C 0x 18 20 24 26 30 32 35 Y 7 11 21 24 66 115 325 假设Y 与x 之间有关系 bx Y ae ε+=, . ),0(~2σεN 经计算:26.43x =,ln 3.612y =,,, 7215125i i x ==∑721(ln )102.43i i y ==∑7 1ln 718.64i i i x y ==∑(1)求Y 对x 的曲线回归方程; x b e a y ???=(2)求的无偏估计; 2σ2?σ (3)对回归方程的显著性进行检验(05.0=α); (4)求当温度0x =33时,产卵量的点估计。 0Y 可能用到的数据: 0.02282z =,()()0.050.057,8 3.50,8,7 3.73F F ==,()0.0515 1.7531t =,,,,0.025(5) 2.5706t =0.05(5) 2.015t =0.025(7) 2.3646t =0.05(7) 1.8946t =,0.05(1,5) 6.61F =, 0.05(1,7) 5.59F =

武汉大学《信息检索》试卷及答案(两套)

三.选择填空(4 x 5分=20分)1.C,d,g,I,j 2.a,b,e,g,h3.c,d,e,g, h4.c,d,f,g此题为多项选择题,选错者不倒扣分,但所选答案不得多于5个。 1.下列中不能用于查找期刊论文引用信息的有: a. SSCI b. CSSCI c. Journal Citation Report d. Ulrich’s International Directory of Periodicals e. SCI f. A&HCI g. ProQuest Digital Dissertations h. Web of Knowledge i.VIP Chinese Scientific Journal Database j.Chinese Enterprises and Companies Database 2.检索图书馆学、信息管理学的期刊论文,可用的检索工具有: a. LISA b. ISA c. BA d. CA e. Web of Knowledge f. Ei g. SSCI h. SCI i. ProQuest Digital Dissertations 3.下列中可用于查找机构信息的有: a. ProQuest Digital Dissertations b. Ulrich’s International Directory of Periodicals c.Chinese Enterprises and Companies Database d. Foundation Dire ctory e. Peterson’s Gradline f. Who is Who g. World of Learning h. Encyclopedia of Associations 4.下列中可用于查找期刊论文信息的有: a. ProQuest Digital Dissertations b. Ulrich’s International Directory of Periodicals c. ABI/INFORM d. Elsevier e. Journal Citation Report f. Chinese Academic Journal Fulltext Database g. OCLC Electronic Collections Online 武汉大学信息管理学院2008-2009学年度第二学期 《信息检索》考试试卷(A)答案 一、名词解释(5x4=20分) 1.信息检索(Information Retrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。 2.引文索引是一种将科技期刊、专刊、专题丛书等文献资料所发表的论文后所附的参考文献的作者、题目、出处等项目,按照引证与被引证的关系进行排列而编制的索引。 3.China Academic Library and Information System中国高等教育文献保障系统。 4.邻近检索是用一些特定的算符(位置算符)来表达检索词与检索词之间的关系,并且可以不依赖叙词表而直接使用自由词的检索方法。 5.搜索引擎(Search Engine)是一种Web 上应用的软件系统,它以一定的策略在Web 上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务。用户可以通过主题浏览和关键词检索的方式搜索所需信息。 二、简答(5x6=30分) 1.电子图书有哪些特点? 存储空间大(磁介质存储密度高、容量大,一张光盘甚至可以存上百部中外名著)、节省资源(不需消耗纸张等物质资源)、使用方便(借助于专门的软件便可使用,可以便捷地编辑和查找特定内容)、传播过程中的无独占性和无损坏性(可以同时供多人使

武汉大学期末GIS复习总结

第一章地理信息系统概论: 地理信息系统:是一种决策支持系统,它具有信息系统的各种特点。地理信息系统与其他信息系统的主要区别在于其存储和处理的信息是经过地理编码的,地理位置及与该位置有关的地物属性信息成为信息检索的重要部分。 “GIS是由计算机硬件、软件和不同的方法组成的系统,该系统设计用来支持空间数据的采集、管理、处理、分析、建模和显示,以便解决复杂的规划和管理问题”。(推荐定义) 信息:向人们或机器提供关于现实世界新的事实的知识,是数据中所包含的意义,它不随载体的物理设备形式的改变而改变。 数据:数据时指某一目标定性、定量描述的原始资料,包括数字、文字、符号、图形、图像以及他们能转换成的数据的形式。 有人认为,输入的都叫数据,输出的都叫信息,其实不然。数据是信息的表达、载体,信息是数据的内涵,是形与质的关系。只有数据对实体行为产生影响才成为信息,数据只有经过解释才有意义,成为信息。 地理信息:地理信息是有关地理实体的性质、特征和运动状态的表征和一切有用的知识,它是对地理数据的解释。 地理信息具有区域性、多维结构特性和动态变化的特性。 地理数据:地理数据时指表征地理圈或地理环境固有要素或物质的数量、质量、分布特征、联系和规律的数字、文字、图像和图形等的总称。 信息系统:是具有数据采集、管理、分析和表达数据能力的系统,它能够为单一的或有组织的决策过程提供有用的信息。它能对数据和信息进行采集、存储、加工和再现,具有采集、管理、分析和表达数据的能力。 主要由计算机硬件、软件、数据、用户四大要素组成。 地理信息系统可以分为三大类:专题地理信息系统、区域信息系统、地理信息系统工具。 地理信息系统的构成:空间数据、系统软件、系统硬件、应用人员。 空间数据:是地理信息的载体,是地理信息系统的操作对象,它具体描述地理实体的空间特征、属性特征和时间特征。 空间特征:是指地理实体的空间位置及其相互关系; 属性特征:表示地理实体的名称、类型和数量等; 时间特征:指实体随时间而发生的相关变化。 根据地理实体的空间图形表示形式,可将空间数据抽象为点、线、面三类元素,它们的数据表达可以采用矢量和栅格两种组织形式,分别称为矢量数据结构和栅格数据结构。

武大统计学模拟题

模拟题一 一、单选题(每题2分,共40分) 1. 在同一总体中作样本含量相等的随机抽样,有99%的样本均数在下列哪项范围内_____。 A x ±2.58x s B x ±1.96x s C μ±2.58x σ D μ±1.96x σ E μ±2.58x s 2.对于一组呈非正态分布的资料,反映其平均水平应使用哪个指标_______。 A 几何均数 B 中位数 C 上四分位数 D 四分位数间距 E 算术均数 3. 关于构成比,不正确的是____。 A 构成比中某一部分比重的增减相应地会影响其他部分的比重 B 构成比说明某现象发生的强度大小 C 构成比说明某一事物内部各组成部分所占的分布 D 若内部构成不同,可对率进行标准化 E 构成比之和必为100% 4. 以下属于分类变量的是_____。 A IQ 得分 B 心率 C 住院天数 D 性别 E 胸围 5.在两样本均数比较的t 检验中,无效假设是 。 A 两样本均数不等 B 两样本均数相等 C 两总体均数不等 D 两总体均数相等 E 样本均数等于总体均数 6. 由两样本均数的差别推断两总体均数的差别,所谓差别有显著性是指_____。 A 两总体均数不等 B 两样本均数不等 C 两样本均数和两总体均数都不等 D 其中一个样本均数和总体均数不等 E 以上都不是

7.在同一总体中作样本含量相等的随机抽样,有95%的样本均数在下列哪项范围内 。 A x ±2.58x s B x ±1.96x s C μ±2.58x σ D μ±1.96x σ E μ±2.58x s 8.已知肺活量越大,表示人体肺功能越强,假设肺活量呈正态分布,现测定了200例正常人的肺活量值,则其95%正常值范围为_____。 A < x +1.65s B > x -1.65s C x -1.96s ~ x +1.96s D < P 5 E > P 95 9.以下不属于方差分析前提条件的是_____。 A 正态性 B 要求3组方差齐性 C 要求3组均数相等 D 要求各组数据独立 E 要求是数值型变量资料 10.用某药治疗某病患者,5例中有4例治愈,宜写作4/5,而不计算治愈率为4/5×100%=80%,这是由于_____。 A 总体治愈率的可信区间太窄 B 样本治愈率的可信区间太宽 C 样本治愈率的可信区间太窄 D 总体治愈率的可信区间太宽 E 计算治愈率的方法不正确 11.单因素方差分析的目的是检验 。 A 多个样本均数是否相同 B 多个总体均数是否相同 C 多个样本方差的差别有无统计学意义 D 多个总体方差的差别有无统计学意义 E 以上都不对 12.两样本均数比较,t 检验结果差别有统计学意义时,P 值越小,说明____。 A 两总体均数差别越大 B 两总体均数差别越小 C 越有理由认为两总体均数不同 D 越有理由认为两样本均数不同 E 拒绝1H 时犯错误的概率越小 13.2χ值的取值范围是_____。

武汉大学信息管理学院2001-2002学年度第一学期《信息检索》期末考试卷

2008-2009学年度第二学期《信息检索》考试试卷(B)答案 一.名词解释(5 x 4=20分) 1.截词检索:是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。检索中,计算机会将所有含有相同部分标识的记录全部检索出来。截词符用“?”或“*”表示。 2.信息检索:信息检索(Information Retrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。 3.查准率:是指检出文献中合乎需要的文献数量占检出文献全部数量的比例。 4.查全率:是指检出的文献数量占数据库中全部相关文献数量的比例。 5.引文索引:是一种将科技期刊、专刊、专题丛书等文献资料所发表的论文后所附的参考文献的作者、题目、出处等项目,按照引证与被引证的关系进行排列而编制的索引。 二.简答(5x 6=30分) 1.查找国内外学位与会议论文分别有哪些数据库?每类中分别举2个英文数据库(包括全称、简称与中译)和1个中文数据库。 学位论文索引与摘要,如:CALIS《学位论文库》(http://162.105.138.230/opac/treatise),万方数据资源系统《中国学位论文数据库》(https://www.wendangku.net/doc/072740890.html,),PQDD (https://www.wendangku.net/doc/072740890.html,/dev/dissertations) 会议论文索引与摘要,如:CALIS 会议论文数据库(http://162.105.138.230/opac/meeting),万方数据资源系统《中国学术会议论文数据库》(https://www.wendangku.net/doc/072740890.html,),OCLC 会议数据库(https://www.wendangku.net/doc/072740890.html,/login )——《在会议上提交的文章索引》(PapersFirst),《会议出版物索引》(Proceedings),科学网会议录索引(Web of Science Proceedings,https://www.wendangku.net/doc/072740890.html,) 2.布尔逻辑检索的主要运算符有哪些?它们各代表什么含义?请分别举一例说明。 布尔逻辑检索的主要运算符有“AND”、“NOT”、“OR”,它们分别代表逻辑与、或和非,如:美国AND 社会保障,数字图书馆OR 虚拟图书馆,玉米NOT 甜玉米 3.搜索引擎有哪些类型? 按照信息组织方式分:有网络资源指南与关键词搜索引擎;按学科范围与资源种类分,有综合性搜索引擎和专门性搜索引擎;按照功能分,有独立搜索引擎和元搜索引擎 4. 5.电子图书有哪些特点? 容量大,节省空间,环保,功能多 6.网络信息选择的标准有哪些? 权威性、内容、时效性、网页设计、适用性、用户对象、访问次数或被链接次数 三.选择填空(5 x 5=25分) 此题为多项选择题,选错者不倒扣分,但所选答案不得多于5个。 1.c d e h i 2.a c d e h 3.a c d f h 4.b d e f g 5.a b g i j 四.论述题(1X25=25分) 通过检索实践,你认为网络信息检索中的主要问题有哪些(10分)?应掌握哪些技巧与注意事项(15分)?该题鼓励同学们在课本有关内容基础上进一步发挥。 “网络信息检索中的主要问题”部分考察学生发现问题的能力,鼓励个人发挥,若只答

武汉大学2016统计学考试(样卷)

2014-2015学年第二学期武汉大学经济与管理学院《统计学》(B卷)开卷时间:120分钟 学号姓名学院专业分数 一、名词解释(5选4,多选无效,每小题4.5分) 1、抽样误差 2、线性相关 3、总指数 4、时期数 5、回归系数 二、理论辨析题(6选4,多选无效,每小题7分) 1、简述方差分析的基本思想。 2、平均数理论是统计学的基础,请你谈谈其理论在统计指数理论和抽样理论中是如何体现的?你有何认识。 3、同度量因素有什么作用? 4、大数据对传统统计分析方法有什么机遇和挑战? 5、什么是随机原则?在抽样调查中为什么要遵循随机原则? 6、举例说明相关分析与回归分析的异同。 三、分析计算题(6选3,多选无效,每小题18分) 1、如果我们要评价几所大学的学生英语水平的稳定性,你认为应该应用统计学的什么方法进行定量分析,试举例计算说明方法的应用。 3、某一酿造厂长新引进一种酿醋曲种,以原曲种为对照进行试验。已知原曲种酿出的食醋醋酸含量平均数为9.75%,其标准差为5.30%,现在采用新曲种酿醋,得到30个醋样,测得其醋酸含量平均数为11.99%。试以0.01显著性水平检验,能否由这30个醋样的平均数判断新曲种好于原曲种?

(第三年资料请自己拟订)。 5、南孚AAA电池的寿命(单位:分钟)的95%的置信区间是430<μ<470。假设这个结果是根据一个容量为100的样本得出的。请问: (1)样本均值是多少?样本标准差是多少? (2)构建99%的置信区间。 6、道琼斯工业指数(DJA)是一个受到广泛关注的股市指标。下表是连续某些年的DJA 值。(请注意:学号尾数为偶数的同学,请用8年的资料预测第九年的DJA值。)

武汉大学信息检索往年试卷选辑

2009春季《信息检索》试卷A 1.电子图书有哪些特点? 2.对搜索引擎的选择与比较主要从哪些方面考虑? 3.网络信息选择的标准有哪些? 4.查找国内外引文与学位论文分别有哪些数据库?每类中分别举2个英文数据库(包括全称、简称与中译)和1个中文数据库。 5.除商业数据库和搜索引擎外,还可以从哪些途径获取网络信息资源?请至少给出5种,每种举一例。四.论述题(2X15分=30分) 1.从哪些方面全面地查找关于某一主题的研究成果? 2.在完成专题信息导航或准备课堂教学实践过程中遇到的困难有哪些(5分)?学习“信息检索”这门课,你最大的收获是什么(5分)?请写出你对提高本课程教学质量的建议(5分)。 2009春季《信息检索》试卷A答案 武汉大学信息管理学院2008-2009学年度第二学期 1.信息检索(Information Retrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。 2.引文索引是一种将科技期刊、专刊、专题丛书等文献资料所发表的论文后所附的参考文献的作者、题目、出处等项目,按照引证与被引证的关系进行排列而编制的索引。 3.China Academic Library and Information System中国高等教育文献保障系统。 4.邻近检索是用一些特定的算符(位置算符)来表达检索词与检索词之间的关系,并且可以不依赖叙词表而直接使用自由词的检索方法。 5.搜索引擎(Search Engine)是一种Web 上应用的软件系统,它以一定的策略在Web 上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务。用户可以通过主题浏览和关键词检索的方式搜索所需信息。 二、简答(5x6=30分) 1.电子图书有哪些特点? 存储空间大(磁介质存储密度高、容量大,一张光盘甚至可以存上百部中外名著)、节省资源(不需消耗纸张等物质资源)、使用方便(借助于专门的软件便可使用,可以便捷地编辑和查找特定内容)、传播过程中的无独占性和无损坏性(可以同时供多人使用,可无失真地重复使用)。 2.对搜索引擎的选择与比较主要从哪些方面考虑? 收录范围(索引库中内容的数量、地域范围、语言种类、资源类型、资源的深度和广度)、分类(分类方式是否合理多样、类名是否规范、分类的广度与深度是否合适)、检索功能与效果(是否包含浏览检索和关键词

(完整word版)武汉大学信息检索整理

名词解释 1.信息检索(Information Retrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。2.引文索引是一种将科技期刊、专刊、专题丛书等文献资料所发表的论文后所附的参考文献的作者、题目、出处等项目,按照引证与被引证的关系进行排列而编制的索引。 3.CALIS:China Academic Library and Information System中国高等教育文献保障系统。 4.邻近检索是用一些特定的算符(位置算符)来表达检索词与检索词之间的关系,并且可以不依赖叙词表而直接使用自由词的检索方法。 5.搜索引擎(Search Engine)是一种Web 上应用的软件系统,它以一定的策略在Web 上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务。用户可以通过主题浏览和关键词检索的方式搜索所需信息。 6.截词检索:是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。检索中,计算机会将所有含有相同部分标识的记录全部检索出来。截词符一般用“?”或“*”表示,但不同的数据库中有所差别。 7.查准率:是指检出文献中合乎需要的文献数量占检出文献全部数量的比例。 8.查全率:是指检出的文献数量占数据库中全部相关文献数量的比例。 9.文献及其要素 “文献”是泛指“有历史价值或参考价值的图书资料。” 要素:1、构成文献内核的信息、知识、数据、事实.2、载体信息、知识、数据、事实的物质载体。3、记录信息、知识、数据、事实的符号系统。 10.专利文献:专利文献是实行专利的国家、地区及国际专利组织在批审专利过程中产生的官方文件及出版物,包括专利说明书、专利权利要求书、专利公报、专利分类表、专利检索工具等。 11.三大检索系统:SCI(《科学引文索引》,EI是美国《工程索引》(TheEngineeringIndex)的简称,ISTP是IndextoScientific&T echnicalProceedings的缩写。 12.二次文献:二次文献又称二级次文献,它是文献检索工具,能比较全面、系统地反映某个学科、专业或专题在一定时空范围内的文献线索,是积累、报道和检索文献资料的有效手段. 13.受控语言:受控语言是一种规范化的人工语言,包括具有较强族性检索功能的分类语言和具有较强特性检索功能的主题语言。14.信息素质教育:是指一个人的信息意识教育、信息道德教育、信息能力教育 15.引文追溯法:追溯法是指不利用一般的检索工具,而是利用已经掌握的文献末尾所列的参考文献,进行逐一地追溯查找“引文” 的一种最简便的扩大情报来源的方法。它还可以从查到的“引文”中再追溯查找“引文”,像滚雪球一样,依据文献间的引用关系,获得越来越多的内容相关文献。 16.同引文献:与本文有相同参考文献的文献,与本文有共同研究背景或依据的文献。 17.学科导航:学科导航是按学科门类将学科信息、学术资源等集中在一起,以实现资源的规范搜集、分类、组织和序化整理,并能对导航信息进行多途径内容揭示,方便用户按学科查找相关学科信息和学术资源的系统工具。 18.知识产权:知识产权是指对智力劳动成果依法所享有的占有、使用、处分和收益的权利。知识产权是一种无形财产,它与房屋、汽车等有形财产一样,都受到国家法律的保护,都具有价值和使用价值。有些重大专利、驰名商标或作品的价值也远远高于房屋、汽车等有形财产。 19.IPC:国际专利分类法是国际上通用的专利文献分类法。用国际专利分类法分类专利文献(说明书)而得到的分类号,称为国际专利分类号,通常缩写为IPC号。IPC采用了功能和应用相结合,以功能性为主、应用性为辅的分类原则。采用等级的形式,将技术内容注明:部——分部——大类——小类——大组——小组,逐级分类形成完整的分类体系。 20.NSTL:NSTL是国家科技图书文献中心的简称,它是根据国务院领导的批示于2000年6月12日组建的一个虚拟的科技文献信息服务机构,成员单位包括中国科学院文献情报中心、工程技术图书馆(中国科学技术信息研究所、机械工业信息研究院、冶金工业信息标准研究院、中国化工信息中心)、中国农业科学院图书馆、中国医学科学院图书馆。网上共建单位包括中国标准化研究院和中国计量科学研究院。中心设办公室,负责科技文献信息资源共建共享工作的组织、协调与管理。 21.百科全书:百科全书是全面系统的介绍文化科学知识,收集各种专门名词、术语,按词典形式编排,解说详细的大型参考工具书。 它汇总了各学科或某一学科的知识,提供人类有关知识领域的基本事实、基本概念和基本理论。百科全书由众多专家撰稿、编审,故有较高的权威性。 简答 1.电子图书有哪些特点? 存储空间大(磁介质存储密度高、容量大,一张光盘甚至可以存上百部中外名著)、节省资源(不需消耗纸张等物质资源)、使用方便(借助于专门的软件便可使用,可以便捷地编辑和查找特定内容)、传播过程中的无独占性和无损坏性(可以同时供多人使用,可无失真地重复使用)。 2.对搜索引擎的选择与比较主要从哪些方面考虑? 收录范围(索引库中内容的数量、地域范围、语言种类、资源类型、资源的深度和广度)、分类(分类方式是否合理多样、类名是否规范、分类的广度与深度是否合适)、检索功能与效果(是否包含浏览检索和关键词检索功能、是否支持布尔检索、截词检索等高级检索功能、是否有检索帮助和提示功能、检索结果和查全率、查准率及响应时间)、结果处理(结果的排序方式是否多样、是否有去重功能、能否按照用户反馈动态调整和显示检索结果)、页面组织(页面组织是否清晰、类目设置是否合理、界面是否友好)、其他功能与服务(能否满足用户多方面的信息需求)、用户评价(是否有用户评价及统计功能)。 2.1搜索引擎有哪些类型? 搜索引擎按信息搜集方式分:有目录式搜索引擎和机器人搜索引擎;按照信息组织方式分:有网络资源指南与关键词搜索引擎;按学科范围与资源种类分,有综合性搜索引擎和专门性搜索引擎;按照功能和是否有自建索引库分,有独立搜索引擎和元搜索引擎。

武汉大学2010-2011概率论与数理统计B期末试卷

武汉大学 2010-2011第二学期 概率论与数理统计B 期末试题(54学时) 一、(12 分)若B 和 A 为事件, ()0.5,()0.6,(|)0.8 P A P B P B A === 求 ⑴ () P A B è ; ⑵ (()()) P A B A B -?è 。 二、(12 分) 某车间的零件来自甲、 乙、 丙三厂, 其各占比例为 5: 3: 2, 次品率分别为0.05,0.06,0.03; 现从中任取一件,求 :⑴它是次品的概率?⑵如果它是次品,它来自乙厂的概率? 三、(12 分)随机变量X 的密度函数为 1 0 sin () 2 x x f x p ì << ? = í ? ? 其他 。A 表示事件“ 3 X p 3 ” ⑴求 () P A ; ⑵对X 进行 4 次独立观测,记A 出现的次数为Y ,求其概率分布及 2 Y 的数学期望。 四、(14 分)若随机变量(,) X Y 的联合概率密度为 (2) 2 (,) 0 x y e f x y -+ ì = í ? 0,0 x y >> 其他 ; ⑴求随机变量X 和Y 的边缘概率密度 ()?() x y f x f y ; ⑵ X 和Y 是否独立 ?(3)求 2 Z X Y =+ 的概率密度。 五、(12 分) 若随机变量 (,) X Y 在区域 2 :01, D x x y x ££££ 上服从二维均匀分布, 求随机变量(,) X Y 的 相关系数 xy r 。 六、(14 分)若 12 , n X X X K 为来自 2 (0,) N s 的样本; X 为样本均值, i i Y X X =- 1,2 i n = K 求(1) i Y 的方差;(2) 1 ov(,) n C Y Y 。 (3)当a 为何值时, 2 1 222 23 n aX F X X X = +++ L 服从F 分布? 七、(12 分)若随机变量X 在区间(0,) q 服从均匀分布, 12 , n X X X K 是其样本, 求(1)q 的矩估计和极大似然估计。 (2) 判别他们的无偏性。 八、(12 分)设某次考试的学生成绩服从正态分布,从中任取 36 位学生的成绩,得平均分为68.5, 标准差为 6分;问:可否认为学生的平均分显著小于70 分? ( 0.05 a = ) 已知: 0.050.050.0250.025 (35) 1.690,(36) 1.688,(35) 2.030,(36) 2.028 t t t t ==== 0.050.025 1.65, 1.96 u u ==

信息检索与利用复习资料

信息检索与利用习题 一、判断题(正确的打√,错误的打×) 1.最佳参考资源(Outstanding Reference Sources)由英国CILIP负责评选。× 2.最佳免费参考网站(Best Free Reference Web Sites)由美国RUSA负责评 选。√ 3.《工具书指南》(Guide to Reference Books)是一种综合性的工具书评介工 具。√ 4.《工具书指南》(Guide to Reference Books)已经有100多年的出版历史。 √ 5.国外习惯于把书目划分为两大类型:列举式书目(enumerative bibliography)和分析书目(analytical bibliography)。√ 6.注释书目提供简单的作者、题名、出版日期和出版地等信息。× 7.列举式书目对每一个书目做简短的介绍或评价性的注解,对参考源的相关性、准确性和质量做出判断。× 8.大部分国家书目都不收录国外出版的关于本国的出版物。× 9.国家书目应该由专门的国家机构负责编纂,这样的机构一般设在国家图书 馆。√ 10.《中国国家书目》收录1911—1949年间我国出版的中文图书。× https://www.wendangku.net/doc/072740890.html,由Bowker公司出版。√ 12.WebPAC(Web-based Public Access Catalog)或IPAC(Internet Public Access Catalog)被称为是第二代OPAC。× 13.联合目录能够让我们检索到收藏馆地址。√ 14.查找某一学术会议的主办单位的检索工具是书目。× 15.学位论文索引提供的检索入口包括论文的导师。√ 16.Walford’s Guide to Reference Material被称为是参考工作的“圣经”。× 17.The New Walford开始收录网络资源,包括免费资源和收费资源。√ 18.登记书目的主要表现形式是国家书目。√ 19.网络书店具有书目信息功能。√

相关文档
相关文档 最新文档