文档库 最新最全的文档下载
当前位置:文档库 › 一种评估国内IP地址库可信度的方法

一种评估国内IP地址库可信度的方法

收稿日期:2014-05-14;修回日期:2014-06-30。

基金项目:国家科技支撑计划项目(2013BAH10F01,2013BAH07F02,2014BAH26F02);高等学校博士学科点专项科研基金资助项目

(20110005120007)

;北京高等学校青年英才计划项目(YETP0445);教育部信息网络工程研究中心和北京市教育委员会共建项目。 作者简介:宋建(1989-),男,河南安阳人,硕士研究生,主要研究方向:计算机网络; 许可(1982-),男,吉林长春人,讲师,博士,主要研

究方向:计算机网络、服务科学与服务工程;

宋美娜(1974-),女,山东烟台人,教授,博士,主要研究方向:分布式计算、服务科学与服务工程、云计算; 战晓苏(1964-),男,山东烟台人,研究员,博士,主要研究方向:计算机网络、移动互联网。

文章编号:1001-9081(2014)S2-0004-03

一种评估国内IP 地址库可信度的方法

宋 建*

,许 可,宋美娜,战晓苏

(北京邮电大学计算机学院,北京100876)(*通信作者电子邮箱songjian680@https://www.wendangku.net/doc/8615789652.html,)

摘 要:依据互联网IP 地址库进行定位的方法由于其方便、快捷而被广泛使用,无论对学术研究还是商业应用都有重要价值。目前国内网络IP 地址库很多,如:淘宝IP 地址库、纯真IP 地址库、新浪IP 地址库、百度IP 定位API 等,但是其可信度普遍不高。由于大范围真实IP 地址相对应的地理位置信息难获取,所以如何评估这些IP 地址库信息的准确程度成为难题。通过分析国内主流的IP 地址库,提出了一种基于IP 地址库之间差异对比来评估其可信程度的方法;并发现IP 地址库之间差异所存在的规律,即IP 地址库中的地理位置信息在粒度越细的情况下,各个IP 地址库数据的差异越大,可信度越低。该成果为找出评估IP 地址库的可信度、提高通过IP 地址库进行IP 定位的准确度提供了可参考的方法。

关键词:IP 定位;IP 地址库;可信度评估;地理位置信息;重合率中图分类号:TP393.03 文献标志码:A

Credibility evaluation method of domestic IP address database

SONG Jian *

,XU Ke,SONG Meina,ZHAN Xiaosu

(School of Computer Science,Beijing University of Posts and Telecommunications,Beijing 100876,China )

Abstract:Because being convenient and fast,the localization method based on IP address database of Internet is widely

used.It has important value for both academic research and commercial applications.At present,there are many domestic IP address databases on Internet,such as Taobao IP address database,chunzhen IP address database,Sina IP address database,Baidu IP location API,but their credibilities are not high.How to evaluate the accuracy of these IP address databases becomes a difficult problem,because the large-scale real location information of IP addresses is hard to be acquired.Through the analysis of domestic IP address databases,this paper proposed a method based on the comparison of differences of IP address

databases for evaluating their credibilities,and found the laws behind these differences:when the granularity of IP geographic information is finer,the differences between IP address location databases are bigger and the credibilities of them are lower.The research results of this paper provide a reference method for evaluating the credibility of IP address databases,improving

the accuracy of IP location by IP address database.

Key words:IP location;IP address database;credibility evaluation;geographical location information;coincidence rate

0 引言

互联网是通信技术和计算机技术的产物,是应人们对于

信息共享和信息传递的要求发展起来的。随着计算机网络技术的发展,互联网已经成为信息时代的特征,人们的工作和生活越来越离不开互联网。以我国为例,截至2013年12月,中国网民规模达6.18亿,全年新增网民5358万人。互联网普及率为45.8',较2012年底提升3.7个百分点。中国互联网普及率逐渐饱和,互联网发展主题从“数量”向“质量”转换,互联网具备在经济社会中地位提升、与传统经济结合紧密、各

类互联网应用对网民生活形态影响力度加深等特点[1]

在互联网上,用户只有获得IP 地址,才能与互联网相连,进而享受互联网服务。面对数量迅速膨胀的用户群,大量互联网服务都需要用户的地理位置信息,比如向目标人群投放广告页面、显示当地新闻和天气、自动选择网页需要展示的语种以及网

页内容需要遵守当地的政策法规等,区分用户的来源在许多互联网应用中成为重要的课题。因此IP 定位技术(即IP 地址与地理位置信息之间的相互映射)成为众多互联网服务的基石。

1 相关研究

目前主要存在主动和被动两种IP 定位技术。主动的IP

定位技术在一些特性,例如精度上能达到满意的结果,也就是说主动测量技术在很多情况下能够提供比被动定位技术更好

的结果,其中具有代表性的是基于延迟的测量技术[2]

。然

而,主动IP 定位技术也存在一些缺点,比如缺少可拓展性、测量代价大以及时间成本高。比起被动定位技术,如数据库驱动定位技术,主动定位技术如果想要得到同样的结果,速度要

慢上很多倍[3]。

数据库驱动的定位技术通常由一个数据库(如SQL /

MYSQL )引擎组成,该数据库包含着很多IP 地址块的记录,这

Journal of Computer Applications 计算机应用,2014,34(S2):4-6,15

ISSN 1001-9081

CODEN JYIIDU

2014-12-15

https://www.wendangku.net/doc/8615789652.html,

相关文档