文档库 最新最全的文档下载
当前位置:文档库 › 从复杂性科学到大数据技术

从复杂性科学到大数据技术



2013年被称为大数据的元年。从这年开始,大数据像旋风一样吹遍世界,世界也快速地跨入了大数据时代。大数据究竟是怎么回事?它的精神实质和科学理念是什么?它与世纪之交的复杂性科学运动有什么关系?通过考察大数据技术的特点,我们很快会发现,大数据技术与复杂性科学有着千丝万缕的联系。因此,我们有必要通过回顾复杂性科学与大数据技术的发展历程与特点来看看复杂性科学与大数据技术之间的关系。

1 复杂性科学的兴起

20世纪末,科学发展史上的一个重大事件是复杂性科学的兴起。什么是复杂性?什么是复杂性科学?学术界一直没有一个统一的定义或看法,但比较一致的是,不少科学家认为近现代西方科学经过数百年的发展,取得了巨大的成就,但也出现了一些难于克服的困境,因此需要另辟蹊径来找到科学发展的新路径。[1]13-15

世纪之交的时候为什么会突然兴起复杂性科学?也就是说复杂性科学的缘起是什么?这要从传统科学的方法论特点说起。西方科学从古希腊开始就致力于寻找科学生长的“本原”或“始基”,例如第一位哲学家、科学家泰勒斯就追问世界的本原问题,并认为水是万物的本原。后来的诸学派虽然对构成本原的具体物质究竟是什么这一问题上存在分歧,但认为世界存在本原这一点上却是一致的。按照追寻本原这一方法论传统,古希腊学者们认为世间万物都可以分拆,而且可以一路分解、追寻下去,直到不能再分的“本原”,这就是科学方法论中的所谓还原论。原子论认为万事万物都是由最基本的原子构成,这被认为是古希腊还原论的最高成就,并且一直影响到近现代科学。

文艺复兴之后,牛顿利用隔离、分解、还原的方法把研究对象进行孤立、静止的力学研究,取得了巨大的成就,发现了牛顿力学三大定律和万有引力定律。根据牛顿这套科学方法,物理、化学、地学、医学、生物学等各门学科都取得了巨大成就,并纷纷从哲学母体中独立出来成为一门门独立的自然科学,而工程技术人员则根据牛顿定律,制造出各种各样的高效机器。牛顿这套科学方法经过近代西方哲学家们的总结,成为大名鼎鼎的机械还原论,简称为还原论。所谓机械还原论,就是将研究对象假定为没有生命的机械,将对象与其他事物隔离开来单独进行分解、剖析,将宏观对象还原到微观要素,直到不能再分解为止,然后研究要素的结构、功能等,也就是说,还原论通过研究要素来达到认识对象的目的。[2]近现代科学技术在机械自然观和还原方法论的指导下一路高歌,所向披靡,捷报频传,以至于哲学家们认

为所谓科学方法论就是机械还原论。

随着现代科学的发展,机械还原论虽然仍然披荆斩棘,但暴露的问题也越来越多,特别是面对生物世界和生命现象。其实,早在19世纪,马克思、恩格斯就通过辩证法批判了机械还原论,把它称为形而上学,并将其总结为孤立、静止地看世界。[3]20世纪30年代,奥地利学者贝塔朗菲开始对机械还原论提出系统的清算,并于二战之后提出一般系统论来对抗机械还原论。随后申农的信息论、维纳的控制论都是针对还原论的不足而提出的。1970年代,学者们先后提出了耗散结构理论、协同学和突变论,对机械还原论进行了更深入的批判。1980年代中期,深得还原论好处的三位诺贝尔奖获得者盖尔曼、安德森、阿罗深感还原论的局限,从而反戈一击,正式提出超越还原论的口号,并在美国新墨西哥州成立从事跨学科、跨领域的研究机构:圣菲研究所。这就是著名的“老帅倒戈”事件,由此也就掀起了1990年代的复杂性科学运动。复杂性科学要求超越还原论,并复兴被西方科学久已忘记的整体论。1999年,美国著名的《科学》杂志推出复杂性科学专刊,这标志着复杂性科学得到了国际科学界的承认,获得了进入科学共同体的入场券。[1]39-52

复杂性科学从深层的方法论上进行革命,试图打破将研究对象当作没有生命的机器,可以不断向下分解、还原的路径,提出应该将研究对象当作具有生命活力的整体系统,并且重视要素组合所带来的结构、功能的涌现,从而理解整体为什么不一定等于部分之和。复杂性科学试图打破传统学科的重重藩篱,找到不同学科之间相互联系、相互合作的机制,并力图打破自牛顿力学以来主宰世界的线性思维,抛弃还原论适用于一切科学的幻想。最重要的是,复杂性科学试图创立新的科学范式,用科学新范式和新思维来理解世界。

复杂性科学将以往的以还原论为方法论特征的科学统称为简单性科学,而从简单性科学发展到复杂性科学,首先是带来了科学方法论的革命,继而引发了自然观、科学观、价值观和思维方式的变革,因此是科学范式的更替和革命。复杂性科学范式有着许多美好的愿景,在圣菲研究所科学家霍兰以及其他一些学者的共同努力下,复杂性科学快速兴起,并形成了一场复杂性运动。在复杂性运动的感召下,许多学科和领域都引入复杂性的科学理念和方法,并获得了初步的成功。然而,经过20多年的科学实践,复杂性科学并没有取得预想的革命性突破,反而被人讽刺为“混杂学”,复杂性科学运动的热潮似乎也在慢慢降温。

2 大数据时代的来临

正当复杂性科学发

展似乎停步不前、受人质疑之时,大数据技术却轰轰烈烈地来到我们面前。人们欣然发现,我们不知不觉已经步入了大数据时代。大数据是什么?大数据给我们带来了什么?大数据会引发什么样的思维变革和社会变革?这些问题都需要我们去回答。

究竟什么是大数据?目前没有一个统一的认识。总的说来,这跟以前我们并不特别重视的数据有关。从狭义上来说,所谓数据就是用阿拉伯数字表示的一些数字,但在计算机时代,凡是能够表达为0和1,即能够被计算机识别的符号都广义地被当作数据。大数据(Big data)并不是说数据的大小,而是涉及数据量的多少,它与小数据相对应。因此,所谓大数据是指数据量特别巨大,“超出了传统意义上的尺度,一般的软件工具难于捕捉、存储、管理和分析的数据。”[4]这些数据不仅数量大,而且异质、复杂、来源不同、分散各处。[5]至于数据量究竟有多大才能称为大数据,不同的时代以及不同的处理能力对这个问题的答案也不同,因此没有普适的标准。目前来说,一般认为,数据量到达“太字节”(240),可能就被称为大数据。[4]全球著名的麦肯锡公司认为,我们不需要给出划分大小数据的分界标准,因为随着技术的进步以及处理能力的增强,这个分界线会不断变化,但不变的是,我们总会遇到当时难于处理的巨大数据量。从数据量大小来理解大数据只是一种狭义、字面的概念。从广义来说,大数据是一种世界观,因为从大数据的眼光来看,世界上的一切都可以表征为数据,或者说,世界的本质就是数据。

2013年被称为大数据的元年,因为从这年开始,大数据的概念开始流行,人们蓦然回首发现自己已经身处大数据时代。虽然大数据的概念刚被提出,但数据的观念以及大数据的思想却早已存在,因此大数据时代的来临也是经过了其发生、发展的历程,而不是突然降临的。数的概念及其使用极为久远,远至古埃及、巴比伦,但最著名的莫过于古希腊毕达哥拉斯提出的“数是万物的本原”的观点。在西方科学传统中,数量化、数学化是走向科学化、技术化的必然途径。在我国,以阴阳为标志的易经理论将万事万物都纳入二进制的符号中,这是最早的二进制数据系统。随着二战后信息论的提出,信息、编码、解码等专业词汇逐渐被人们熟悉。特别是随着计算机技术的发展,人们逐渐认识到,构成计算机技术的除了硬件、软件之外,还有特别重要的数据,因此数据被提高到前所未有的重要地位。

1980年代,托夫勒在《第三次浪潮》一书中超前地提出了信息社会的来临,并直接提出了大数据的概念

,贝尔也在其《后工业社会的来临》一书中宣告工业社会行将结束,信息社会即将来临。20世纪末,美国总统克林顿提出“信息高速公路计划”,将信息网络建设纳入国家计划中。比尔·盖茨则在其《未来之路》中描绘了未来网络世界的前景,而尼葛洛庞帝则在其《数字化生存》中直接憧憬了未来数字化生活的状态。这些信息革命的先知们都在告诉我们:信息社会即将来临。如今大数据时代的到来可以看作是信息社会的真正降生,是信息社会预言的真正实现。

与以往的小数据相比,现在的大数据有如下四个特点,有人将其简称为4个“V”:[6] 第一,Volume(大量),即数据数量巨大。从TB级别,跃升到PB级别(1TB=1012bt,1PB=1015bt);第二,Variety(多样),即数据类型繁多。除了标准化的结构化编码数据之外,还包括网络日志、视频、图片、地理位置信息等等非结构化或无结构数据。第三,Value(价值),即商业价值高,但价值密度低。在数据的海洋中不断寻找,才能掏出一些有价值的东西,被形象地称为“沙里淘金”。第四,Velocity(高速),即处理速度快,实时在线。各种数据基本上实时、在线,并能够进行快速的处理、传送和存储,以便全面反映对象的当下状况。

随着大数据时代的来临,我们的工作、生活和思维方式都产生巨大的改变,甚至彻底改变我们的世界。英国大数据权威维克托?迈尔-舍恩伯格在其畅销书《大数据时代》中预言:“大数据开启了一次重大的时代转型。就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,而更多的改变正蓄势待发……”。[7]1

3 复杂性科学与大数据技术的特征比较

复杂性科学的兴起与大数据时代的来临看似好像两件不相干的历史事件,但它们先后兴起并交替发展,应该存在一定的相关性,为此我们先看看它们的特点,然后进行一些比较并从中发现它们之间的关系。

复杂性科学刚刚兴起就被人认为是一场科学革命,并代表着21世纪科学的方向。它为什么能获得如此高度的评价呢?这是因为复杂性科学在本体信念、认识趣向、价值观念、方法特色等诸多方面都与传统的简单性科学有着重大的差别,从简单性科学到复杂性科学是科学范式的革命,因此复杂性科学必然具有自身的特点。关于复杂性科学的特性,不同的学者有不同的看法,但它主要表现为以有机自然观的为前提,以非线性为核心,并由此推演出复杂系统的整体性、自主性、关联性、涌现性和多样性等特性。[1]71

复杂性科学不再像

简单性科学那样把世间万物都看作没有生命力的机械,而是把万事万物都看作具有自身生命和活力的有机体,因此这个世界充满着勃勃生机,不像机械自然观描述的那样一个死寂的世界。由于每个生命体都有自己的独特个性,会按照自己的方式思维和行事,因此并不会完全按照刺激的大小成比例地做出响应,因此在生命世界里,非线性具有普遍性,而线性只是非线性的特例,而且复杂性的整体性、自主性、关联性、涌现性和多样性等特性都是由于非线性引起的。

由于非线性的存在,复杂系统的任何局部信息都不可能代表着全局。如果要对复杂对象进行真正的把握,就必须以整体、全局的观点来进行,因此面对复杂系统,我们必须树立全局视野,整体地把握对象,而不能像线性系统一样可以由解剖局部而知全局,析一发而知全身。复杂性科学认为,构成复杂系统的各种要素都有自己的目标和行为,具有自己的自主性和主动性,不像机械系统一样只会被动接受,所以复杂性科学权威霍兰将其称为“适应性主体”或“主体”,以强调其主动性与适应性。在复杂系统中,各要素之间紧密相连,存在着各种各样的复杂联系,而且它们之间的联系不一定呈直接的比例关系,因此在复杂性科学视野看来,万事万物都是相互联系的,事物之间构成复杂的关联网络。由于各要素都具有自主性,并且存在非线性相互作用,从时间上来说不同的时刻具有不同的状态,从空间上来说不同的空间也具有不同的状态。因此,复杂系统在时间上呈现出的系统涌现性,即不断有新结构、功能或状态出现;在空间上呈现出系统的多样性,即在不同的空间,系统的结构、功能或状态也不一样。

大数据是一场数据技术的大变革,它刚来临就被认为是一场真正的技术革命,并被预言即将带来工作、生活和思维方式等全方位的影响。舍恩伯格用“更多、更杂、更好”简洁地描绘了大数据技术的思维变革。[7]17-20所谓“更多”,就是力求掌握与研究对象有关的更多数据,可谓多多益善。在小数据时代,由于是线性关系,只要有少量数据就能把握全局。如果数据太多,由于处理能力有限,我们必须采用抽样技术来进行抽样处理,将大量数据简化为少量数据。在大数据时代,由于网络和分布处理技术的进步,再大的数据量都有能力处理,因此要求尽其所能收集所有数据,以便更充分反映研究对象各种微观细节。因此,大数据时代追求的“不是随机样本,而是全体数据” [7]27,而这所有数据正好刻画了研究对象的整体,因此所谓“更多”其实就是复杂性科学中整体性的科学描述



所谓“更杂”,就是允许各种各样的数据存在,并不要求整齐划一的格式。在小数据时代,数据来源和处理数据都不容易,因此要求所有数据都按标准格式进行收集和处理,但在大数据时代,收集数据和处理数据都特别便捷和容易,而且往往是泥沙俱下,因此相关数据复杂多样。在大数据时代,我们追求数据的“不是精确性,而是混杂性”[7]45,而这里所谓的混杂性就是复杂性科学中所谓的多样性的体现。

所谓“更好”,就是不像小数据时代那样,万事都追问“为什么”,总想弄清事物之间的微观因果关系,而是只要存在的就是合理的,只问“是什么”,不问“为什么”,对事物之间的关系不要求弄清因果细节,只追求那些宏观上会引起变化的数据之间的关联关系。因此,在大数据时代,我们追求的“不是因果关系,而是相关关系”。[7]67这里的相关关系正好反映了复杂性科学中的所谓关联性和非线性特征。

由舍恩伯格所描述的大数据之三大变革可以看出,大数据技术所反映的特点与复杂性科学的特点几乎是一致的。我们只要略加推导,就可以证明两者之间的等价性,因此复杂性与大数据具有强相关关系。我们可以说,复杂性科学与大数据技术在世界观、认识论和方法论诸多方面都是相通的,皆属于同一科学范式之中,都是系统科学体系这个大家庭的成员。

4 大数据技术是复杂性科学的技术实现

虽然复杂性科学与大数据技术属于同一科学范式,但它们分属于不同的层次,复杂性科学属于科学的范畴,而大数据技术属于技术的范畴,它们有着本质的区别。

从科学技术史来说,科学与技术的发展并不完全平衡,而是往往表现为交错性。在近代科技革命以前,科学与技术基本上属于独立发展,相互之间很少有交错。第一次科技革命开始,科学与技术之间有了交集,不过往往是技术发展在先,而科学认识在后。从第二次科技革命开始,科学与技术就完全交错在一起,而且往往科学发展在先,然后科学思想慢慢技术化,从而实现科学推动技术。二战以后,科学和技术很难分出先后,往往是相互激励,相互促进,并行发展。

复杂性研究虽然也有不同层次,从哲学到科学,然后是技术与工程,但世纪之交的复杂性研究更多地侧重于哲学与科学层面的研究,因此我们更多时候将其称为复杂性科学。大数据研究也有不同层次的研究,有大数据哲学、大数据科学、大数据技术和大数据工程等,但当前的大数据研究更多地侧重于技术与工程层次的研究,因此我们往往把大数据研究称为大数据技术。从本文第一部分与第二部分对复杂性

科学与大数据技术的历史回顾中可以看出复杂性科学与大数据技术虽然思维方式上基本一致,思想认识上有交叉,但科学家与工程师们分属于不同学科层次,因此并没有形成研究共同体。从发展历史来看,复杂性思想起源于系统思维,所以应该比大数据思想兴起更早,且不说追溯到马克思恩格斯,就从贝塔朗菲来说,也起步于20世纪初期。随后经历过所谓的“老三论”、“新三论”等几个发展阶段,最后在圣菲研究所的催生下,复杂性科学研究于世纪之交蓬勃发展起来。大数据研究主要与二战之后的计算机研究紧密相连。计算机发展早期,数据的地位并没有凸显出来,那时的数据只是计算机需要处理的对象。随着计算机技术的发展,软件、数据逐渐凸显并先后成为独立于计算机硬件的重要构件。特别是世纪之交计算机网络的彻底形成与智能设备的广泛应用,数据才被提高到前所未有的地位,并成为当前大数据研究的导火索。

复杂性研究与大数据研究的过程中,两种看似独立发展着,实际上通过计算机和网络技术,两者早就难解难分,只是一个属于科学阵营,一个属于技术领域,并且有时还说着不同的行话,因此其交错性还没有完全凸显出来。从科学技术的关系来说,两者之间是难于分离的。技术脱离科学思维是瞎子,而科学脱离技术实现就是跛子,或者说,没有技术实现的科学是空洞的,而没有科学指导的技术是盲目的。复杂性科学研究在世纪之交的20多年时间里曾经发展得轰轰烈烈,被迅速被称为21世纪科学发展的方向。但是由于复杂性研究主要集中在哲学与科学等思想、思维、认识层次,因此更多的是对科学家的思维方式产生了一定的影响,而对大众的工作、生活影响不大,对社会、经济和产业也还没有形成很大的冲击。换句话说,复杂性科学的兴起对哲学与科学思维产生了巨大的反响,但对大众工作和生活改变不大。但是,大数据技术的兴起就完全不同。刚刚开始,人们就感觉到了大数据的冲击力,甚至将彻底改变我们的日常工作方式和生活方式,当然由此也就改变着我们的思维方式。由于没有技术的支持,复杂性难于对日常生活产生影响,因此复杂性运动近年来有了衰落之势,并被人嘲讽为混杂学。如今,大数据技术继承了复杂性科学的新思维,并将复杂性的思想物质化、技术化和工程化,从而让复杂性科学思想发扬光大,并对日常工作和生活方式产生革命性的改变。我们可以说,复杂性是大数据技术的科学基础,而大数据是复杂性科学的技术实现。

结语

复杂性科学与大数据技术是21世纪的科学和技术革命,这两

者之间看似不甚相干,但深入研究后发现,两种之间具有深刻的关联,两种在本体信念、认识趣向、价值观念和思维方法上都是一致的,都属于系统科学技术的范式之中。复杂性科学为大数据技术的发展奠定了科学的基础,而大数据技术让复杂性科学思想得到了技术的实现,从而对社会经济、日常工作、生活方式、思维方法都产生大变革。可以说,从复杂性科学到大数据技术的发展是一种历史的必然,是系统思想的逻辑发展。因此,如果将大数据研究与复杂性研究结合起来,形成一个协同的学科体系,必然会相互促进,共同发展,并对社会经济和工作生活产生更大的影响。

参考文献

[1]黄欣荣.复杂性科学的方法论研究[M].重庆大学出版社,2011.

[2]笛卡尔.谈谈方法[M] .商务印书馆,2000:16.

[3]黄欣荣.恩格斯的复杂性思想及其当代价值[J] .湘潭大学学报(哲社版),2013(4):96-99.

[4]涂子沛.大数据—正在到来的数据革命[M].广西师范大学出版社,2013:57.

[5]Luciano Floridi. Big data and their epistemological challenge [J]. Philos. Technol., 2012(25):435-437.

[6]李德伟,等.大数据改变世界[M].电子工业出版社,2013:7.

[7]维克托?舍恩伯格,肯尼斯?库克耶.大数据时代[M].浙江人民出版社,2013.



作者:黄欣荣,全文见长沙理工大学学报,2014(2)

相关文档
相关文档 最新文档