正如工业时代产生了热力学定律,我们需要关于复杂性的普世法则来解决看似无法解决的问题。
当世界变得更加复杂和彼此关联,一些困扰我们的大问题开始变得无法解决。我们该如何应对金融市场的不确定性?我们如何预测能量的供给和需求?气候将如何变化?如何应对快速进展的城市化?用来解决这些问题的老办法通常是定性的、脱节的,容易产生意料之外的后果。为了科学严谨地应对时代的挑战,我们需要具备对于复杂性本身的深入理解。
这是什么意思呢?复杂性来自于许多零散的部分相互之间以各种方式进行的互动,这些互动导致了整体自身具备了“生命”:随着条件的变化,它不断适应和演化。它看上去容易受到突然的、看起来无法预测的改变–市场崩溃是一个经典的例子。一个或多个趋势可以通过“正反馈循环”的方式加强其他的趋势,直到事情突然变得失控;突破临界点之后,它的行为变得非常激烈。
“复杂系统”之所以如此令人头痛,是因为无法从其零散的基础部分去预知、推测它的共同特性:整个(复杂系统)要优于且完全不同于各个部分的总和。一个城市系统,远比将城市中的建筑和人加起来要复杂得多。我们的身体系统,比我们把身体里所有的器官合起来复杂得多。这一特性,被称之为突现行为,而经济,金融市场,城市社区,有机体,互联网,星系,以及卫生保健系统这些诸多因素,都在决定着突现行为的行为特性。
数字革命驱使着复杂性系统的应用越来越广泛,与此同时数字革命还掌控着我们现在的生活节奏,但这项技术同样带来了一个机会。移动电话、电子化交易、个人医学调查以及通过电子技术联接实现的“智能化城市”概念等事物的普及,已经为我们提供了大量的数据。通过使用新的计算方法和技术来挖掘和解读这些大量且相互联系的数据库,科学领域、技术领域、商业领域和政府领域的研究者和实践者们,得以解决以往无法构建定量分析的难题。社会中的合作机制是如何出现的?促进创新的条件究竟是什么?矛盾是如何传播和激化的等问题?针对这些难题,研究者和实践者正着手建立大规模的模仿机制和模型,进行研究分析,进而解决。
麻烦的是,我们并没有一个标准的,概念上的框架来界定关于复杂性的诸多问题。我们不知道我们究竟需要多少数据,需要哪些种类的数据,甚至不知道我们究竟该提出一些怎样的批判性问题来丰富复杂性系统。没有“大理论”所伴随的“大数据”缺乏发展的潜能和实用性,并在不知不觉中产生了让我们始料不及的后果。
在工业时代,社会强调对能源的关注,源于工业的表现形式——与蒸汽、化学、机械等相关,作为对这种关注的回应,热力学的三大定律诞生了。我们现在需要反问自己,如果我们(大数据)的时代来临了,我们能否提出关于复杂性的定律,将信息归纳成一种能源,与之前的蒸汽、化学、机械等因素并列。在金融市场、人口、生态系统、战争与矛盾、大规模传染与癌症等等问题中,异乎寻常的多样性,历史的偶合性和相互关联性无处不在,而在这背后的潜在原理又有些什么?可以想见的是,复杂性系统的数学模型将会基本涵盖所有关于复杂性系统中的动力学和组织,将其融入一个量化、可计算的框架结构中。
我们也许永远都不会去做关于复杂性系统的细节研究,但是那些引导我们进入(复杂性系统中)潜在特性的量化研究的,如同木纹般粗糙的细节,却尽在我们的掌握之中。我们无法预知下一次金融崩溃发生的时间,但我们应该能够预测下一次金融崩溃发生将会在未来的几年间。(复杂性系统的)研究领域处于各个科学学科的综合体中心,它能够将碎片化和专业化的趋势进行反转,也能够探索出一个更加统一的、整体的框架对大的社会问题进行跟踪研究。人类的未来也许会因(复杂性系统的研究)而更好。
翻译丨 梁夏&王成军
英文原文载自《科学美国人》http://www.scientificamerican.com/article/big-data-needs-big-theor