大数据把人类带进怎样的新 解放

王天恩教授:大数据将把人类带进怎样的新世界
王天恩 上海大学社会科学学部教授,美国罗格斯大学和佐治亚理工学院高级访问学者,主要研究领域为马克思主义哲学时代化。在 《中国社会科学》《哲学研究》 发表多篇学术论文和文章。著有《理性之翼》《在过去和未来之间》《微观认识论导论》《历史的逻辑》等专著。主持多项国家社科基金课题,本演讲为国家社科基金重点项目“大数据相关关系和因果关系研究”(17AZX003)的阶段性成果。
——王天恩教授在中国自然辩证法研究会党校系统专业委员会2017年学术年会的演讲
1998年,“大数据”概念首次出现在美国《科学》杂志中。近20年来,大数据浪潮一波波向世人扑面而来。有人形容,大数据就像一片无边无际的大海,海面一浪高过一浪,而浪潮之下深不见底。
大数据的核心口号是量化世界,量化世界为创构世界奠定了基础。在大数据的基础上,物数据化和数据物化构成循环。这是因为,物数据化事实上就是物信息化,数据物化实质上就是信息物化。随着现代信息技术的发展,创构活动及其产物与人的存在方式越来越密切地联系在一起。
这里涉及一个新的重要概念:信息。在控制论创始人维纳看来,“信息就是信息,既不是物质也不是能量”。这个定义看上去像是同义反复,却富有深意。比如,物能复制成本呈正比增加,而信息复制的边际成本递减;物能越分享越少,而信息越共享越多。信息的这些重要性质,在作为样本数据的小数据时,显示不出重要性;而在大数据基础上,则变得非同寻常。在大数据的基础上,信息会对人类的文明发展产生极为重要的影响。
面对大数据打开的这扇大门,我们不能不深入思考:这将是怎样的一扇门,又会把我们带进一个怎样的新世界?
■ 面对一张拍好的平面照片,再要换个角度去观察已不太可能。大数据则几乎保留了全纬度。面对大数据,我们可以从不同的角度进行考察。作为样本数据,小数据是“残缺”的。就像尼采说抽象的概念是“干枯的标本”,样本数据和抽象概念的共同特点都是已经“失活”了。而大数据意味着活数据(动态数据)、全数据
■ 对于大数据来说,信息是活的,是随着时间而流动的。高速的数据流更能在时间上与现实过程同步,因而跟人类的生存密切联系在一起。不仅如此,只有高速流动的数据,才能提供无限的可能性。以往受速率限制,人们获得的数据和所要反映的内容往往脱节,而数据流的高速率使我们把握对象的手段越来越完善
■ 有人提出,大数据的价值密度低,数据挖掘相当于“沙里淘金”。其实,对于同一个结构开放的大数据,一些人可能视其为一堆垃圾,毫无意义;而在另一些人看来则会是一座宝库,价值连城。大数据的价值和意义,很大程度上取决于人们的理解,取决于人们的眼光。归根结底,取决于对人的需要及其发展的理解和把握
■ 信息文明的发展,是一个在大数据基础上的公共信息对称化过程。这就要求,为推动信息文明的发展,必须在公共领域尽可能消除信息不对称。同时,为保持信息文明发展的动力,必须尽可能保护创新专利。这很可能是时代发展的必然趋势。对此,人类社会应当提前进行思考,即如何避免新的社会不公平的出现
关于大数据的具体特征,可以用4个“V”来描述
在技术定义上,大数据最主要的一个着眼点是规模大。但是,大数据的关键性质不主要是规模大,而是完全不同于作为样本数据的小数据。通常,样本数据的获取总是会先设定明确甚至单一的目的。这种取样,一方面可以更好地实现采样前预设的目标,另一方面也抹去了其他的可能性。
大数据的另一个重要性质是维度全。通常,我们拍照会选取一个角度。角度一取,数据就固定了。面对一张拍好的平面照片,再要换个角度去观察已不太可能。大数据则几乎保留了全纬度。面对大数据,我们可以从不同的角度进行考察。作为样本数据,小数据是“残缺”的。就像尼采说抽象的概念是“干枯的标本”,样本数据和抽象概念的共同特点都是已经“失活”了。而大数据意味着活数据(动态数据)、全数据。
关于大数据的特征,最早是用3个V来概括的。几年前,人们认为“3V”不足以描述大数据的特征,又提出了“4V”的描述,即volume、variety、velocity和value。
“volume”一般理解为大量。大数据首先意味着数据量巨大。小数据时代主要由人工创建数据,大数据时代则由机器、网络和人类相互作用生成。大量是大数据的基本特征,但往往被误以为大数据就是大。事实上,这个特征所表达的是大数据规模的整全性。大数据的“大”不是纯粹量的概念,关键是全,是一个质的概念。
“variety”一般理解为多样。这包括大数据来源的多样性和类型的多样性,也包括数据结构的多样性。由于数据结构的多样性和复杂性,大数据的这一特征还意味着数据结构的开放性。举例来说,大自然可以满足人类的生存需要,但我们面对大自然时的作为很有限。而大数据不一样,在以人类需要为出发点的大数据挖掘中,人类可以在这一个无限空间中进行满足自己需要的创构。
“velocity”一般理解为高速。它不仅仅是指技术设备的数据处理速度,更重要的是指实时数据流。样本数据在取样后就是冻结的,而大数据可以实时获取所需信息。对于大数据来说,信息是活的,是随着时间而流动的。正因为如此,对于实时数据流来说,速率就特别重要。高速的数据流更能在时间上与现实过程同步,因而跟人类的生存更密切地联系在一起。不仅如此,只有高速流动的数据,才能提供无限的可能性。以往受速率限制,人们获得的数据和所要反映的内容往往是脱节的,而数据流的高速率使我们把握对象的手段越来越完善。
“value”用以描述大数据的价值。大数据价值特征的重要性不言自明,但大数据也十分复杂。据此有人提出,大数据的价值密度低,数据挖掘相当于“沙里淘金”。其实,对于同一个结构开放的大数据,一些人可能视其为一堆垃圾,毫无意义;而在另一些人看来则会是一座宝库,价值连城。大数据的价值和意义,很大程度上取决于人们的理解,取决于人们的眼光。归根结底,取决于对人的需要及其发展的理解和把握。
显然,这是一个典型的哲学课题。随着大数据的发展,不仅哲学等各学科会越来越相互融合,而且将迎来哲学与科学、社会和生活一体化发展的时代。
沃尔玛的两个案例,开启大数据应用广阔前景
大数据究竟是垃圾还是宝库,涉及的是大数据的应用问题。换句话说,既然大家都认为大数据是个好东西,是个有用的东西,那它到底该怎么使用呢?
就目前而言,大数据应用仍然是一个重要而前沿的话题。其中,大数据中的相关关系和因果关系,是大数据应用和分析研究中的重要问题。大数据凸显了相关关系的巨大魅力,同时也构成了对传统因果观念的冲击。
跨国零售企业沃尔玛“啤酒和尿布”的故事,就是人们津津乐道的大数据应用的一个经典案例。沃尔玛在大数据基础上,用“购物篮方法”分析消费者购物行为时发现,一些男性顾客在购买婴儿尿布时,常常会同时买几瓶啤酒。原来,美国家庭生了小孩,一般是母亲在家照顾孩子、父亲外出采购。而年轻父亲在购买尿布时,常常会顺便给自己买上几瓶啤酒,既解乏又喜庆。由此,沃尔玛推出啤酒和尿布摆在一起的促销方式,吸引了更多有这种需要的顾客前来购物,尿布和啤酒的销量都得到大幅增加。
大数据相关关系在类似行业的成功应用,使一些人提出还要不要深究因果关系的问题。一些极端的观点甚至认为,大数据是关于“是什么”而不是“为什么”的;大数据会自己说话,因而只要相关关系不要因果关系。这种观点显然是兴奋于大数据令人惊叹的实用性。但理性来看,大数据不仅把握相关关系,而且把握作为其根基的因果关系。
“蛋挞和手电筒”就是一个典型的例子。与“啤酒和尿布”案例一样,沃尔玛的大数据表明,很多人在买手电筒的同时还会购买蛋挞。因而,根据这一消费相关性,沃尔玛决定在货架上把这两种产品摆放在一起。但是,如果知道其背后的因果关系,相关销售效果显然会更好。有人发现,人们同时购买手电筒和蛋挞的因果关系涉及北美飓风。原来,飓风来临前人们既需要准备手电筒,又需要准备食物。不过,北美飓风是季节性风暴,如果只知道相关关系而不知道因果关系,就可能一直把手电筒和蛋挞这两类不同商品放在同一货架上。而知道背后的因果关系后,就可以在飓风来临前把蛋挞和手电筒放在一起,而且还可专设飓风用品区域。这样一来,销量显然会大为增加。
可见,只要相关关系、不要因果关系的观点,很容易驳倒。其实,真正关键的问题不在于是相关关系还是因果关系哪个更加重要,而在于怎么理解相关性和因果性之间的关系。
一般来说,传统因果观仅反映日常生活和经典物理学中因果关系的表观现象。这样的因果模型,不仅不能理解大数据的相关关系,而且不能建立起大数据相关关系和因果关系的关联。只有把原因看作因素相互作用的过程,把结果看作因素相互作用过程的效应,才能扩展对因果关系的理解,从而适用于大数据相关关系和因果关系问题的认识。由此建立起来的新因果模型具有内容丰富的结构,呈现出因果模型的过去时态、进行时态和未来时态。它不仅有利于人们理解凝固的因果关系,而且在人们面前敞开了创构未来的广阔空间。显然,这种新的因果关系与现实社会更加接近。
人类将更多与信息打交道,而不是传统的物能
如果把以往的文明形态都看作物能文明的话,那人类社会发展到大数据时代所迎来的,则是一种不同于物能文明的信息文明。作为一种与物能文明相平行的文明形态,信息文明是一种基于信息本性的共享文明。在大数据的基础上,信息的共享本性可以充分展开。
而且,信息文明的发展,是一个在大数据基础上的公共信息对称化过程。这就要求,为推动信息文明的发展,必须在公共领域尽可能消除信息不对称。同时,为保持信息文明发展的动力,必须尽可能保护创新专利。
作为一种人类文明,信息文明是一种基于信息机制的役物文明。在信息文明时代,人类通过信息控制物能,进而使物质通过结构的调整,由一种对人类不那么有价值的材料变成价值更大的材料,从一种不太能满足人的需要的形态变成一种更能满足人的需要的形态,使能量从难以利用的形态变成更容易获得和利用的形态。由此,人类活动更多是直接与信息打交道,而不是传统的与物能打交道。
作为人类文明发展的更高阶段,信息文明还是一种基于信息创构的人性文明。不仅对物能的控制达到全社会甚至全人类实现“物为人役”的水平,使人类活动从以描述认识为主进入到以创构认识为主,而且也意味着全面解放创造力,即人性获得越来越高水平的解放。
大数据打开了信息文明大门,也将释放一系列新的重要问题。这些重大的问题,既涉及个人生活,也涉及社会发展。
一是信息生态问题。由于人越来越以信息方式存在,信息生态理所当然成为一个越来越重要的基础性问题。对人类来说,自然生态或者说物能生态具有切身性,而信息生态不仅具有切身性还更具“切心性”,更切近人的心灵。因此,在自然生态的基础上,信息生态将日益为人所密切关注,成为信息文明时代关乎人类发展的问题。
二是人的存在意义问题。没有物能就没有信息的存在,物能存在是基础。但在信息文明时代,如果一个人仍然主要以物能方式存在,仍然以基于物能的感官享受作为生活意义的主要来源,仍然主要滞留于物能存在方式,那很可能将成为无意义的人群。
在信息文明时代,人类的活动主要是信息活动。只有主要以信息方式存在,并且以创构活动作为自己主要活动方式的人,才能进入意义生产的领域。在这个意义上,信息文明的确意味着一种分化:相对无意义的人群和生产意义的人群。这很可能是信息文明时代发展的必然趋势。对此,人类社会应当提前进行思考,即如何避免新的社会不公平的出现。
三是国家的发展问题。从人类社会发展史可以看到这样一个重要事实:一个大国的真正崛起,通常要引领一种新的文明。信息文明时代的到来,必定伴随着大国的新崛起,不管是现实的还是潜在的大国。在21世纪,中国要和平发展、成为真正的世界大国,有必要在引领信息文明上发力。
总之,如果不能够引领信息文明发展,一个国家就不可能真正实现大国崛起。在这个过程中,国家的兴衰与个人的生存发展不仅联系在一起,而且构成相互依存、协同发展的循环。
责任编辑:
声明:本文由入驻搜狐号的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场。
今日搜狐热点大数据带来社科研究新变化(学苑论衡)
李&&文&&邓淑娜
日08:26&&&来源:
  近年来,云计算、物联网、移动互联网的广泛应用,把人类社会带入大数据时代。大数据的产生和运用,使我们能够对置身其中的社会进行更加广泛和深入的认知、更加客观和准确的把握,从而以更精确的语言、更精密的思维加以描述、解释和界定,以更加科学、更加有效的方法进行治理。
  全面真实展现社会面貌
  大数据深刻影响和改变研究社会问题的方法,使社会科学研究领域发生深刻变化。美国学者杰弗里?汉考克认为,大数据对社会科学研究的意义,堪与显微镜的诞生对化学发展所起到的促进作用媲美。
  过去,社会科学研究数据主要来源于田野调查和采访,受调查成本和可操作性等因素的限制,获得的数据数量和质量都十分有限。计算机及网络技术兴起后,社会科学研究除了依赖一手的调查数据,还可借助各类专业数据库,但这些数据的准确性、真实性和全面性依旧存在不尽如人意之处。
  大数据能够为研究者提供前所未有的海量和高质量的社会数据、资料和信息。利用这些数据和数据挖掘技术,研究者能够深入观察和分析人类社会的复杂行为模式。
  “一个时代的特征在很大程度上与该时代的数学密切相关。”(美国学者莫里斯?克莱因语)网络化和数据化使社会环境更加公开和透明。民众、企业和政府都处在互联网环境中,一切行为都会被记录、分析和预测。智能手机和计算机用户、政府机构、统计部门及大型企业、网络平台数据监控等,构成数据增长的重要来源。现今,全球有约30亿人使用互联网,我国网民规模达6.68亿,手机网民规模达5.94亿。这些人每天收发的信息,以及与这一收发过程相关联的信息,都会变成可揭示人的行为以及人与人之间关系的数据并被存储。信息技术与各行业的深度融合,科技、商业、教育、医疗、智能交通、智慧环保、智能家居、智慧城市建设等社会生活的各个领域,也无时无刻不在产生大量数据。这些开放、流动的数据,成为人们观察社会行为的“显微镜”,帮助研究者直接利用更加全面、真实的资料进行研究,捕捉以往难以获取的关系和知识。
  大数据使社科研究更加方便、快捷、全面和深入。研究者坐在屏幕前就可以接入数百万的互联网用户资料,这也使他们不再满足于得到部分信息,而是倾向于收集对象的全部信息。有别于传统计算技术,数据挖掘技术使研究者能够快速处理海量数据,信息资源得以高度整合,在最大程度上得到利用。
  探索未知世界的新方法
  大数据的应用使社科研究者得以避免主观臆断的局限,有效提高研究的客观性和科学性。
  传统实证研究是一种自上而下的决策和验证过程,其特征是研究者在理论分析的基础上提出假设,之后通过调查和数据分析来验证假设。其不足或缺陷在于研究者本人的经验、见识、认知和判断决定了研究成果的方向与深度,被调查者也只能回答访谈和问卷提出的问题,调查结果自然局限在研究者的视野之内。
  大数据的应用将研究者的视野有效扩展到个人经验、见识甚至想象之外。大数据的海量信息在时空上具有传统抽样数据无法比拟的广度和深度,其全样本的性质能够在最大程度上避免个人经验有限性对研究过程客观性的负面影响。研究者不仅能通过对大量数据实时、动态的监测与分析来解决社会问题,更能通过这些海量数据来思考、设计和实施研究计划;可以通过数据的相关性测量揭示事物的本来面目,发现规律和展示规律,提炼出重要的理论。
  数据挖掘为研究者提供了深入分析和有效利用大数据的手段。数据挖掘的特性在于,它不是用于验证某个假定模型的正确性,而是在数据库中自己寻找模型,本质上是一个归纳的过程,并不需要假设或期待可能的结果,从而突破了研究者的视野局限,扩展了人类的经验范畴。通过数据挖掘技术,研究者能够从海量数据中搜索和发现信息与知识,找出存在于数据中的潜在关联和规则。
  以大规模数据分析为特征的研究方法的广泛应用,使社会科学的科学性显著提升,学科融合趋势进一步增强。大数据的获取和分析,需要有别于传统社会科学的方法和工具,从而使在计算机、人工智能甚至物理、数学等领域具有专长的学者在社科研究领域有了大显身手的机会,如小世界网络研究者邓肯?瓦兹原先就是物理学家。近年来,发表在英文刊物上的基于谷歌图书、维基百科等大数据的语言学、经济学研究论文,其作者队伍不断有计算机领域的研究者和自然科学家加入。此外,由于大数据为社会科学提供了全新的分析对象,学术界越来越认识到交叉学科的重要性。“计算社会科学”兴起,就是一个生动事例。
  大数据带来社会分工形态的变化,加速了认识世界和改造世界相统一的进程。研究者和生产经营者、社会治理者之间的距离不断缩小,各行各业越来越依赖大数据开展工作,杰出的经营与治理越来越依靠杰出的数据分析。目前,全球大数据应用在互联网、零售、电信、金融、地理信息科学、教育、医疗、交通等诸多行业创造了巨大的经济价值,并且将信息转化为了解世界、市场、人自身的知识与智慧。由于大数据的分析结果更可靠,在社科研究诸多领域特别是对策性研究领域,社会科学研究者与专业数据公司的合作已经成为重要趋势。
  增长新知识新智慧
  西方有人说,“有些事情我们知道我们自己知道,有些事情我们知道我们自己不知道,更有些事情我们不知道我们自己不知道。”大数据不仅使社科研究者知道以前“不知道”的事情,而且能把研究者带入一个“不知道自己不知道”的世界。
  随着大数据思维与分析技术的深入发展,社会科学研究能够通过片段数据、海量数据、非结构化数据的采集、梳理与分析,通过碎片重组,深度揭示以往难以处理或无法预知的难题和关系。我国警方通过大平台、大数据和大联动打击信息诈骗犯罪,来自各个领域的联盟成员协同攻关,一起对大数据进行挖掘分析,从中观察到大量之前单靠个体和单个数据库难以发现的联系。如确认某个诈骗电话号码后,联盟中成员马上就可以根据这个号码发现骗子的踪迹。从前隐藏在各个数据库中的犯罪片段,在数据挖掘技术的作用下一块块地拼接起来,形成比较完整的踪迹路线图。据此,公安部门可以马上组织精准侦查,银行或电商网站可以马上阻止骗子注册开户,运营商等可以马上通知和阻止潜在受害用户转款。
  基于概率以及可能性的实证和经验研究正在被数据分析报告和专项预测研究所取代。通过大数据和数据挖掘,研究者进入一个全新的领域,在那里能够发现诸多颠覆直觉和常识的信息与联系,为预见未来提供更加可靠的依据。这种预见是一种自下而上的知识发现过程,是在没有理论假设的前提下去挖掘信息、发现知识、预知事物发展的规律和趋势,从而更具有科学性、有效性和实用性。近年来,研究者在许多社科领域运用大数据取得了突出成果,如通过海量自然语言表达观测公众的政治参与意识,预测大选结果,等等。
  大数据对打击恐怖主义具有重要意义。大数据技术通过对人脸、声纹、语音数据、资本市场内幕交易等信息的分析,综合利用恐怖分子平时产生的各种信息,包括通话、交通、电子邮件、聊天记录、视频等,能够使官方对恐怖行为进行事前预警和事后分析排查。据报道,在波士顿马拉松爆炸案中,美国中情局通过采集移动基站的电话通讯记录,附近商店、加油站、报摊的监控录像,以及志愿者提供的图片和影像资料等各种数据,最终锁定嫌疑犯并找到炸弹来源。
  以大数据生产、分享、使用为代表的科技革命,正在使人际关系、个人与社会的关系、个人和社会与政府的关系以及国家之间的关系,发生历史性变化。以国际关系为例,大数据的出现有助于国家间摆脱传统思维模式和固有偏见的局限,使一方对另一方的认识和了解更客观、全面、准确、深刻。一方对另一方能够进行更全面的分析,做出更清晰、准确的判断,可以有效减少误判和安全困境的发生;通过大数据分析对方的战略意图与本国的利益得失,可引领双方朝着有共同利益的方向加强合作,实现互利共赢。
  (作者为中国社科院亚太与全球战略研究院副院长、研究生院信息网络中心主任)
  《 人民日报 》( 日 15 版)
使用微信“扫一扫”功能添加“学习微平台”
(责编:朱书缘、谢磊)
热点关键词
热门点击排行榜
12345678910[思客讲堂] 大数据带来“弯道取直与换轨”的新机遇
涂子沛、陈刚、张跃在思客讲堂活动现场 姚冠华/摄
  4月27日,大数据专家、观数科技创始人涂子沛、贵阳市委书记陈刚、北京浩瀚深度信息技术股份有限公司总裁张跃应邀做客《思客讲堂》,共同探讨大数据带来的新经济模式,数据如何开放与管理,大数据技术将给中国社会带来的挑战和新机遇等话题,现场讨论“火花四射”,各种精彩观点层出不穷。本次活动由思客与观数科技、北大国发院博士论坛联合举办。
开放数据,政府应该走在商业机构前面
  思客:BAT拥有大量的数据,而且是他们的核心竞争力。涂老师,您曾担任阿里的副总裁,假如您是马云,会开放数据吗?
  涂子沛:事实上,阿里一直在开放数据。开放数据首先是公共部门先开放,然后是商业机构。所以,公共部门应该做领头羊。贵阳在这方面做了很好的工作。 但是阿里不可能全部开放, 因为涉及到商业竞争,这部分数据是商业机构投资,然后他搜集的数据。他有所有权,所以他可以拒绝开放,可以封闭。但是开放有很多层次,可以说向整个社会开放,也可以向一个人开放。比如阿里向个人开放,我想看个人的消费记录能不能看,中国正逐步向这个方向前进。我希望看到的是公共部门在引领数据开放,而不是商业机构。如果是商业机构在引领中国的数据开放,那我们的公共部门就缺位了。
图为新华网董事长、总裁田舒斌与嘉宾在“数据化生活与共享经济”思客讲堂现场。姚冠华/摄
  陈刚:涂子沛的观点我是赞同的。政府在数据开放的方面应该走在前面。走在前面,我认为有两句话:第一,政府要搭建规则,搭建秩序,让数据有序的开放,让数据更安全的开放。第二,政府是目前社会最大数据拥有者,而这些数据来自于民,应当服务于民。在保护个人隐私的前提下,在保护社会公共安全的前提下,数据应当尽可能的开放。但是我们现在看到一个问题是什么?有不少的部门想开放数据,但是他不知道怎么开放。因为大家都知道,大数据是一个双刃剑,数据开放的同时意味着社会的风险。怎么样在数据开放的同时尽可能的保护隐私,保护社会的公共安全?这就是政府在数据开放中面临的一个问题。
  那么,我们贵阳推进开放,现在做三个层次:第一,先把政府数据开始共建,通过数据的共建,建立统一的数据标准和数据存放接口的互联,使得数据从产生开始就有共同的标准,共同的可使用的结构化的尺子。第二方面,可以实现政府部门数据的互通。现在出现许许多多的事情,就是因为政府之间的数据不通,工商填一个表,下一个部门还要填同样的表格。
涂子沛:开放数据首先是公共部门先开放,然后是商业机构。姚冠华/摄
  涂子沛:这是我回国亲历的一个事情。我租了一个房子去办证,拿了一堆的资料。现在政府把行政中心放在一起,柜台就是开放式的。我跟办电卡的说我要办电卡,他要我复印资料;我在这边办水卡的时候,那个人还要我再复印一套资料,这就说明这个数据完全没有连通。
  陈刚:他刚才讲的这个故事也不是贵阳的故事。实际上,政府部门之间数据要互通,我认为这是第二个阶段。最重要的阶段是政府的数据和社会共享。我认为最重要的一条,怎么样来共享,怎么样来有序的共享,怎么样共享产生的是正能量。
  在这个过程中,我认为政府需要探索数据有序开放的模式。我们现在讨论比较多的是抱怨政府数据不开放。其实政府有政府部门的担心,这个数据开放之后如果造成了隐私的问题,造成了公共安全的问题,谁来负这个责任。因此,数据开放需要一个加工再处理的过程。
  比如,把身份证号码、电话号码、住址去掉,然后把有价值的数据向社会开放。现在做的比较多的是停车场的数据,其实城市交通的数据就可以向社会开放。我知道有人比我的想法更聪明,如果用这些数据干一些不法的事情就会出麻烦。我们首先是契约式的开放。你是一个法人,是一个可以承担责任的人。我跟你签订约定,把数据有序的向你开放。你用这个数据可以服务于社会,也可以给自己的企业带来价值,这就形成有序的数据开放。
  政府的数据如何有效开放,现在还没有标准的答案和统一的格式。贵州作为大数据的综合试验区,我们有义务探索这个路径。
图为新华网副总编辑、主持人刘娟与涂子沛互动。姚冠华/摄
大数据时代,不要讨论所有权,而要讨论使用权
  思客:在数据有序构建的过程当中,政府在里面有很多协同的作用,包括很多政府部门和企业,您觉得这里面最大的难题是什么?
  陈刚:我觉得人类进入信息社会,大家都认为数据具有巨大的价值,甚至认为数据是未来社会的核心价值。现在围绕这个核心价值全链条的实现过程没有规则。比如,我作为淘宝的一般消费者,在淘宝上面买东西,我形成了我的浏览记录、消费记录,形成这个数据是谁的?阿里现在说是他的,我认为是我的。因为我花钱买东西了,即使我没有花钱买东西,我也花时间在网站上浏览。
  我们现在有一个共同的问题,数据的所有权归谁?我认为现在众说纷纭,如果一个东西的所有权都没有说清楚,价值链的产生谁来享有。人类社会还是很聪明的,现在有越来越多的共识,不要讨论数据的所有权是谁的,而是讨论这个数据的使用权是谁的。这个数据阿里发现了,阿里就有它的使用权,我想问阿里,你们下一次能不能把个人的消费数据在网上公布。我今天给淘宝提一个意见,淘宝在我们个人消费单子里面永远没有一个栏,计算累计消费的钱数,我想在软件设计当中有一个考虑,就想怕花钱太多不敢消费了。
  涂子沛:陈刚书记刚刚问的阿里问题,我可以反过来问陈刚书记,我在政府部门也留下了很多数据。那些数据我看到了吗?那些数据更加关键,是整个社会的基础设施,无数的商业机构。刚才陈刚书记说了政府是最大数据的拥有者,换句话说我们最大的数据就在政府,政府掌握了我们所有的数据,这些数据能分享给我们吗?我们今天也没有看到。
  还有,阿里巴巴其实做了一些工作。我们做的不够完美,但是我一直在做。每年年底的时候会出一个淘宝时光机,这件事情很了不起,把一年的消费记录全部分门别类做一个总结,有消费的总额。很多消费者拿到这个报告之后,有人反馈告诉我说,眼泪都流下来了,为什么?因为他一年的记录被精心的记录下来,精心的分析。数据能激活一个人的记忆,所有的记忆沉淀在那里,你的消费过程,可能花钱太多,有可能有喜悦,也可能有不高兴,在年终的时候看到一个这样的报表,所有记忆重现,给人感觉很好。我们要尽量做到“数据有温度。”
互联网伦理构架建立在数据共享的基础上
  陈刚:数据开放到底往哪里走,数据开放的规则和标准怎么制定,这不是阿里和贵阳市政府的事情,是全社会的事情。
  无论今天在现场,还是在互联网上的听众,你们在这样的社会中,也会有许许多多的信息泄露遇到的麻烦,事实上,这是全社会的问题。我认为在这个过程中,政府要发挥主导性的作用,就是政府来制定规则,引导秩序,甚至于应当在互联网建立伦理构架,这个伦理构架是建立在对数据的基本认识的基础上。所以,这一条路,我认为需要共同来探索。
张跃在现场提到,数据开放的核心问题是是否对开放者有利 陈杰/摄
  张跃:听了两位的讨论,深有感触。这正是互联网时代,包括大数据时代比较混沌的问题。我就说两点:第一,数据是谁的?这个非常简单,谁有能力就是谁的。你没有能力,就不是你的,你有能力就是你的。
  第二,数据的开放问题。这个问题既简单又复杂,如果片面的看就非常复杂,这里面有隐私问题和责任问题,而核心问题是不是对开放者有利,只要有利开放不是问题。
  商业有商道,社会上有伦理。可能有些问题也是我们这个社会共同承担的一个发展的历程。我觉得贵阳大数据的建立本身就是中国在互联网经济、大数据时代的一个路标性的事件,必定会成为历史的一个标杆的产物。
  我也特别祝愿,在中国大数据时代能够弯道超车,让我们民族在大数据时代能够把一些弱势,比如诚信、契约,把这个事干得更好,让世人承认咱们,中华民族确实很伟大,这是我的一个想法。
关联是大数据核心当中的核心
  思客:能否给大家分享一下您如何通过数据的挖掘,使之成为商业价值?
  张跃:我们是一家做互联网流量检测和流量数据采集,以及控制、优化的公司。目前来说,在中国互联网最高端,采集设备几乎百分之百是由我们提供的。低端的这些数据采集有很多家公司。浩瀚深度每天10个T以上是有的,这个数据很大,而且是不断地流淌着,存不下来,都浪费了。我的基本客户就是运营商,运营商现在也发现了这些数据是金矿。如果不断的流失掉,确实量太大。
  第二,这些金矿的挖掘是一种技巧。大数据里面是有黄金的,刚才二位都讲到骚扰电话、骚扰短信,恰恰是大数据应用的一个空间,也是我们大数据将来产品消费的空间。如果通过大数据,他知道你就要买这件东西,他还去骚扰别人吗?打电话是需要成本的,不光是电话费的事,还需要时间,还要雇人。假如大数据分析告诉他你要买这个东西,这样大数据产品就有了。
  我个人认为,这个通信时代,之所以要产生后续的大数据时代,就是因为他有产品空间,有需求。所以,在这方面我觉得骚扰电话、骚扰短信,恰恰是我们大数据未来的一个市场空间。不要忘记了,这就是我们服务的对象啊。
  所以,我在掘金的过程当中,帮助运营商发现的过程当中,找到一条把大数据变成有用产品的路,比如客户画像,数据安全保护,隐私的转换,隐私的脱敏等等。我们找到了这条路,但是很遗憾的是,大数据归谁啊?浩瀚深度太小了,我没有地方,挖掘出来也没有办法变成产品。我期待着,我们能够为社会做这些,我们把这个产品做出来,这个产品是什么?就是关联。关联就是大数据核心当中的核心,它就是金子。什么是关联?共享这个事看你出多少钱,不给钱是不能共享的。我觉得这个非常重要。
  Uber也好,滴滴打车也好,不给钱,给你坐车吗?共享的前提是优化。这里面有为客户服务的便利性、经济性、舒适性,甚至我的愉悦性,这是客户需要的,我觉得共享的前提还是要给钱。
痛客计划:分享痛点,寻找创业机会
  思客:陈刚书记,您现在打造的“云上贵州”非常有名气,这里面也有共享经济的问题。您建立这么多大数据的中心,现在产生的商业价值怎么样?
  陈刚:今天讨论的主题是共享经济。共享经济是互联网时代的一个重要特征,贵州省贵阳市抓住这个机会,利用大数据推动经济发展。刚才子沛讲了两个例子,纽约时报100多年的报纸怎么录入进去,他把它变成了验证码,让所有人用验证码进行录入。这是一个很好的创意。但是,产生这样创意的人并不多。能否把提出问题的人和解决问题的人分开,我认为这是未来创新的一个重要方向。
  事实上,杭州的图书馆也好,纽约时报也好,许许多多,包括今天在座的各位都会有问题。但是我们以往的思路是什么?你提出问题,你自己想办法解决。我们没有张总那个能力。但是贵阳推出了一个“痛客计划”,就是我不管能不能解决这个问题,把社会的痛点提出来,我就是痛客。这个痛点也许能解决,如果能,我当初提出这个痛点就是有价值的。
  比如刚才说的纽约时报100多年的报纸,可能许多的单位都有这个问题。我们搞这个痛客计划之后,把这个痛点提到这个痛客计划上,他不知道怎么解决,但是社会上有很多聪明人来解决这个问题。
  今天,我分享一个我自己的痛点,也是亿万消费者的痛点。我们知道今天中国发售的邮包,零售的商品应该是几十亿件。我现在也是淘宝和京东的消费者,我买完东西之后,每天或者每一次消费之后,都要考虑这个盒子怎么丢掉。现在每天消费了多少盒子?扔掉多少盒子?这也是我的痛点,也是社会的痛点。我们有没有可能,有一家企业,有一些聪明的人像发明集装箱一样,可以发明重复使用的小邮盒,这样来解决社会的需求。我相信这一定有人有办法。今天我借助新华网发布我的一个痛点,如果社会响应,我不要今天的知识产权。我告诉大家,如果今天网上的听众听了这个消息以后,请你们关注贵阳的“痛客”网站,你们去申请注册成一个痛客,不要自己去创业。你们把这样的想法提出来,我们给你加上水印,确认这个想法是你第一个提出来的。如果我们和一些有创意的人,像张总这样的人,找到解决方案,最终形成一个产业,你有可能是这个企业最早的不出钱的股东。
一个鸡蛋的故事告诉你政府如何平衡网络经济和实体经济
  思客:现在有一个说法,实体经济比较暗淡,互联网经济红红火火。而一个国家长远来看,实体经济是非常重要的。陈刚书记,您怎么平衡这个比例?
  陈刚:刚才子沛讲了一个观点,工业可以柔性制造,谈到工业4.0。现在消费也有一个消费4.0,但是工业4.0和消费4.0怎么连接,我认为现在一个重要的思路是要把中间的信息打通。有些打通,比如说商品的零售,像阿里巴巴这种模式,可以是跨区域的,甚至是跨国界的来完成。但是送鸡蛋这件事情,一定是在社区内完成。我们能不能把社区就近的生鲜超市和家里冰箱的物联网进行对接,这样就形成一个现实和想象的很好结合。所以我认为作为政府来说,我们做的事情不像他们两位那样出很多奇思妙想,我们需要做的事情就是把他们的想法,由政府搭建平台,让社会用利益驱动的方式实现整个链条的组合,这就是政府要做的事情。
  涂子沛:这个思路很好。这背后就是实体经济,它有一个衔接,在政府可能正是在这个时代不断往前推进。越来越清晰地看到,政府就是在虚拟经济或者互联网经济和实体经济的节点上能够发挥巨大的作用。
发现问题是人类的智慧,机器没办法做到
  思客:在未来的共享经济时代,更多的是机器替代人的脑力。现在有一种说法是中等收入或者越有知识的人群面临失业的风险越大,由此也带来很多社会上的问题,那怎么解决这个问题?
  陈刚:其实每一次科技革命都是在解放人类的麻烦,帮助人类找到更容易解决问题的答案。互联网大数据实际上是解放人的脑力,接着就产生了一个简单的逻辑关系,许多人会失业。就像我们在几十年前讨论要不要搞大规模化生产,现在看到很多生产线不需要几个人,从原来的手工作业变成规模化生活,确实会造成很多人失业,但是人类社会就是这样进步的,淘汰一个落后产业的同时,会让人产生新的创新动力,研究社会新的发展机会,所以大家去当痛客吧。
陈刚:淘汰一个落后产业的同时,会让人产生新的创新动力。姚冠华/摄
  张跃:人工智能也好或者科技发展很多奇思妙想也好,我认为逃脱不了三要素:生产力、生产关系和生产资料,只要人们正确的对待它就行。AlphaGo再厉害,是工具,毕竟不是人。所以你把它当做工具,一切烦恼都没有了。如果你把它当做人就出现了比如伦理等很多说不清的问题。所以人们有的时候在区分工具和人本身之间,有时候在这一点上是模糊的。所以人有幻觉,会得病,会抑郁。在这方面来讲,人还是要回归本质,机器是我们创造的工具。
  涂子沛:AlphaGo其实真的不可怕,为什么呢?AlphaGo就当不了痛客,它不会发现问题,它只会解决程序化的问题,它解决的每一个问题都是程序驱动的,而发现问题才是人类的智慧。要把发现问题的人跟解决问题的人分开,有些人发现问题,有些人解决问题。那我们人类去发现问题、去定义问题,这是机器没有办法做的,因为这些都是新的,要发现新问题、定义新问题,有一部分问题,重复性的,比如打字员的工作,借书采购员的工作,就可以让AlphaGo去做,实现人类的跃升。
  我现在就很想做解决问题的人,比如今天刚刚说的这些问题,那今天就要解决,我们今天站在和世界同步的问题上,美国也面临这些问题,那这些数据到底归谁所有?谁有所有权?谁有使用权?什么时候可以使用?怎么使用?这需要一个方案。刚刚陈书记见到我说你是大数据的布道者,但是今天不仅仅需要布道,还需要解决方案。这个解决方案会帮助中国去把握弯道超车、后发优势的机会,如果我们解决的好,那我们今天跟美国就站在同一个起跑线上了。
大数据带来“弯道取直与换轨”的发展机遇
  思客:您和张总都提到了弯道超车,您认为我们现在真的具备了一个弯道超车的机会和能力吗?
  陈刚:互联网、大数据给了我们一个特别的机会,我认为不应当简单把它形容为弯道超车。因为弯道超车意味着你比别人有更大的胆量,也有更大的风险。我们能不能换个思维,我们叫弯道取直,我们干吗要跟它一起弯道超车呢?我们能不能修一条直道,直接过去。所以在这个方面,我认为大数据、互联网给了我们中国这样一个机会,也给了我们这些后发达的,像贵州这样的地区一个发展机会。以前所有的工业文明要建立在物流、制造、金融等基础上,但是现在信息社会,人和人、国家和国家在网络空间距离上是相等的,也就是给我们这些后发达的地区一个新的发展机会。所以我认为贵州该采取的路线是弯道取直。
  涂子沛:不要错过贵州,不要错过贵阳,事实上是不要错过这个时代。今天讲的是弯道超车,弯道取直。我还想在这个基础上提出一个说法就是换轨,重新起跑。原来在互联网这个轨道上跑,贵州和北京相比可能是有差距的,可能差500米,老是追,它是追不上的。但是今天裁判员重新吹哨子,说你们不要跑了,换一个轨道,在移动互联网这条轨道上重新起跑。在这条轨道上,中国和美国、贵州和北京我们是没有差距的,可能5米都没有,完全是并驾齐驱。这就是今天中国的机遇,是一个换轨的机遇,就是从工业换到数据文明。
  版权声明:本文为新华网思客独家稿件,转载须注明来源为新华网思客。授权合作请联系
位网友推荐了本文
57633&次阅读&&&&4&次回应
所属数据库
最新鲜,最热辣的时事评论。无惧冲突辛辣,只忧平庸逐流。
您还能输入&300&字
著名大数据专家
时长:15分钟
时长:6分钟
时长:7分钟
[思客讲堂] 大数据带来“弯道取直与换轨”的新机遇
您可以添加如下代码,然后复制粘贴到你要引用的网站下
涂子沛、陈刚、张跃应邀做客《思客讲堂》,共同探讨大数据带来的新经济模式,数据如何开放与管理,大数据技术将给中国社会带来的挑战和新机遇等话题,现场讨论“火花四射”,各种精彩观点层出不穷。
涂子沛、陈刚、张跃应邀做客《思客讲堂》,共同探讨大数据带来的新经济模式,数据如何开放与管理,大数据技术将给中国社会带来的挑战和新机遇等话题,现场讨论“火花四射”,各种精彩观点层出不穷。
北京大学国家发展研究院教授
使用第三方帐号登录
还没有思客帐号?
登录或创建一个账号
还没有思客帐号?
邮箱格式不正确
验证码不正确
扫码关注思客
使用第三方帐号登录
还没有思客帐号?
登录或创建一个账号
还没有思客帐号?
邮箱格式不正确
验证码不正确

我要回帖

 

随机推荐