大数据:感冒不是通过你的头
大数据
分类: 人生感悟 围观: 1701


日前,《大数据时代》的作者维克托·迈尔·舍恩伯格在云上贵州··大数据国际年会上进行了主题演讲。 笔者根据现场录音资料,对演讲内容进行了精编,照片也由笔者现场拍摄。内容如下:

我们现在有了比以前更多的数据。作为一些从事大数据业务的公司,他们对于大数据感兴趣,这到底又意味着什么?

在大数据时代,我们能够了解或者我们开始去了解不同的相关性。我妈妈经常告诉我说,当我小的时候,她说在冬天的时候你要戴上帽子,不然你就感冒了。当然这是不正确的,因为你从来都不会通过你的头来感冒,实际上是因为鼻子才感冒,所以戴不戴帽子根本没有关系,所以这是一种错误的不存在的联系,但是对于人类来讲,我们喜欢做一些自己幻想的相关性,实际上有些根本不存在,它会给我们一种安慰,就觉得好象我们是理解世界的,但是很多情况下我们并不理解这个世界。在大数据时代我们可以更加谦卑地认识或者认同我们人类对于现实的了解比我们想象的要少,相对来说对于现实了解较少,也就是说有更多东西我们在未来需要去了解,需要在未来有更多东西要去调研,有更多东西是需要我们去发掘,有了大数据我们可以做到这一点。

通常我们不容易理解这种非常虚拟的或者比较飘浮的相关性,但是我们可以知道比较科学的相关性,我们可以想象一下社会在教育这方面我们如何去学习呢,这里有一个公司——doulingo,这个公司有好几千万的用户,它是一个程序公司,可以帮助你去学习语言,有几千万人在使用这款应用,这个应用程序也写得很不错,用起来很有意思,所以它就收集了大量人们学习的数据,到底他们学习语言中会存在哪些困难,通过去做这种大数据的分析,这个公司发现教西班牙语母语的学习者学习英语的方式是错误的,这就是我们从大数据当中获得的一些知识,而且帮助很多人节省了外语的时间。



再举另外一个例子吧,早产婴儿他们是非常脆弱的,他们有可能会受到感染而死去,问题是在于我们意识到他们被感染的时间太晚了,往往我们意识到的时候就已经来不及救他们了,但是在多伦多的一个大数据项目认为他们可以解决这个问题,他们使用了数字传感器,并且可以获得1200多个数字点,其中包含一些早产婴儿每秒的身体体征数据,然后对他们进行分析,通过这种方式才能够找到在数据当中的规律,这种规律可以帮助他们去预测在未来感染的可能性有多大,最后他们终于找到了一个规律。现在无论到底早产儿在最早24小时里面会不会出现这个症状他们都可以分析出来,这样等于是挽救了早产儿的生命,甚至是几千几万个早产儿的生命,非常有意思的是这种模式能够显示出这个早产儿有可能出现某种感染的话,实际上他的生命体征并不是波动非常严重,它的体征非常稳定,所以大多数医生根本不会注意到,大多数医生晚上回家了,说所有指标都挺正常的,比如说婴儿生命体征很正常,但是大数据的研究分析表示出这个早产儿可能存在很大危险,这时候我们应该提供援助,这就是大数据给我们带来的优势,我们应用大量大数据预测之前没有预测到的现象,通过这种相关性给我们及时的信息。

简单讲,大数据甚至是等于现实当中的一种新的距离缩短,就好象科学革新一样。200多年前的科学革命与它一样的伟大,这就给我们更好的决策机会,基于更好决策基础之上,我们可以对未来做更好的预测,同时未来更好的预测就意味着将会带来新的经济价值。

数据已经变为了一种资源,这就好象是一种物理资源一样,就和黄金一样宝贵,甚至和能源一样宝贵,但是他们是不一样的,某种程度上是不同的,因为黄金或者能源,当你把它消耗完就没有了,但是大数据当你使用它之后它仍然存在,并且可以进行重新利用。大数据的核心就在于数据可以不断的重复利用,这就意味着大数据成为了一个不只是工具这么简单了,它可以实现在经济中的效率,数据还有大数据可以来成为经济发展本身的来源,它可以刺激经济的发展。

让我们看一下大数据如何和其他经济促进发展,全世界经济发展情况是这样,IT行业是5.5%的经济增长,比经济增长稍微好一些, 但是大数据的发展数据是怎么样的呢?在经济角度进行一个对比的话是40%每年的增幅,可以看一下这对我们意味着什么,因为大数据可以成为经济发展的驱动力,可以成为经济发展的革新者和更新者,当经济发展减缓的时候可以做这个触动。

那我们可以做什么呢,我们需要数据,这是当然的,因为它是原材料。还有我们需要一种思维,我们需要去理解大数据本身是存在着价值的,我们可以把这个价值给抽取出来,我们可以找到专家,我可以去雇专家,我们可以获得数据,但是如果我没有概念,我不知道这个数据可以不断的进行重复利用从而从中抽取价值的话,这个价值不可能被我们收回,对于专业数据和思维这些都是很重要的。

中国实际上是有一系列的条件,可以让我们进行大数据方面的发展,我们需要对其进行分析。在专业知识方面,我们有非常好的数学和计算机科学的教育,我们全国的数学和计算机教育都很好,甚至包括美国都非常眼羡这一点。我们看一下这一点,特别是在贵阳,你都可以非常好的去理解基础设施以及云的基础设施给我们提供,并且我们在数据方面,中国有一点是其他任何一个国家都没有的优势,那就是规模,中国很大。

我这里想给大家提出的问题是,你们到底有没有足够的思维和意识,可能往前发展有一点我们要关注的就是现在有很多的人在你组织内部,一些未来企业家、一些年轻人他们大数据的思维,他们能不能理解到在大数据当中是存在着可以不断重复利用的价值,这里给大家举一个例子,这个例子是关于重复利用的,这是汉莎航空公司,德国官方的航空公司,多年的飞行当中他们收集了很多数据,包括温度、湿度、降水率等等,所有这些数据它都是在驾驶室当中,驾驶员他飞完一程以后这个数据就不用了,在几年,汉沙决定把这些数据收集起来,把这些数据发给了国家气象局,这样300多架飞机的数据改善了国家在天气预报率提高了8%,可以想像一下这些数据的作用。

我想大家可能都看过这样一张照片,这是Google的无人驾驶汽车,可以让你这个车辆里面输入你的目的地,然后它就可以自动进行驾驶,这是大数据车辆,它可以在驾驶过程中收集数据,并且可以对它进行一秒钟几百万数据的运行处理。但是有一个问题是,他们可以利用这些数据,然后把它放在一个大的项目,等于Google可以收集到地理的一些数据,例如道路的宽度、车流量的情况等等,所以他们最早使用这样的数据就是为了制造地图,现在他们可以再重新利用这些数据,可以让这些无人驾驶车辆驾驶到目的地去 。



再给大家举一个例子,就是由微软、雅虎、斯坦福大学联合的一个项目,他们收集了人们在因特网上的搜索信息,看一下到底一个药物是不是有副作用,一个高血压的药品和一个头疼药是有互相作用,他们原来根本不知道,他们原来没有对化学物质进行测试,他们只是使用了对因特网搜索数据的分析应用就得出了这样的结果。

如果大数据有这样大的经济驱动和这么大的经济价值,我们怎么样获得这些大数据,或者使大数据发挥作用,这已经是全世界都提出的问题,在过去3个月里,在西方一些大的经济体里进行了报告。

你如果来问我的话,到底你能做什么让大数据能在政策角度发挥它的作用,这就是我要给大家提出的一些政策方面的建议。

第一就是进行分享,实际上我们对于大数据最大的挑战就是在一个组织或者公司内部,数据通常都是进行了分离,一个部门它的数据不允许另外一个部门来获取他们的数据,有的时候,一个部门根本就不知道另外一个部门有他们需要的数据,这点是非常糟糕的,因为在大数据时代里面,我们是可以从数据结合当中获得大量的价值,并且把数据的资源结合在一起来实现这种规模性,所以如果我们能够鼓励数据的分享,在所有的组织中都去鼓励数据的分享,能够建立强大的规则以及激励政策让不同部门实现公司内部或者组织内部合作的话将会更好。

第二就是开放性,对于大数据来讲,为了让它起飞我们需要非常大的潜力,是需要进行数据内部发掘,但是没有任何人、任何一个组织或者任何一个公司去想象,他们将会把所有好的概念或者关于他们拥有好的数据能够进行开放,通常都是让别人进入到你数据当中来使用你数据当中才会发现在数据中未被发觉出来的价值,但是这是存在挑战的,因为如果一个公司花几百万去搜集这些数据,它到底在经济方面如何让另外一家公司在使用这数据获得经济价值的时候怎么样对它进行经济补偿,所以我们需要建立数据市场,有可能创建一些数据所有权或者数据产权方面的东西。所以关于开放方面就是公共部门有大量数据,你让这些数据能够开放的话,不光能够给社会带来更多的知识,同时还可以实现大数据行业的发展,非常准确的数据源正是我们所需要的,数据可以转为非常强大的经济补贴来协助大数据活动的开展,也可以进行法定,要求一些由政府资助的项目的大数据可以向社会和组织开放。

第三是信任,不是说所有的,但是很大一部分的数据是关于个人的,很多人有这样的担忧,就是他们自己的隐私,他们会担心有人会随时的滥用自己的个人数据。如果这个问题没有得到成功的解决的话,人们肯定就不再相信大数据,会停止提供他们的数据。那么这就会使得大数据未来的前景堪忧,所以我们需要认真的来对待这个问题,并且在这方面制定非常严格的规则来保护隐私,同时也能很好对规则进行执行,让大家感到数据是安全的,同时我们要对大数据方面有一些限制,使社会的福利得到保持,并且能实现对于社会的一些安全。

所以分享、开放和信任是能够促进大数据未来前景发展的三个关键因素,这也是我们的经济和社会在未来几年的关键,全世界范围都是如此,有了强大的政策框架,基于这三点基础的话,大数据将会快速取得成功,并且我也深信将会为我们带来强大的新的能够看到未来的一个远景。
作者:Lee'Xin 来源:本站原创 发布于2014-07-16 09:47:07
精彩推荐
各种观点
评论关闭中
热门阅读