【独家】吴军:未来机器将会控制98%的人

2015-01-15 正和岛

岛语2015年1月6日,“正和岛商学院硅谷行”第一课在美国硅谷投资孵化中心Zpark Capital举行。硅谷一直是未来科技趋势的预言家和引领者。此次硅谷之行,《浪潮之巅》的作者吴军博士,又是怎样预测未来的呢?

来源:正和岛内容运营部

作者:吴军

编辑:吴璇


目前,我总结出三大趋势,第一,云计算和和移动互联网,这是正在进行时;第二,机器智能,现在开始发生,但对社会的影响很多人还没有意识到(机器智能并非人工智能);第三,大数据和机器智能结合,这是未来时,一定会发生,有公司在做,但还没有太形成规模。人想活得好一点,活得长一点,这是根本目的。


今天我重点讲后两个。


为机器智能正名


虽然现在的机器人看上去不是很聪明,没有我们的推理能力,但是有可能会发生这样一件事,假设我们人脑的智力能够持续增长(这其实还做不到),但是根据摩尔定律,计算机的计算速度是指数性增长,可能会发展出现一个交点,它能够把很多要推理的东西变成计算,那么在这个点会超过人脑。而我想说的是,今天我们恰恰处在这一点。


未来机器人的形状不重要,它实际上是数据中心,是一万台、十万台、一百万台的服务器。


什么叫机器智能?或者说怎么判断机器有智?计算机的老祖宗阿兰图灵给了一个判定标准,叫图灵测试。假设我们在墙背后放一台计算机,放一个人,然后我们问一个问题,比如天为什么是蓝色的?计算机给出一些解释,人给出一些解释,当我们无法判断哪个解释是计算机给出来的,哪个解释是人给出来的时候,就认为这个计算机和这个人有同等的智慧。


我把机器智能的发展划成三个阶段,70年代以前,70年代到2000年,和2000年以后。


第一个阶段是上世纪70年代以前,人们的想法是让机器模拟人。这实际上是人工智能。后来大家发现走不通,它能教计算机解决一些很简单的小问题,但是解决不了大问题。当时美国著名计算机科学家明斯基给美国自然科学基金会写了一个报告,说我告诉你为什么。他举了一个很简单的例子:他说了两句话,第一句“The pen was in the box”,第二句,“The box was in the pen”。分别译为“钢笔在盒子里”、“盒子在钢笔里”,第一个很好理解,第二个怎么回事儿?实际上,pen有两种含义,一是钢笔,二是小孩玩耍时的围栏。这就很好理解了。问题是计算机怎么知道第二句的翻译里是围栏,而不是钢笔?这就要分析语意之外的一些东西,(这种理解能力)是我们人在成长过程中习得的,(想让计算机学会),按过去的方法是做不到的,所以从70年代开始,美国自然科学基金会停止了对人工智能的支持。


第二个阶段是上世纪70年代到2000年。弗莱德里克·贾里尼克教授被认为是用数据驱动解决问题的老祖宗,他1972年从大学去IBM做学术休假,IBM希望让计算机变得智能,提出了三个事,第一,语音识别;第二,机器翻译;第三,计算机自动回答问题。他选了第一个。严格来讲,他不是计算机专家,而是通信领域的专家,所以他看待机器智能和搞计算机的人不一样。他认为语音识别是通信问题。他说,脑子里想的事,相当于一个信息源,通过嘴说出来,空气传播,就是一个信道,信源有信源编码,信道有信道编码,整个是一个编码过程,然后你听到他的过程是一个解码过程。于是,他建了一个数学模型,然后就需要数据。当时为什么只能在IBM做成?因为第一,IBM有超强的计算能力;第二,有比较多的数据,当时没有互联网,IBM有的是大量的电传数据。以前用人工智能方法来解决语音识别,能识别200、300个英语单词,错误率是30%,但是用数据驱动方法能识别两万个词,错误率只有10%,有了质的改变。


这个故事说明,第一,计算机解决问题与人可能完全是不同的路;第二,数据很重要。


到底什么是大数据?


今后20年就是大数据。国内讲大数据有几个很关键的错误。第一,大数据的数据量一定大,但是大数据绝对不是大量的数据这么简单。


首先,大数据一定要多维度。多维度是什么?我们讲一个最简单的例子,一年前百度有一篇文章,关于中国吃货的统计,拿百度知道上几千万个问题做了一些统计,比如,广东人就问什么东西不能吃,西北地区的人就问什么东西能吃?广东和云南的人,说虫子能不能吃?宁夏的人就问螃蟹能不能吃?你可以看出差异。百度在2005年就有了这个数据,一直到今天,10年你能看到不同经济发展阶段,大家对饮食的关心是什么?


再一个就是完备性,完备性很可怕。2002年,一个小伙子用大数据对美国总统大选进行预测,他预测共和党和民主党各自在哪些州占优,结果100%准确。为什么能做到?他就是用大数据,他搜集到所有能搜集的数据,比如博客、微博、twitter、facebook、当地新闻等等,这就是完备性。完备性做到极致就是到每家每户问你们投谁,这就是最完备了。


第三点,大家常常忽略,就是这不仅是统计方式的改变,关键是思维方式的改变。传统的思维方式讲究的是因果关系,但大数据由于数据量的完备性,是你先知道结果,但不知道原因。这就需要改变思维方式,就是先要接受这个现实,至于原因以后再想。


为什么大数据在今天这个时间点爆发?原因很多,第一是摩尔定律;第二是移动互联网,以前的互联网是机器和机器的联网,而移动互联网是人和人的联网;第三是传感器技术。


传统行业如何应对数据为王的时代?


将来是个数据为王的时代,这是个上万亿的故事,要改变全部的行业。我举三个例子。


第一,风能发电的京风(音译)。这是我们中国的一家公司,现在全球市场占有率排第二,以前它把设备卖到世界各地,也不知道发了多少电。现在它在叶片上装一些传感器,全世界将来风能的分布它都知道。另外可以监测每一个叶片的疲劳程度,提醒更换。


第二,普拉达,意大利高端服装品牌。以前只知道这个衣裳放了多长时间,有多少人买。后来他们做了两件事情,第一,在每件衣裳后面放一个芯片;第二,在试衣间里设置传感器。这样就知道一件衣裳拿进试衣间多少次,每次试了多长时间,这个衣裳老拿去试,为什么又不买,这都能分析出原因,从而提高了销售量。


第三,美国排名第二的连锁百货店。以前买东西都给顾客一张发票,后来改成顾客给一个手机号或者邮箱发过去,以前给你打一张纸不知道你是谁,发邮箱就知道你是谁了,就有一些数据。后来,公司雇了一个学统计的硕士,他发现,比如孕妇大概3-5个月的时候买孕妇服;快生的时候买宝宝用品等等,所有人基本上按照这个模式来,这就可以预测顾客接下来要买什么,给他们送优惠券。结果有一天一个特别愤怒的父亲打来电话,说我女儿15岁,你们就给他寄婴幼儿的广告,经理就赶快安抚他,看来数据也有错误的时候。但是后来回访令他很吃惊,这个父亲主动道歉,原来他的女儿真怀孕了。


再讲大数据的关键技术。一是大数据搜集,一定是无目的性的,非结构化的,一旦是有目的地搜集,常常就不准了;二是数据存取,摩尔定律保证了计算能力、存储能力;三是数据的表示、检索、随机访问,这就需要建立数学模型。


再讲几个例子来说明大数据和机器智能的关系。


谷歌无人驾驶汽车。以前的人开车,你看到障碍物,琢磨怎么绕过去,到了一个什么地方,琢磨我怎么走。谷歌不是这么干的,他是谷歌街景项目的一个延伸,坦率来讲,这个车在他以前没扫过街的地方是开不了的。现在GPS定位是分米量级的,而且车浑身大概有十几个传感器,每秒钟几十次的数据输入。2014年又做了很多改进,比如路面施工需要绕行等都能识别。


大数据、机器智能如何改变医疗?


谷歌已经开始做了,第一笔投了10亿美元,成立了一个小公司,不到10个人,治疗癌症,聘请了基因泰克的CEO。他就讲,癌细胞为什么治不好?原因很简单,癌细胞是变的,原来细胞是正常变异,复制完还是差不多,结果突变,就成癌细胞了。很多抗癌病人都有这样的故事,比如几年里药都管用,突然一夜之间不行了,就是因为细胞变了,原来的药不是针对它的。所以,在抗癌方面生产一种青霉素似的普用药物是不可能的。唯一的希望是细胞变,药也变。但是有两个条件,第一,得有一个团队跟着病人,发现问题并研制药物,速度不能太慢;第二,十亿美元成本。


但他又说,现在如果全世界能把各个医院的各种数据搜集起来,结果则是每个人五千美元成本,而且肯定能跟得上癌细胞变化的速度。


未来,机器将会控制98%的人


那么问题来了,未来的世界到底是人的,还是机器的?我认为机器智能将来可能对社会有冲击。很多人不以为然,觉得首先冲击的不是我们,是富士康的工人们。那我就讲讲高大上的职业如何被冲击?美国各大学最热门的只有四个学院,法学院、工学院、商学院还有医学院。


在美国,请律师打官司很贵,尤其是专利官司。原因有二,一是打一个官司基本上要读上百万份大的法律文件;二是美国的专利官司对公司的追究是非常狠的,因此都不愿输。比如苹果和三星的官司已经打了几亿。但有个小公司,花了一万多美元,买了一个自然语言系统读了200多万份法律文件,最后花10万美元打赢了一场官司。所以你看到当机器智能出现,高大上的职业将来会是一个什么样的情景?


虽然未来世界不是完全由机器来控制人,但是会控制98%的人,只有2%制造智能机器的人不会被控制。你可以想像,今天大家有多大程度上在依赖微信和支付宝?它们推出什么功能,你的生活方式都有点在改。腾讯和阿里巴巴的人,可不到人口的2%。因此,我们只有一个选择,要么做这2%的人,要么做这98%。

觉得不错,分享给更多人看到

关于 正和岛

聚焦企业家的想法、干法、活法与玩法,每天有独家、新鲜猛料。

正和岛 微信二维码

正和岛 微信二维码

数据

阅读 9089
点赞 37
更新 1月16日 22:19