国际人工智能联合会主席杨强教授:人工智能的下一个低谷和希望

HKSAIR HKSAIR记者 瑶君 12月25日

 


 

 

文转自 通联数据

 


 

 

国际人工智能联合会(IJCAI)主席杨强教授近日在2018全球智能投资峰会上发表主题演讲,谈及目前大数据不足或数据孤岛可能导致人工智能再次进入低谷,杨强教授呼吁业界应该行动起来,解决目前面临的问题,推动人工智能真正的向前发展。

 

2018全球智能投资峰会由中国证券投资基金业协会金融科技专业委员会主办,通联数据、易方达基金、华夏基金、阿里云和新智元共同承办。本届峰会以“聚·变”为主题,旨在聚集全世界的金融与科技精英,围绕金融科技、智能投资等热点话题,探讨人工智能带来的行业变革。

 

以下为杨强教授演讲摘要

 

 

国际人工智能联合会(IJCAI)主席杨强教授

 

如果看人工智能的发展,我们已经经历了两次的低谷,现在处于第三次的峰值上面。那么就要问一个问题,人工智能下一个低谷什么时候会发生?为什么会发生? 

 

首先,人工智能的热潮是迎和人类发展趋势的。我们看一下人类发展到现在,其实是围绕着一个核心就是“效率”,金融也是要提高效率,就是说要在减少费用的前提下增加收益。

 

人工智能第一个低谷的发生是由于大家的失望,第一次峰值的发生是因为大家的希望。第一次低谷的发生是因为对机器能力的失望,对算法能力的失望;第二次低谷的发生是因为数据的不足,同时也是因为对专家的失望,是对计算能力的失望。现在我们有算法,有深度学习,有强化学习,有大数据,有模型等,应该说是所有的条件都满足了,所以这个峰值会不会永远持续下去?我个人觉得是不会的。因为我们刚才说的这三个条件,算法、计算能力和大数据,至少有一样不是真实的存在。也就是说,我们还没有进入这样的一个时代,也许这就是下一个低谷发生的原因。

 

我们来看一下这一次高峰的发生到底是为什么?大家可以不约而同地说是因为深度学习。深度学习最基础的是什么?是现在有能力在非常高维的空间,把我们看到的、听到的、我们碰到的行为上的这些物体,这些行为统一的表达出来。这是我们为什么需要大数据的一个重要原因,只有我们有了大数据以后,我们才能够在这种极高维的空间,上亿维,甚至上万亿维的维度空间,才能够有准确的表达,才能够准确的比较两个物体。

 

 

1人工智能技术的要素

 

 

关于人工智能技术的要素,我在这儿总结三个东西。第一,极高维的表达,但是我们不要忘记算法。第二,闭环的一种自学习的机制。第三,架构,可高度扩展的AI架构。比方说有很多人工智能学习的平台,有很多云计算的平台,我们并不认为这些就够了,这些还远远不够。对于这种学习的机制,我们现在还没有能力真正的做到安全和隐私方面的AI架构。我们还没有能力能够让不同的分布式的数据和数据的拥有者能够联合起来进行一种无缝连接,然后能够把一个共有的模型建立起来,在保护隐私和安全的前提下,所以架构方面应该说研究的最少。

 

看一个微众银行的例子。在微众银行的运作当中,它是互联网银行,没有实体店,它的员工大概是1000多人,他面对的客户群是7000万个个体,互联网上的用户。大家可以想象,这么多的用户来开户,首先要进行安全核实,要保证这个用户是真实的,要知道这个用户和证件上面的人是同一个人。另外,在开户了以后,用户会有各种各样的问题,提各种各样的要求,所以就有这种需求来做互联网客服。我们说虚拟机器人在这个地方是非常真实的,有多少这种需求呢?每天至少有100万个需求。所以通过人脸识别,通过声纹识别,通过对话系统的测谱程序,我们基本可以判别这是不是一个真实的人。同时,客服就可以将客户问的问题进行分析以后,放到机器人客服里面。所以说在金融领域,投资、投顾、客服、风控、建模、营销等等,只要是少数的人面临的客群都有人工智能存在的特点。

 

以上这些一定要有一个清晰的目标,数据要切合你要解决的问题,另外还要有很强的领域知识。但是在结合前面我说的那三条,一定要有大数据的存在,一定要有好的切合领域的算法,最后是要有好的架构。

 

 

2人工智能的下一个低谷?

 

 

下面我就想再讲一下,什么会导致人工智能的下一个低谷?我觉得也许就是数据本身。我们都说今天在大数据时代,但是我们有重重的困难,告诉我们其实我们还没有进入大数据的时代,我们可能还是处于一个小数据的时代。到最后可能各个垂直行业对数据的缺乏是极端的失望。

 

比方说,部门墙或者是有些地区数据的缺乏已经是一个非常严重的问题了。这里我要举一个IBM在医疗方面难以落地的一个例子。IBM WATSON是非常好的系统。它的过程和搜索引擎非常的像,比如说你用深入学习进行分析,最后你可以跟你库里面的答案进行比对,我们看到了成功的迹象。但是在医疗领域它却遇到了重重的阻碍。

 

医院想做的是辅助医生进行各种各样的医疗诊断,但是却发现最后数据远远不够,而医生又没有闲余的时间去给数据标注,如果到第三方公司去标注,志愿者也不够,所以这些事都给我们敲响警钟,我们可能并没有处于一个真正的大数据时代。

 

我这里还要说一下欧洲有一个新的法律叫GDPR,这个GDPR全名是《通用数据保护条例》,它是一个可以执行的法律条例,以至于紧接着Facebook和谷歌成为这个法案的第一批被告。这里面有一些跟我们每个人的经历有关系,比方说网站的经营者必须要说明收集数据的目的,而且不能使用模糊的语言来描述法律的条款。另外用户还有数据的被遗忘权,如果有一天决定说我这个数据不能被你使用,那么这个数据就要被去除掉。

 

这对人工智能的影响也是深远的,比如对使用自动化模型决策是否全面禁止?在做决策的过程中一定要有一个责任人。责任人的参与必不可少,那我们想一下,在我们很多的人工智能领域,其实都是没有责任人的。另外用户知道模型的使用目的,并且对模型可以提出质疑,对模型的自动决策,模型的制造者有责任来做出解释。所以这些苛刻的条文其实都是对人工智能的挑战。

 

我这里要特别强调一下,这不是唯一的针对GDPR还有这些严监管、数据隐私。人工智能学者在现在阶段面临到大数据可能产生低谷的挑战,应该行动起来,不能够一味地去追求新的算法,而是要研究一种新的架构,这种新的架构加上算法,加上这种高维的表达才能够使得人工智能真正的往前发展。