未来已来:大数据时代,如何掌握数据安全的主动权?

问答

q&a

神州

2020.10.16

“我们可以从信息空间中

去改造一个物理空间”

2020年8月,创新工场董事长兼ceo李开复在一场活动中表示:新冠疫情正加速社会“化”。而“”,这个早在1956年就被提出,经历了相当一段时间低潮期的学科,正迎来前所未有的高潮。中国第一批投入人工智能方向的专家,中国工程院院士、国家新一代人工智能战略咨询委员会组长潘云鹤曾提到:新一代人工智能最本质的改变之一,是在原本的人类社会空间,和物理空间的基础上,增加了信息空间。

潘云鹤:比如说交通问题,过去我们只能够看到一个十字路口的变化,现在我们可以在信息空间里看到这个十字路口的变化,是怎么去影响周围四个十字路口的变化。不但可以看到它,而且可以改造它。我们可以从信息空间中,去改造一个物理空间。比如说,以前做一次人口调查要半年,需要成千上万个工作人员。五年以后我们再做一次人口调查,也许几个星期、几百个人就够了。当我们把收集起来,例如户口、购物、等等,就可以给每一个人进行画像。

以前的人工智能,基本上是基于知识的人工智能。现在的人工智能实际上不再基于知识,而是基于数据。它们的不同之处在于,它能够自动地把数据变成知识。所以我们把它取了个新的名字,叫“智能”。

另外一个非常重要的方向就是,老一代人工智能的目标,是想把做好,造出越来越有用的机器人。那么新一代人工智能,不但要把变得更聪明,而且应该把计算机和人连在一起,把它合成一个更加聪明的智能系统。

潘云鹤:我们现在遇到的数据,很多是很差的,质量上面非常差,而且有的数据太偏,数据不完整。比如我拿到了很多数据,只是一个方面的,另外一方面的数据根本就没有,这些问题都会反映到最后形成的知识水平上面来。那么人为什么会逐渐地进行进化呢?就是因为人能够用学到的东西,去指导后面的智能,他能够不断积累。现在的人工智能也能自己成长,但是它知识不够完整,它只能在那个圈子里成长。如果我们把知识再扩大一块,比如把人大脑中间的形象知识包括进去,让计算机能成长起来。

吴小莉:您觉得这个过程要多久?

潘云鹤:我估计大概要一、二十年。

时代

该如何掌握数据的主动权?

方滨兴:、人工智能的处理能力,前提都是要有原始的数据。数据为王,谁拥有数据,谁就是王。为什么有gdpr(通用数据保护条例),就是因为他们没有强大的服务能力,所以它会对别人的服务高度担心。如果它自己有这么大的企业,它可能也不会有这么多的担心。但现在它的全部数据都是在,所以他们就要有一个特别强硬的法律,来对它们加以限制,来保护自己。美国确实太强大了,它们基本上“吃遍”了全球。

我们看回中国的例子,原来别国的产品想要入驻中国时,中国说你可以运行,但是必须按照我们的要求进行管理,比方说,有害信息你不能跟着传播等等。但是它不接受,它说那我就不进了。那现在看来,中国就跟着起来了,中国就出来了百度、微信了。

吴小莉:bat(百度、阿里巴巴、腾讯)。

方滨兴:所以从这方面,等于无形中让中国自己的产业做起来了。因为这个产业,它构成的是一种服务中心,这种服务中心能够获取一个国家的很多的核心信息。

国内开源生态 正在建立中

如今,各类创新应用场景催生出多样化的数据,使得业界对提出一种全新计算架构的呼声愈来愈烈。随着算力成为时代各国的核心竞争力之一,巨型科技公司也逐渐开始自建能力开源。鹏城实验室主任、中国工程院院士高文提到:利用开源平台集合众人智慧,是推动软硬件智能化升级的重要一环。

高文:说到人工智能,它现在是叫“框架平台”。现在就有好几个版本, 国际上影响比较大的包括谷歌、亚马逊、facebook、ibm、微软。它把人工智能的源程序都放在自己的开源框架里,供别人下载,如果别人再往上加东西,就需要再放回去。现在影响最大的是谷歌的,所有的大学、中学都在上面玩,所以它这个东西就会越滚越大。

吴小莉:其实开源开放的平台的优势在什么地方?

高文:开源其实是领域发展的一个新做法、新文化。以前软件都是卖版权的,比如我设计的软件,你想使用就需要支付版权费。但是大概三十多年前,mit的一些教授就开始倡导开源软件。就是下载我的软件,是有许可证的。许可证要求的是你下载后,如果对这个软件有任何修改的地方,需要放回来。

在国内,其实二十几年前也很倡导这个东西,这个是有一个很好的案例,就是华为的案例。华为有一段时间,就是从网上拿来版本后,有一些人就提出,我们自己开发就可以,也不用拿出去了。另外一些人就说,我们应该交回去,按照许可证的要求来做。所以华为内部就说,那既然你们两方谁也不服谁,就按照各自的方案走一段时间,然后两边就开始铆足了劲干。半年以后,私有的那个团队跟不上了,另一个写了往回交的团队,还在往上升。所以开源就是一种文化,软件是一种文化。

目前在全球范围内,美国拥有数量最多、应用最广的ai开源平台,在框架和大部分应用领域均处于领先地位。但是近年来,中国在计算机视觉、智能语音、中文、无人系统等领域的开源平台,也逐渐在国际上占据一席之地。

9月18日,2020中关村论坛“ai开源创新与产业智能化”平行论坛举行。中国科协学会学术部部长刘兴平在致辞中提到,开源的应用已经突破了单纯的技术层面,成为跨国界大规模协作生产方式的代表。

人工智能不仅要有“智”

更要有“德”

2020年的新冠疫情,让本已参与在各行各业的ai技术迎来风口。无论是业界还是学界,都对人工智能人才求贤若渴。世界工程组织联合会主席龚克提到:顶尖人才缺口大、人工智能人才培养的体制不够灵活,同样限制了中国的人工智能产业发展。另外,他也提到,虽然人工智能已经诞生了63年,但是中国的人工智能技术的发展顶多只有十几岁。中国在人工智能技术方面的基础算法、基础研究的积淀与美国相比,仍存在着比较大的差距。

龚克:我谈人工智能包括五个要素,通常你会看到谈三个要素,包括数据、算法、算力。但是我认为另外两个要素比较重要,分别是应用场景和人才。我认为人工智能的发展必须要具备这五个要素。首先,因为中国现在的应用面铺得特别开,所以我们在应用上应该在全世界是走在前面的。但是我们的弱点在什么地方?比如卷积。各国都在卷积上做了很多的更新,结合了具体的应用场景。但是卷积深度学习的这方面研究,仍然是美国人提出来的,而且美国人现在在集中解决算法可解释性的问题,我预期今后几年可能会提出新的算法或者数学上的更大突破。所以在这方面,我们现在是相对地走在后面。

其次,现在人才缺失是全球性的难题。不仅中国缺,美国、、欧洲也缺。但是中国从人才角度来讲,我们缺的是顶尖的、领军的人才。因为人工智能是一个跨学科、新的学问。它既是计算机科学,也是电子科学,还要跟机械、、等紧密结合。而中国的体制,恰恰有比较窄、比较专的专业划分,所以目前的教育体制对我们人工智能的培养是非常不利的。

我们现在把人工智能和教育分成了几个部分:第一类,是以人工智能为内容的教育,培养专业的工程师;第二类,是要渗透到所有专业里面的“人工智能+”教育。比如说机器人,过去是机械专业里面的东西,但如今光懂算法是不行的,它一定要跟很多力学的原理结合在一起;第三类,是通识教育,我们未来的公民是智能时代的公民,人们对人工智能要有一定的了解。另外还有一个重要的教育,是要保障人工智能具有人类价值观。

吴小莉:还要把“德”放进去。

龚克:对,那么这个就需要教师了解智能时代的伦理等等知识,例如数据的伦理、技术的伦理。

安全与创新 伴生前行

2019年8月,一款名为“zao”的换脸软件一度爆红于社交网络。通过这款软件,用户可以“一键”进入明星出演的影视片段。但是,因涉嫌过度收集用户个人信息,“zao”刷屏社交网络仅几天后,中国工信部就对其涉及的网络数据安全问题开展问询约谈。

2020年10月1日,新版《技术个人信息安全规范》正式实施,针对个人信息方面的要求,进行细化并完善。

方滨兴:技术在先,安全在后。它们是伴生而来的。我们每年都说安全方面有很多问题,就是因为不断有新技术,新技术带来新的安全问题。这就好像打扫卫生,一个地方老住着人,就算天天都有人打扫卫生,还有人每天都说卫生不好,是因为这里一直住着人。所以我们说安全伴生技术:只要出现了一个新技术,一定有新安全问题。一个新技术在安全领域可能赋能防御,也可能赋能攻击。

高文:人工智能在这点上非常像原子能–用好了是造福社会、造福人类,但是如果往坏里用,会对社会带来极大的危害。

吴小莉:您提到了人类的智能时代,大约会在2030年左右会到来。那想象一下,到那个时候,中国人工智能的发展,会是个什么样的景象?

高文:应该比现在还热闹。是这样,我们都说任何事都有一个从量变到质变的过程,现在还是在做量的积累,还不够。可能再有十年的积累,可能会往质变的方面翻转。到时候我们就更方便了,人可以做得更懒一点、更自由一点。

潘云鹤:也许到那时候,人就不需要竞争了。你们去看科学的发展,实际上和人的理想的发展,有时候很类似。因为科学技术最后还是掌握在人的手里面,它一定是向着推动人类拥有更美好的生活,这个方向发展的。

(0)
上一篇 2022年3月22日
下一篇 2022年3月22日

相关推荐