2020年,人工智能依旧在发达发展,并在各行各业产生了深刻的影响。
2020年还剩下10个月的韶光,让我们去预期,人工智能会有哪些主要的趋势呢? CB insights曾就此问题做了一个判断,并给出人工智能的九个主要研究和运用趋势。
AI 科技评论在一定程度上认同这些判断,针对这 9 个趋势,我们将做以下剖析。

一、Deepfake将改变商业模式

CB insights认为商业性子的Deepfake可能会兴起,去世去的名人将会“复活”,零售业以及营销的办法也会得到改变。

前些日子,Deepfake技能现身印度选举,被候选人用于竞选拉票的宣扬材料。
虽然此候选人终极以惨败停止,但这意味着Deepfake点燃的AI换脸之火有逐渐升温的迹象。

虽然此技能涌如今政治视频以及色情视频中会带来负面的影响,但是对付媒体、电影公司来说却是千载难逢的机会。
例如好莱坞的一些电影公司正在费尽心机“数字复活”五十年代中的电影人物。

AI 崛起的第九个岁首还有哪些大年夜有可为的地方

(雷锋网)

在商业层面,Deepfake将会变的更加个性化,提升电子商务体验和虚拟在线试用;广告投放也会朝着超定向方向发展,例如按照需求合成视频,并配备相应的方言;创意流程也会变得自动化,例如“补拍”电影续集。

从技能层面上讲,Deepfake技能也在突飞年夜进。
就在近期,北京大学联合微软研究院分别提出了FaceShifter和Face X-Ray,前者是一种高保真度、可识别遮挡的换脸工具,后者则是能够检测假造人脸图像的工具。
个中经由演习的FaceShifter可以无需任何手动注释,以自我监督的办法规复非常区域,自适应地集成身份和人脸合成属性。

而Face X-Ray不只能判断是否是合成图片,还能指出哪个地方是合成的,即兼备识别+阐明两种功能。

这两个技能号称 AI换脸界的“利矛”和“坚盾”,在业界取得了领先的结果,其余值得把稳的是其所需的数据比以前的方法少得多。

以是在Deepfake问题上,2020 年的发展趋势紧张包括:

1)Deepfake在一攻一防的斗争中逐渐进步,小数据、无监督的演习方法将成为模型的主流,传统耗时耗力的打算机天生图像技能也将逐渐被取而代之。

2)Deepfake将改变商业模式,广告营销将会变得更加个性化,电影创作不再局限于真实拍摄。

二、黑客的革命:利用 AI 来攻击 AI

传统黑客紧张是通过创造系统漏洞从而进行系统侵入。
但进入人工智能时期后,黑客、白客之间的攻防战役也发生巨大的变革。

随着人工智能的崛起,AI逐渐被用于自动检测和打击恶意软件,可以学习创造可疑行为,并在可能影响任何系统之前阻挡网络攻击,同时使得人类避免一些不必要的事情量。

但是攻击一方也可以利用相同的技能来增强他们的攻击方法,特殊是犯罪分子将之武器化,这些恶意软件乃至可以躲避最好的网络安全防御并传染打算机网络,乃至可以仅在摄像机检测到目标的人脸时发动攻击。

这意味着在2020年,未来的黑客可能在两个方面发力:

1、欺骗规模上升到系统级别;

2、利用AI发起更为繁芜的攻击。

例如在2019年,Skylight Cyber的研究职员找到了一种方法可以创造AI模型中的固有偏见,利用这种偏见可以创建出“后门”,使得恶意软甲绕过 AI 防火墙,骗过杀毒软件。

这也便是说,如果能够理解AI模型的事情事理,基于其特定功能设计攻击武器,就能够愚弄系统。
随着Skylight Cyber这种AI公司越来越多,消费者和企业保护的级别固然会上升,但是针对AI特有弱点的新一批黑客和软件也会随着涌现。

(雷锋网)

另一方面,黑客也可能会从数据的角度来愚弄AI,即毁坏AI算法的演习数据,使得AI产生偏见,影响其对网络中正常行为和恶意行为的区分。

利用语音合成的犯罪案件 当网络安全研究员越来越多的利用AI防御攻击时,AI本身也会被用来制造更加繁芜,更有针对性的网络攻击。
例如Deepfake天生的语音和合成的语音越来越逼真。

在欧洲,已经发生了一些黑客利用AI模拟公司CEO给员工打电话然后让其转账的案件。
虽然在现实天下中利用AI来攻击的犯罪案件尚未有宣布,但是早在2018年,IBM就开拓了一种名为Deeplocker的深度学习驱动的恶意软件,可以绕过网络安全保护来进行攻击。

该软件被描述为“一种由AI驱动的具有高度针对性和规避性攻击工具的新型恶意软件”,目的是理解现有的AI模型是如何与恶意软件技能相结合,从而创造出一种新的攻击类型。
此技能将黑盒AI的传统弱点变成了一种上风,在目标物未涌现之前,可以隐蔽在普通的运用软件中,传染掉上百万的系统也不会被察觉。

这个 AI 模型只有在识别出特定的标准时,才会“解锁”并开始攻击。
当然,除了AI型的黑客,利用量子打算资源的量子黑客、利用大数据进行剖析的大数据黑客等也将逐渐浮出水面。
以是在技能层面,2020 年黑客发展趋势紧张包括:

1)AI本身也会被用来制造更加繁芜,更有针对性的网络攻击。

2)由于AI的黑盒性子,网络攻击将会变得更加暗藏和剧烈。

三、AI 技能日益遍及化和平民化,AutoML将大显技艺

AutoML 作为一套自动化设计和演习神经网络的工具,能够降落企业的进入门槛,使得技能更加“平民化”。
从数千个特界说务中设计或搜索精确的神经网络框架全体过程非常耗时,尤其是在为更加繁芜的场景(例如自动驾驶,须要兼具速率和准确率)设计AI 架构时,就更非易事。

对此,神经架构搜索(NAS)应运而生,可自动化为给界说务找到最佳 AI 设计的过程。
2017年,谷歌正式将其命名为“AutoML”。
谷歌在当时便指出,AutoML 将启示新型神经网络的出身,并且还能够让非专家也能够根据他们的分外需求创建相应的神经网络。

自此之后,AutoML 的运用加倍广泛,在数据准备、演习、模型搜索、特色工程等 AI 设计中都发挥着巨大的浸染,极大地推动了 AI 技能的遍及化。

总体而言,AutoML 紧张具备两个紧张上风:

1)可缓解人才短缺问题:目前 AI 专家还是处于非常短缺的状态,而AutoML 则会极大地降落非专家以及企业的技能利用门槛,从而推动 AI 技能的遍及和推广。

2)可节省本钱和降落繁芜性:即便对付专家而言,设计神经网络都是一个费时费力的过程。
AutoML 在降落打算和试错本钱的同时,开拓的办理方案也更胜一筹。

随着 AI 技能加倍遍及化和平民化,AutoML将连续大显技艺。
而在未来的研究方向上,紧张可以从算法方向和理论方向动手:

1)在AutoML算法上,未来的事情如果能在效率提升、泛化性、全流程的优化、面对开放天下、安全性和可阐明性这 5 个方向上取得打破,将会有较大的代价。

2)在AutoML理论研究上,目前干系的研究还较少,对自动机器学习的泛化能力及适用性也不是很清楚。
因而,一方面要回答目前自动机器学习算法的适用性和泛化能力,另一方面也要回答哪些问题类存在通用的机器学习算法上和更广泛问题空间上的自动机器学习算法的可行性。

四、联邦学习将带来新的数据共享范式

联邦学习的观点最初是由Blaise等人于2017年在Google AI Blog上揭橥的一篇博文中首次提出。

自提出至今,干系研究甚嚣尘上。
联邦学习之以是能够在如此短的韶光里迅速由一个构想变为一门学科,紧张缘故原由在于联邦学习技能作为一种学习范式,能够在确保用户数据隐私的同时办理“数据孤岛”问题。

(雷锋网)

无需数据网络,即可改进AI模型 相对付传统的AI模型,联邦学习更像针对当古人工智能发展所面临的困境的新范式,例如:

1、在联邦学习的框架下,各参与者地位对等,能够实现公正互助;

2、数据保留在本地,避免数据透露,知足用户隐私保护和数据安全的需求;

3、能够担保参与各方在保持独立性的情形下,进行信息与模型参数的加密交流,并同时得到发展;

4、建模效果与传统深度学习算法建模效果相差不大;

5、联邦学习是一个闭环的学习机制,模型效果取决于数据供应方的贡献。
以上优点显然给办理数据隐私和安全问题供应了一种新的路径,而在详细运用层面,英伟达的医疗硬件和软件框架Clara已经能够支持联邦学习,当前已经有美国放射学院、MGH、BWH临床数据科学中央以及UCLA Health 在平台上演习干系算法。

以是,在技能上,确实可以担保合法的进行联邦学习,并且是有效果的。
因此联邦学习像一个操作系统,它的特点是多方互助,只有多方都认可才能发挥其威力。
以是接下来,联邦学习在2020年会连续成为一种火热的研究趋势:

1)不仅在医疗领域,金融领域,工业界也会加大力度布局联邦学习,接下来跨领域互助、跨国互助将成为常态。

2)数据隐私问题、小数据问题得到缓解,跨设备模型演习成为办理方案。

五、机器学习加码聪慧城市构建

聪慧城市最主要的是利用各种信息技能或创新观点,将城市的系统和做事打通、集成,以提升资源利用的效率。

从技能发展的视角,聪慧城市培植哀求通过以「移动技能」为代表的物联网、云打算等新一代信息技能运用实现全面感知、泛在互联、普适打算与领悟运用。

而 IoT 和机器学习的兴起显然为其供应了支持,例如利用机器学习来为通勤行为建模,并关注影响通勤办法选择的成分等;利用机器学习剖析传感器数据减少温室气体排放和更智能的资源管理。

当然聪慧城市涉及领域之广,绝不是一家企业能够节制,纵然是万亿美元的 Al 巨子Alphabet也只有通过联手政府,才能在浩瀚城市创造新的街区,方案房地产、公共能源举动步伐、交通等布局。

例如,去年第二季度,Alphabet 旗下子公司 Sidewalk Labs 发布了一份 1500 页的方案,个中详述了如何通过与政府和其他企业的互助,以 13 亿美元在多伦多打造一个聪慧城市的项目。

项目的重点和亮点就集中在 AI 在政府和城市方案的运用上。
总而言之,在2020年,智发展慧的城市发展会在协作和技能两方面着花:

1)在互助层面必须得到政府青睐,政府的加入将弱化企业不成比例的前期创新本钱

2)在技能层面必须优化端到真个办理方案,拥有机器学习的城市开拓工具、自动驾驶汽车技能以及建筑能源管理的AI企业将会极具竞争力。

六、用AI 技能应对 AI 演习的巨大花费

打算密集型的 AI 技能,不仅须要更加智能和可持续化的办理方案,还该当有助于应对环球日益上升的能源需求。

AI 领域的进展每每都是自上而下的,比如说由科技巨子开拓出某些 AI 工具,然后开源给其他人,造成这一征象的缘故原由之一便是 AI 研究的打算密集性。

据统计表明,谷歌在2018 年的BigGAN实验中用来创建狗、蝴蝶和汉堡的超现实图像所花费的电量“相称于每个美国家庭在近6个月的韶光里所用的总电量”。
如此的耗电量其实令人震荡!

随着AI 能源花费的持续走高趋势,节约能源将会是 AI 在 2020 年乃至未来的主要研究课题。
用 AI 技能节约能源紧张可从以下三个方面动手:

1)硬件公司将会聚焦于为机器学习研究供应“超低功耗”的设备,与此同时能源效用会成为边缘打算的紧张考量点。

2)将 AI 运用于公用奇迹规模的能源生产:更多的云打算巨子将转向利用可持续发展的能源,并利用 AI 技能来增加可再生能源产出以及精简数据中央的运营。

3)精简发电和油气等业务:人工智能能够预测可再生能源产出、自动化电网管理、帮助油井精确钻探,以及为智能家居和商业建筑供应可持续能源管理办理方案。

七 、办理小数据问题势在必行

如果没有足够的数据来演习“数据饥渴”的深度学习算法,有两种办理方法:天生合成数据,或者开拓能从小数据中学习的AI 模型。
天生合成数据的方法在自动驾驶领域运用得比较多,即在仿照环境中合成狂风雪、非常行人行为等现实天下中难以得到的图像数据。

开拓能从小数据中学习的AI 模型方法,详细方法如常用于打算机视觉任务的迁移学习,即先在拥有大量标准数据的任务上演习 AI 算法,再将算法学到的知识迁移到另一个数据很少的任务上。
虽然迁移学习在打算机视觉任务上起到了很大的浸染,但是在NLP 任务上,由于普遍缺少标注数据,该方法目前还无法起到很好的效果。

而另一种方法——自监督预演习,则能较好地应对NLP 领域的分外性。
谷歌的 BERT 便是自监督预演习一个很好的案例,让 AI 措辞模型不仅能够根据前面的词预测词,而且还预测后面的词,即能够实现对高下文的双向理解。

Yann LeCun领导的Facebook 人工智能部门便一贯在从事自监督方面的研究。
一个案例是,对措辞模型进行预演习,然后对模型进行微调来运用于识别仇恨辞吐。

在办理小数据问题上,2020 年的发展趋势紧张包括:

1)随着自监督技能的发展,NLP 领域会再度成为万众瞩目的焦点。
下贱的NLP 运用如谈天机器人、机器翻译以及类人写作等,将会茁壮发展。

2)大型科技公司依旧会领衔技能的发展。
开拓预演习措辞模型也是打算密集的,因而在小数据的 AI 模型开拓上,也将遵照“自下而上”的规律,即由科技巨子公司将开拓成果开源给下贱运用的研究者利用。

3)天生真实假数据的合成数据方法和工具将会为那些不像巨子公司一样有海量数据的小公司,供应更加公正的竞争环境。

八、量子机器学习

结合经典机器学习算法和量子 AI 的稠浊模型,不久后将得到实际运用。
量子机器学习借鉴了传统机器学习的事理,不过算法在量子处理器上运行,不仅在速率上要远快于一样平常的神经网络,还能战胜阻碍了当前在海量数据上做AI 研究的硬件限定。

无论是科技巨子还是量子初创公司都正在研究这种稠浊方法,即个中一部分任务由运行在普通打算机上的传统神经网络完成,另一部分任务则由量子神经网络(QNN)进行增强。

例如谷歌 AI 团队自2013年开始就在考试测验为量子打算机开拓算法,而最近的目标则是在现有的量子设备上开拓稠浊的量子—经典机器学习技能。

他们坚信,虽然目前关于量子神经网络的研究还是理论上的,但是在不远的将来,理论上的架构将在量子打算机上得到实现和验证。
2020 年,在量子机器学习方面可以考试测验的方向是:

1)针对量子打算和 AI 这两种世上最强大的打算范式,最开始可以考试测验与经典打算机协作的方法来办理现实问题;

2)量子云打算将会成为云打算沙场的前哨,亚马逊、谷歌、IBM 和微软等玩家将会加大对量子云打算的投入,与此同时,量子打算将会与传统 GPU和CPU 协作增加云打算的附加值。

九、借鉴 NLP 观点理解生命

实际上,自然措辞处理和基因组都是由序列数据所构成的,AI 算法在自然措辞处理领域得心应手,也将会在基因领域博大显技艺。

在自然措辞处理的自监督学习中,AI 算法能够预测句子中缺失落的词,正如句子是多个词的序列,蛋白质也是特定顺序的氨基酸序列。
Facebook AI 研究院和纽约大学的研究者就曾将同样的自监督学习事理也运用到蛋白质序列的数据上。

不同于 NLP 中利用自监督学习来预测缺失落词,在蛋白质序列数据上,AI 要预测的是缺失落或者隐蔽的氨基酸。

而最近最受关注的一项进展便是DeepMind 在基因组方面取得的进展,他们开拓出了名叫Alphafold 的算法,能够理解基因组中最繁芜的难点之一——蛋白质折叠,并终极确定蛋白质的 3D 架构。

而Alphafold 实在就借用了自然措辞处理的观点来预测氨基酸之间的间隔和角度。
在借鉴 NLP 的观点来理解生命体方面,未来可考试测验的方向有:

1)更好地设计药物:现在有一些药物以蛋白质为靶点,然而蛋白质会随着环境的不同发生动态变革,因此理解蛋白质构造以及折叠办法,将能更好地开拓此类药物。

2)AI 算法有助于对蛋白质建模以及理解其架构,而无需深入理解域内知识。

3)在医疗和材料科学领域针对特定功能开拓和优化新的蛋白质设计,将成为可能。
参考:https://www.cbinsights.com/research/report/ai-trends-2020/