“母猪正在生产中,无法实时知道有几只猪崽,康健情形如何”,一位坐拥上数千头猪的河南养猪大户最近总是陷入这样的焦虑。
席卷全国各地的猪瘟刚刚过去,为了加强防护,他的猪场险些开启了无人养殖的模式,这也为他带来了很多头疼的问题。
事情职员进出一次猪棚,须要消毒、检测,全副武装,对付大规模养殖来说,本钱、耗时不说,更主要的风险很高,他清楚地记得一头猪传染猪瘟,导致猪棚内上百只猪去世亡的画面。
在严格的掌握职员进出的情形下,像“猪口普查”,“康健检讨”等事情也变更难了。
回忆起去年这个时候的焦虑,这位养猪大户轻松了不少。现在的他通过AI技能,可以在家中实时监控猪棚内的状况、判断猪崽的康健状态。
不仅降落了管理的风险和本钱,提高了效率,而且还避免了因其他事情职员履历不敷,而对猪崽康健状况的判断失落误,这也是大规模养殖普遍存在的一个痛点。
而这项AI技能便是百度的零门槛AI开拓平台—EasyDL。
“零代码”搞定AI需求
EasyDL是基于百度飞桨深度学习平台推出的高效易用的零门槛、一站式AI开拓平台,支持智能数据、模型开拓、做事支配等全流程做事。目前已经支持图像分类、物体检测、图像分割、音视频分类、语音识别自演习、表格数据预测、文本分类、情绪方向剖析等任务类型,可以帮助中小企业结合业务需求,办理效率和本钱的问题。
怎么理解呢?
比如,上述猪崽体检方面,用户只需将病猪的图像数据导入EasyDL平台,演习定制化AI模型,就可以将“人为诊断履历”复制为机器学习履历,再经由物体检测技能,无需人眼不雅观察也可以准确判断猪崽的康健状态。
如此来说,EasyDL可以理解成:根据定制化场景需求,通过学习“有履历的专家知识”,来代替人类办理规模化的繁芜问题,进而提升本钱和效益。
值得一提的是,百度AI平台研发部总经理忻舟,在接管雷锋网采访时多次提到:
“EasyDL的目标是降落AI门槛,让零算法根本的用户,不用一行代码也可以基于需求和数据,定制自己的AI办理方案”。
这一点在AI养猪、肉牛称重,工业质检、桥梁检修等诸多成功案例中都有所表示,而且也普遍受到了用户的好评。
但忻舟也强调:
“大略不虞味着妥协,EasyDL会始终秉持最初的研发理念:大略且专业”。
自2017年底上线,到如今近三年的技能研发和迭代,EasyDL在数据做事、模型精度、支配做事等方面不断升级,已经能够处理更多、更繁芜的运用处景。
在这里,忻舟为我们分享了一个范例案例:EasyDL帮助一家专业猎头公司办理了其核心业务问题。
这家公司名为瀚才猎头,自创立以来一贯面临着一个核心问题:200万条数据的人才库,利用率只有不到10%。
作为一家猎头公司,如何高效地为客户推举得当的人才是他们的核心业务,也是其在行业发展中的核心竞争力。
瀚才猎头有5位创始人,在业务发展过程中积累了很多主要的客户资源和弘大的人才库,但其非构造化数据库和传统简历初筛方法,让这些资源和上风没有得到很好的发挥和利用。
而这个局势在利用EasyDL后发生了改变。以前按照关键词搜索的方法,每天只能找到60-70份得当的候选者简历,现在经由数据构造化处理后,20分钟就可能达到600-1000份,而且精准度达到了95%以上。
全体效率提升了200倍,节省了韶光、人力本钱的同时,200万简历库也得到了充分的利用。
一位创始人坦言,他们之以是选用EasyDL,不仅是由于数据构造化的效果好,更主要的是其零开拓门槛、一站式做事的特性,节省了自己配置技能团队,做数据处理、算法研发和算力支持的本钱。
那么,无任何开拓履历的HR是如何完成AI模型演习和支配的呢?
EasyDL操作流程只需以下四步:创建模型、数据准备、模型演习和运用支配。
他们根据业务需求,按照“职级”和“职能”两级分类对200万数据的人才库进行了却构化处理:
创建模型:登录EasyDL平台,完成注册和模型选择。
数据方面:200万人才数据,手动标记1万条,再通过EasyData智能标注完成剩余199万条数据标注。
模型演习:导入全部数据,在平台内置的文心(ERNIE)预演习模型根本上进行演习。
支配方面:演习好的模型可直接天生供调用的API,而且有完善的SDK代码包可以利用。
可以看到,以上操作过程无需任何代码根本,只要按照业务需求,完成数据处理和提交,选择支配办法即可,而且精准度很高。不过1小时的AI模型演习,帮助他们办理了自创业以来最头疼的业务问题。
其余,须要强调的是,以上看似大略,易操作的背后,是其内部繁芜、前辈的AI技能支持。
降本增效,一站式AI做事
在数据处理环节,EasyData供应了数据采集、洗濯、扩充、标注全方位做事。
根据2019年AI机器学习项目调研的报告,96%的企业都在“数据”一环碰着了难题,尤其是数据标注,耗时,而且准确度不高。
针对这一问题,忻舟先容称,EasyData供应了丰富的智能标注方案,支持物体检测、图像分割和文本分类三种数据类型的智能标注,只需标注少量数据,别的便可通过“智能标注”自动完成。在相同任务和同等模型效果下,数据标注量均匀可以减少70%。
在上述简历库的文本分类中,员工手动标记了1万条,别的199万全部是自动完成。
其余,在数据采集、洗濯和扩充方面也常常涌现问题。忻舟先容称,一家做果蔬智能识别系统的创业公司,他们的果蔬电子秤,在超市试运营时,常常会涌现因物体遮挡、光芒不敷,导致数据采集质量差的问题。
在利用EasyDL后,通过对图像数据进行相似度的去重去模糊,剪裁,旋转,镜像以及数据增强等处理,在50种水果的测试中,准确率达到了95%以上。
同时,EasyDL还在数据采集方面,提前对端设备进行了测评和适配,免除了利用者在设别选型、调试和集成开拓事情上的本钱,将采集效率从“周级”提升到了“小时级”。
末了,忻舟重点强调称,EasyDL根据实际的用户需求还供应了数据回流功能,在数据处理上形成了一个完全闭环,使数据处理更加高效。
在模型演习方面,EasyDL内置了基于百度海量数据库的超大规模视觉预演习模型和文心ERNIE 2.0。“这也是EasyDL性能远超其他AutoDL产品的独特上风”,忻舟强调称。
瀚才的简历文本分类采取文心(ERNIE)预演习模型,演习效果达到了95%+。预演习相称提前学习了大量NLP语料,在一定的背景知识下,再通过持续学习的语义理解框架,对输入数据进行识别,可以有效提高识别的精准度。
在模型演习上,百度还领悟了自研的高性能自动数据增强(Auto Augment)、自动超参搜索(Auto Finetuner)和NAS(自动网络架构搜索)等自动化建模技能,可以进行模型自动调优,降落算法工程师的调优本钱,同时,模型精度也可以均匀提升10%以上。
在做事支配环节,EasyDL供应了公有云 API、本地做事器支配、设备端 SDK、软硬一体产品,4大支配办法,用户只需经由大略的设置,就可以将演习好的模型转换为知足业务场景需求的做事。
个中,设备端 SDK,适配了NV Jetson 系列、Intel 神经加速棒、华为 NPU、华为 Atlas、高通 DSP、RK 等十几种业界主流的端设备。
在软硬件一体支配上,EasyDL适配了市情上6种高性价比的软硬件,覆盖高中低全矩阵,模型识别速率可提升十倍,例如EasyDL加小体积低功耗的英特尔芯片,在轻量级模型MobileNet V2上,25毫秒就可以完成端到真个预测和推理;英伟达Jason可以知足中高性能和超高性能的场景化需求,而它在V2模型上只须要4毫秒。
加速AI落地,直击各行各业
2020年,EasyDL开始走向加速AI场景化落地的阶段。
AI落地,是近些年人工智能家当发展的主旋律。一方面,打算机视觉、自然措辞处理等技能已逐渐趋于成熟,急需走向现实场景发挥代价,另一方面,随着社会的快速发展,中小企业的AI需求空间也在进一步突显。
但要想在AI和需求之间达到最佳匹配,还存在很多寻衅。
从2017年正式上线,实现从0到1的跃迁,到2018年成功案例的大量涌现,EasyDL在AI落地方面已经初见成效。忻舟表示,2020年,随着技能的逐步成熟,EasyDL会加快落地速率,进一步提升AI落地能力。
详细来讲,将连续从以下三个难点入手:
AI门槛:这是所有企业寻求智能化转型的紧张痛点,尤其是对付中小企业而言,一方面不懂技能,不知道哪些场景需求可以通过AI来实现。纵然理解,对付繁芜的AI技能,学会运用也是一大难点。
另一方面,对付有技能团队的企业来讲,AI底层根本举动步伐哀求很高,须要大量的资源、本钱投入,而且终极达成的效果可能也未必能够知足需求。
从这两点出发,EasyDL一贯致力于开拓零算法根本,大家可用的AI开拓平台,同时,基于百度的海量数据和研发上风提升模型演习性能,打造从端到真个一站式做事,知足算法工程师们的运用需求。
目前EasyDL的零门槛、专业性强等特性已经被中小企业广泛吸收,其官网显示,利用EasyDL的用户数已经超过70万,覆盖20多个行业场景,包括互联网、工业、农业、医疗、物流、零售、教诲、交通等;
定制化需求:各行各业有着丰富的定制化场景需求,个中,最为明显可以说是零售行业,如商品检测中的相似、遮挡检测,智能结算中的 SKU 快速更新等,都须要定制化的AI办理方案。
在这方面,EasyDL除了供应通用版本外,还开拓了零售行业版。为了应对更繁芜场景的检测需求,零售版紧张新增了以下核心功能:
打造软硬一体的全自动 SKU 采集箱,降落 SKU 数据采集本钱,让采集数据更加标准、规范。
自动图像合成技能,基于SKU 单品图和货架图,自动合成各种实景图,仿照真实场景中物品的遮挡、旋转、重叠等状况,提高模型的泛化能力。
供应除商品检测外的翻拍识别、货架拼接、货架层数识别、价签识别等增值功能,并供应完善的 SDK。
基于以上技能,零售版已经在商品陈设审核、无人药柜等多个场景下被广泛利用。百度团队透露,接下来,还会针对农业、工业等行业推出更多定制化版本。
AI技能能力:它是任何AI产品运用落地的根本,也是核心。在这方面,基于百度飞桨开源深度学习平台的EasyDL具备独特的领先上风。
一样平常来讲,市场上AutoDL产品的核心竞争力,无外乎两个方面:一是效率问题,AI运用最根本的诉求便是如何帮助企业降落韶光本钱,抢占市场先机。
环绕这一点,EasyDL在模型方面,基于飞桨的超大规模预演习、并行演习,显著提升模型演习速率;在数据做事方面,为数据采集提前适配主流硬件,并供应从采集到回流的完全办理方案,节省数据处理韶光。EasyDL是业内首个供应一站式智能数据做事的产品。
末了值得一体的是,设备真个支配做事。忻舟先容称,边缘端支配由于算力低、内存小的特性,近些年在行业内非常火爆,用户需求非常大。因此,为企业供应高性能的边缘端支配方案也是EasyDL的重点研发方向。
二是利用效果,这是知足企业AI需求的关键性指标。从技能层面来看,可以详细理解为文本分类的准确性,物体检测的精准度。
在这方面,EasyDL内置的基于飞桨的文心ERNIE和超大规模图像预演习模型发挥了独特上风,经检测,在视觉任务中,通过百度数据库10万+分类、6500万张图片演习的预演习模型,均匀精度可提升 3.24%-7.73%;在物体检测任务中,经由800+标签、170万图片,1000万+检测框演习的预演习模型,均匀精度可提升1.78%-4.53%。
除此之外,百度团队还升级了模型压缩技能,通过降落端侧模型体积,进一步提升模型性能。
末了谈到EasyDL的进一步研发方向,忻舟表示,将连续环绕大略、但更专业的理念来开展,详细来说涉及以下几个方面:
覆盖范围:除了扩展已有的算法类型,如 CV、NLP,传统ML方向,措辞识别方向外,还将推出OCR、视频追踪等定制化能力。
技能优化:持续提升模型效果,提高演习速率和精度,加速模型推理。同时结合不用场景,推出更多类型的预演习模型。
易用性:在数据、模型、做事等方面,持续降落利用门槛。
其余,忻舟还重点提及了EasyDL的共享生态培植。他表示,希望更多企业能够加入到EasyDL落地中来,通过真实的业务需求,探索更多AI运用空间,由此,EasyDL也能够根据实际场景,不断提升技能能力,为更多企业赋能。
出于这一目的,百度团队近日还推出了“万有引力操持”,进一步降落AI门槛,助力中小企业降本增效。
削平“AI门槛”,挖掘潜在场景
毋庸置疑的是,AI运用处景巨大且丰富,但须要深度的探索和挖掘。
这次,为了颠覆各行各业对AI高门槛的认知,百度EasyDL面向所有中小企业推出了——万有引力操持。
该操持旨在为万家有AI需求的企业各供应一万元专项基金,推动其智能化转型。
通过EasyDL经典版免费完成模型定制、支配与运用,即可领取万元专项代金券。
无需理解算法细节,最快10分钟就可以演习出高精度AI模型。如果AI落地效果突出,还有机会得到最高十万元的分外补贴!
参与详情见:百度EasyDL零门槛AI开拓平台。雷锋网雷锋网