快捷搜索:

产业智能化的百度经验:飞桨结合智能云,让A

10月17日-19日,2019年中国谋略机大年夜会(CNCC2019)在姑苏举办,本届大年夜会以“智能+引领社会成长”为主题,1000家机构的代表、8000余人参展参会。百度首席技巧官王海峰在会上颁发题为《深度进修平台支撑财产智能化》的演讲,分享了百度关于深度进修技巧推感人工智能成长及财产化利用的思虑,并深度解读百度飞桨深度进修平台的上风,以及与百度智能云结合助力财产智能化的成果。

 以下为演讲实录:

     各位专家,各位宾客大年夜家上午好!异常荣幸有时机参加天下谋略机大年夜会,异常谢谢中国谋略机学会及大年夜会的约请。本日我跟大年夜家分享的题目是《深度进修平台支撑财产智能化》。

    我们都知道,从18世纪60年代开始,人类已经经历了三次工业革命。第一次工业革命为我们带来了机器技巧,第二次带来了电气技巧,第三次带来了信息技巧。我们回首这三次工业革命的历史会发明,驱动每一次工业革命的核心技巧都有异常强的通用性。虽然它可能是从某一个行业开始,比如机器技巧最开始从纺织等行业开始,但着末都邑利用于临盆生活的方方面面,有异常强的通用性。除了通用性以外,这些技巧都邑推感人类进入一个新的工业大年夜临盆阶段,而支撑这个工业大年夜临盆的技巧有几个特征:标准化、自动化、模块化。而我们现在正处于第四次工业革命的起头,人工智能则是新一轮科技革命和财产厘革的一个核心驱动气力。人工智能会推动我们人类社会徐徐进入智能期间。

    回首人工智能技巧的成长,人工智能技巧的成长阶段有很多分类维度,我理解大年夜概可以归结为:最早期更多都是在用人工的规则,我26年提高入这一行的时刻,着实也是在用人工规则来开拓机械翻译系统;后来徐徐开始机械进修,尤其是统计机械进修,在很长的一段光阴里占主流职位地方,也孕育发生了很大年夜的影响,带来了很多利用财产的代价;深度进修是机械进修的一个子偏向,现在,深度进修徐徐成为新一代人工智能最核心的技巧。

     举几个例子,翰墨识别OCR技巧早期是用规则+机械进修的措施来做,那时刻,一个OCR技巧系统可能会分为几部分,从区域检测、行瓜分、字瓜分、单字识别、说话模型解码、后处置惩罚等一步步做下来。加入深度进修技巧后,我们开始应用大年夜数据进行练习,而且阶段目标也很明确,我们找到一些深度进修的特性,这个时刻一个OCR系统就简化到只必要检测、识别两个历程,范例的基于深度进修的OCR系统大年夜概是这样。跟着深度进修技巧进一步成长,我们开始在OCR里面进行多义务的联合练习、端到端进修、特性复用/互补,这个时刻,以致这两个阶段也不用区分了,而是一体化地就把一个翰墨识别的义务给做了。

     我们再看机械翻译。26年曩昔我进入人工智能领域便是在做机械翻译,当时我们用满坑满谷的规则写出一个翻译系统,此中包括很多说话专家的事情。20多年曩昔,我们做的这个系统曾获得全国比赛的第一,然则这个系统想继承成长,进入一个大年夜规模财产化的阶段,仍旧面临着很多问题。比如说人工规则费时辛勤,而且跟着规则的增添,冲突也越来越严重,挂一漏万,老是很难把所有的说话征象都覆盖到。后来,统计机械翻译在机械翻译领域盘踞最主流技巧的职位地方,像百度翻译八年曩昔上线的第一个版本的系统,着实便是统计机械翻译。统计机械翻译的历程傍边,仍旧要一步一步来做,比如说先做统计的词对齐,然后做短语的提取,再做布局的对齐等等,此中也涉及到人工特性的提取、定向的优化,仍旧很繁杂。大年夜概四年多曩昔,百度上线了天下上第一个大年夜规模的、基于神经收集的翻译产品,这时刻我们可以进行端到真个进修了。当然了,这样一个神经收集,或者说是深度进修的系统,也有它的不够之处,现在真正在线上跑的、天天办事数以亿计人的翻译系统,着实因此神经收集的机械翻译措施为主体,同时交融了一些规则、统计的技巧。

    刚才提及,跟着深度进修的成长,这些技巧越来越标准化、自动化。大年夜家可以看到深度进修有一个很紧张的特征,便是通用性。我们之前做机械进修的时刻,有异常多的模型大年夜家都耳熟能详,比如说SVM、CRF等等。深度进修呈现今后,人们发明,险些我们看到的各类问题它都能很不错的办理,以致能获得今朝最佳的办理效果,这和曩昔的模型各有长于不一样,它具有很强的通用性。

    深度进修所处的位置,一方面它会向下对接芯片,像我们开拓的深度进修框架,也会跟各个芯片厂商联合进行优化,前天我们还跟华为芯片一路做了一个联合优化的宣布;向上它会承接各类利用,不管是各类模型,照样真正的产品。以是我们觉得深度进修框架会是智能期间的一个操作系统。

     我们真正把深度进修大年夜规模财产化的时刻,也会面临一些要办理的问题,比如说,开拓这样一个深度进修的模型或者是系统,实现起来很繁杂,开拓效率很低,也很不轻易;而在练习的时刻,我们在真正工业大年夜临盆顶用的这些模型,比如说百度的产品,都是异常宏大年夜的模型,进行超大年夜的模型练习很艰苦;到了支配阶段,还要斟酌推理速率是不是够快,以及支配资源是不是可控合理。

    针对这几个方面,我们开拓了百度的深度进修平台“飞桨”,英文我们叫PaddlePaddle。我们觉得它已经相符标准化、自动化、模块化的工业大年夜临盆特性。

    飞桨底层的核心框架包括开拓、练习、猜测。开拓既可以支持动态图,也可以支持静态图;练习可以支持大年夜规模的散播式练习,也可以支持这种工业级的数据处置惩罚;同时可以有不合版本支配在办事器上、在端上,以及做异常高效的压缩、安然加密等等。核心框架之上有很多根基模型库,比如说自然说话处置惩罚的根基模型库、谋略机视觉的根基模型库等等。同时也会供给一些开拓的套件,再往上会有各类对象组件,比如说收集的自动练习、迁移进修、强化进修、多义务进修等等。此外,为了真正支撑各行各业的利用,我们供给很多应用者不必要理解底层这些技巧、可以直接调用的办事平台。比如EasyDL,便是可以定制化练习和办事的,基础上可以不用懂得深度进修背后的道理,零门槛就可以用它来开拓自己的利用;AIStudio则是一个实训平台,很多大年夜学也在用这样的平台上课、进修;当然,还包括端谋略模型天生平台。

    飞桨是一个异常宏大年夜的平台,我们着重在四方面发力、且具有领先性的技巧。

    首先从开拓的角度,我们供给一个开拓便捷的深度进修框架;而从练习的角度,可以支持超大年夜规模的练习;从支配的角度,可以进行多端、多平台的高机能推理引擎的支配;同时供给很多财产级的模型库。

    从开拓的角度,飞桨供给一个开拓便捷的深度进修框架。一方面,大年夜家知道这些软件系统都是很多法度榜样员在写,法度榜样员有自己写法度榜样的习气,我们这种组网式的编程范式与法度榜样员的开拓习气异常同等,法度榜样员开提议来会很有效率,而且也很轻易上手;别的一个方面是设计收集布局,深度进修成长很多年,多半深度进修的系统收集都是人类专家来设计的,然则,设计收集布局是很专、很不轻易的一件工作。以是,我们开拓收集布局的自动设计。现在机械自动设计的收集,在很多环境下已经比人类专家设计的收集获得的效果还好。

     另一个方面,大年夜规模练习面临的寻衅。飞桨支持超大年夜规模的特性、练习数据、模型参数、流式进修等等。我们开拓的这套系统现在已经可以支持万亿级参数模型,不止是能支持这样的练习,同时可以支持实时的更新。

     说到多端多平台,飞桨能很好的支撑从办事器到端、不合的操作系统之间,以致不合框架之间的无缝毗连。这里是一些详细的数据,大年夜家可以看到,我们通用架构的推理,它的速率是异常快的。同时,刚才我提到的跟华为的相助,我们针对华为的NPU做了定向的优化,使它的推理速率获得进一步的提升。

     别的一方面,所有这些根基框架,与真正的开拓利用之间还有一步,我们定向地为不合的范例利用供给很多官方的模型库,比如说说话理解的、增强进修的、视觉的等等。飞桨的这些模型都在大年夜规模的利用中获得过验证,同时我们也在一些国际的比赛中测试了这些模型,夺得了很多个第一。

     刚才讲的是基础的框架模型等等,另一方面,我们还有完整的对象组件,以及面向义务的开拓套件,以及财产级的办事平台。

     举几个例子,比如说说话理解,大年夜家知道现在说话理解,我们也都基于深度进修框架来做,像百度的ERNIE。一方面,我们现在用的深度进修技巧是从海量的数据里进行进修,然则它没有常识作为条件。百度开拓了一个异常宏大年夜的,有3000多亿个事实的常识图谱,我们用常识来增强基于深度进修的说话理解框架,就孕育发生了ERNIE。另一方面,我们又加入了持续进修的技巧,从而让ERNIE有一个异常好的体现。下面浅蓝色的线是现在SOTA最好的结果,我们用ERNIE+百科常识——我们常识图谱也有很多滥觞——加进去今后,大年夜家可以看到有很显着的提升。我们更痛快地看到,持续加入不合的常识,比如加入对话常识、篇章布局常识等等,这个系统还可以进一步提升它的机能。

     这是前面讲的一系列套件之一,可以零门槛进入的定制化练习和办事平台。我们这些平台,盼望能低落门槛,赞助各行各业来加速全部技巧立异。现在大年夜概是什么状态呢?现在我们已经办事了150多万的开拓者,此中包括跨越6.5万个企业。在这个平台上,他们自己练习了已经有16.9万个模型。

     飞桨深度进修开源开放平台跟百度的智能云也有很好的结合,依托云办事更多的客户,让AI可以赋能各行各业。这里有一些例子,比如说在农业,我们赞助水培蔬菜的智能莳植;在林业,赞助病虫害的监测识别;以及公开场合的控烟、商品贩卖的猜测、人力资本系统的自动匹配、制造业零件的分拣,以及地震波、藏油猜测,以及更广泛地覆盖通讯行业、地产、汽车等等领域,各行各业都基于这个平台都获得了智能化的进级。

    比如水培蔬菜智能莳植,我们经由过程深度进修平台支持它进行长势阐发、水培规划的精调、情况的节制,使产量得以前进,同时资源得以低落。智能虫情监测也是一样,系统的识别准确率已经相称于人类专家的水平,而且监控的周期也从一周缩短到一小时。

    周详零件智能分拣的案例中,我们真正用这个深度进修系统的时刻,照样有不少工作要做,比如说若何选择分拣的模型,中心也会涉及一些数据的标注,尤其是一些差错case的积累等等,然后在飞桨平台长进行练习进级。

    这是一个工业安然临盆监控的例子,昨天在另一个会上,有一个宾客问我,他们分外想在一些场景下,监控一些欠妥的环节,比如说临盆情况里打手机、吸烟、跃过护栏等等。这些都可以经由过程飞桨的平台自动实现。

    在其他的行业中,比如国家重大年夜工程用地的检测,聪明执法,以及AI眼底筛查都在利用飞桨,还有很多有温度的案例,比如AI寻人,一个孩子4岁的时刻离家走掉,27年今后,经由过程人脸比对技巧,又赞助这个家庭把孩子找回来了,实现了家庭的团圆。截止到今年6月,百度AI寻人已经赞助6700个家庭团聚。除此之外,还有AI助盲行动、AI助老兵圆梦等等这些案例。

     回到深度进修,刚才我说,各行各业都邑从此中受益,实现自己的智能化进级。这是一个第三方的申报,我们可以看到,深度进修给不合的行业都邑带来提升,匀称大年夜概是62%的水平。

     这便是我本日要分享的。百度的飞桨深度进修平台异常乐意跟大年夜家一路,赞助大年夜家实现自己行业的智能化进级,推感人工智能的成长,感谢大年夜家!

本文属于原创文章,如若转载,请注明滥觞:财产智能化的百度履历:飞桨结合智能云,让AI赋能千行万业http://news.zol.com.cn/729/7299014.html

news.zol.com.cn true http://news.zol.com.cn/729/7299014.html report 8775 10月17日-19日,2019年中国谋略机大年夜会(CNCC2019)在姑苏举办,本届大年夜会以“智能+引领社会成长”为主题,1000家机构的代表、8000余人参展参会。百度首席技巧官王海峰在会上颁发题为《深度进修平台支撑财产智能化》的演讲,分享了百度关于深度进修技巧推感人工智能成长及...

您可能还会对下面的文章感兴趣: