心肺复苏模型

新闻分类

百度万亿级图检索引擎!四大预训练模型开源,还“发糖”15亿元!

百度万亿级图检索引擎!四大预训练模型开源,还“发糖”15亿元!

发布日期:2022-03-11 作者:WLT 点击:

雷锦·陈梦发自奥菲神庙qubit报道|微信官方账号QbitAI

又是一年520,又是一年爱情...

停下来。这不是打开它的方法。

看~也是为了“节”,却吸引了五湖四海的开发者聚集于此。


1.jpg


这就是深度学习开发者的“既定”活动——Wave Summit 2021。

百度Feipaddle作为国内最大的深度学习平台,也在520这样的日子里为开发者带来了不少“糖”:发布Feipaddle开源框架新版本2.1,发布全新大型地图检索引擎开源文心厄尼四大预训练模型,发布全新推理部署导航地图...

此外,还有15亿资金,其中10亿将“分配”给10万家企业和百万产业AI人才。

与以往不同的是,本次峰会透露出一种全新的基调——大融合、大创新。

百度首席技术官王海峰表示:

从技术角度看,多技术融合创新,知识与深度学习的结合,突破了知识增强的深层语义理解,在相同参数尺度条件下,效果大幅提升,可解释性更强。

从平台上看,深度学习平台与芯片软硬件融合创新,面对各种不同硬件配置的生产环境,满足不同计算能力、功耗、时延等多样化需求。,实现AI应用的最佳效果。

从产业角度来看,人工智能技术越来越深入地与产业结合,在产业需求的驱动下,不断打磨AI技术和平台能力,与应用场景融合创新。


2.jpg


△百度首席技术官王海峰

此外,降低AI门槛是本次峰会的另一个重点,这是加速多元化和产业化进程的核心。

至于整合创新,降低AI门槛,如何将AI价值带入行业,实现高效率、高质量的量产,百度集团副总裁吴添认为:

AI工业量产首先是在企业的生产活动中一步步实现的。进一步发展,将从企业内部的多人多任务分工走向全社会的AI量产协同。


3.jpg


△百度集团副总裁吴添

接下来,我们来看看WAVE SUMMIT 2021。六个新版本

飞桨开源框架2.1版

作为国内最大的深度学习平台,本次峰会再次迎来升级——2.1版本。

专注!

四大功能重点优化:设置自动混音精度优化:以ResNet50和BERT为例,启动该功能后,训练速度可提高3倍。动态图形功能增强:新增原地操作功能,内存占用减少17%;优化Python/C++交互开销,训练速度提升10%。高级API:新支持GPU预处理、混合精度和模型共享机制。尤其是自定义运算符功能的升级,大大降低了学习和开发自定义运算符的成本,大大提高了开发的灵活性。

于是,一张2.1版本升级后的百度飞桨全景图上线了。


4.jpg


在这张全景图中,除了上面提到的核心框架开发功能的优化,百度Feipaddle这次的升级远不止于此。

大规模图形检索引擎

分布式训练中百度飞桨2.1的发布,是一个大规模的地图检索引擎,核心亮点如下:

支持万亿边分布式图的存储和检索,支持线性扩展。

比如在与网易云音乐的合作过程中,“主播推荐”就使用了这个功能。

支持亿边图模型的训练,有效解决冷启动问题,提高主播推荐场景的有效播放率。


5.jpg


不难看出,大规模地图检索引擎的发布,让百度Feipaddle具备了更强的工业场景应用特性。

文厄尼的四个前期训练模型都是开源的

在框架层之后,是模型套件层方面。

介绍了开源文新ERNIE的四个预训练模型:ERNIE-Gram:提出了一个显式n-gram掩码语言模型。通过引入多粒度语言知识,增强了预训练模型的效果,领先于五个典型的中文文本任务。ERNIE-Doc:针对长文本建模不足的问题,提出了回溯建模技术和增强记忆模型的机制,并在13个长文本理解任务中取得了领先效果。ERNIE-ViL:针对跨模态理解问题,基于知识增强的思想,实现场景知识融合的跨模态预训练,在5个跨模态理解任务中成绩领先ERNIE-UNIMO:进一步增强不同模态间的知识融合,通过跨模态比较学习同步提升跨模态语义理解和生成、文本理解和生成的效果,在13个跨模态和文本任务中成绩领先。


6.jpg


但在复杂的语义理解需求下,这四种预训练模型都能发挥各自的长处。

同时也可以实现技术融合,达到“1 > 2”的创新效果。

不仅能理解语言,还能理解图像,实现统一的跨模态语义理解。

推进器推理部署工具链和导航图

除了开发、训练和套件,推理部署工具链的节点也进行了升级:PaddleSlim:进一步优化剪枝和压缩技术,增加非结构化稀疏工具;率先支持OFA压缩模式,保证压缩后的精度。Paddle Lite:面向移动开发者的开箱即用工具集LiteKit发布,大幅降低了端侧AI开发者的开发成本。Paddle Serving:增加一个完全异步的流水线模式,更好的支持真实业务中模型组合的问题。Paddle.js: New支持多种后端和主流的图像分割和分类模型,兼容性强,性能高。

除了升级现有的推理部署工具链,飞桨还提供了推理部署导航图。

据了解,目前已经覆盖了300多条完全验证的部署路径,从而形成了如下图所示的导航地图。


7.jpg


在这棵树中,从根到每个分支的路径都是完整的路径,可以帮助开发者成功实现AI部署。

而之所以这么做,百度Feioar给出了他的理由:

每一次“成功”都有迹可循,每一次“失败”都可以追根溯源。

硬件生态成就

除了“软”的一面,发布部署也有“硬”的一面。

据了解,飞桨已与百度昆仑等22家国内外硬件厂商合作,开展适配和联合优化工作,31款芯片或IP已经完成或正在适配。

这包括英特尔、英伟达、华为、广海、瑞芯微、安霸等芯片公司。


8.jpg


更具体地说,有超过50个模型的螺旋桨适应广海DCU。

可见,在部署环节的硬件生态方面,百度Feipaddle已经全面覆盖国内外硬件厂商。

云原生机器学习核心PaddleFlow

随着人工智能技术向行业应用发展,出现了更广泛的AI开发场景,对平台提出了更多样化的需求:针对更广泛的垂直行业AI应用开发需求,针对深度定制的AI开发平台需求,有AI原生容器服务。

基于此,百度AI产品R&D部总监新舟宣布正式启用——PaddleFlow,即paddle企业版的“核心”。


9.jpg


△百度AI产品R&D部总监,新洲

简而言之,这是一个专为AI平台开发者设计的云原生机器学习核心系统,易于集成。

它的特点也非常明显,就是云原生、性能优秀、轻量易用等。

可以帮助AI平台开发者高效构建更加细分的场景和深度定制的AI平台。

……

除了以上六大版本,还有一些重大升级。

去年正式发布了propeller PaddleHelix,但今天正式升级到了1.0版本,增加了复合预训练模型ChemRL,并将ChemRL模型应用于更多的下游任务。

凭借propeller的能力,百度于今年3月在国际权威的图形神经网络OGB上获得了HIV和PCBA两个涉毒数据集上的双冠军。


10.jpg


作为国内首款支持量子机器学习的测桨,与飞桨框架2.0及以后版本同步更新,整体运行速度大幅提升,平均提升21.9%,核心应用场景最高提升40.5%。

同时在测桨中加入了量子核方法等特征提取方法。

针对难度较大的纠缠纯化任务,测桨增加了优化的量子纠缠处理框架,给出了目前业界最佳的可实施的纯化方案。还“送糖”15亿元。

除了上面提到的“六大发布”,在本次浪潮峰会2021上,百度飞桨的“分糖”还在继续。

而且是很实在的一种“糖”——给钱,15亿。

在百度飞桨的“大航海”计划中,除了去年年底上线的高校AI人才培养“启航”,还包括:“大航海”护航计划和“大航海”领航计划。

“大航海”护航计划

10亿元,这是护航计划未来三年的资金投入。

对谁?

10万家企业,百万工业AI人才。

怎么会?

整体上分为技术、人才、生态三个方面。


11.jpg


为企业保驾护航,就要实现智能化升级,通过技术赋能、市场营销、资源引入等方式,缩短从技术创新到商业落地的路径,包括:飞桨技术合伙人计划、飞桨企业版(Gravity)、飞桨中国行。

为人才保驾护航的是AI私人俱乐部、AI快速通道、AICA首席AI架构师培养计划。


12.jpg


△百度AI技术生态部总经理刘谦

“大航海”试点计划

这个计划是针对核心开发者的,目标是与社区开发者一起构建开源生态系统,探索前沿技术。

包括PPDE(飞螺开发者技术专家计划)、PPSIG(飞螺社区特殊兴趣小组)、飞螺飞行员小组、博士协会等组织形式。


13.jpg


与行业内优秀开源社区和开源项目合作,系统设置研发方向,包括探索生物计算、量子计算等前沿方向。

据了解,目前已有120个PPDE获得认证,飞桨城市/高校试点群体已覆盖150个城市。

AI人才产教融合培养计划正式发布。

事实上,在《领航》和《护航》发布之前,百度飞桨早在去年年底的WAVE SUMMIT+2020就已经启动了《大航海》系列的航行计划:

未来三年,飞桨将投入价值5亿元的资金和资源,支持全国500所高校,重点培养5000名高校AI教师,联合培养50万名AI学生。

时隔近半年,这个计划取得了什么成果?

基于丰富的行业实践,飞桨在高校人工智能实践课程开发中,开设了包括人工智能全技术层面在内的50多个实战案例,到7月底将积累100多个案例。

高校教师深度学习师资培训,目前Feipaddle已举办14期,为570所高校培训200医学教师,帮助226所高校开设学分课程。

承办过中国大学生计算机大赛等多项比赛,为大学生提供实习项目和就业指导,培养适应行业需求的复合型人才。

会上还举行了飞桨与三所高校创新创业实验室合作签约仪式。

包括清华大学基础产业实训中心、吉林大学创新创业实验室、郑州大学人工智能工程应用实验室。

他们将与飞桨一起,共同推动产学研融合发展,打造智能产业后备军,开启产教融合新时代。

最后,除了六大发布和三大生态计划,浪潮峰会还联合信通院发布了《飞橹开源生态报告》(后台对话框回复“信通院”获取)。

报告指出,人工智能行业已经进入工程应用爆发的窗口期。开源框架可以降低整个行业智能化升级的难度,提高其广度和深度。

飞橹以区域化、特色化、规模化发展,开启国内开源新生态,加速产业链跨界协同创新,构建人才培养体系。

该网站还正式宣布了开源框架前沿模型再现比赛。


14.jpg


这是由传播学院主办的人工智能创新与应用大赛的子赛道,将由百度承办,希望挖掘和培养更多人才,沉淀更多前沿模型,推动整个人工智能的发展。整合是为了更好的创新。

融合,这是贯穿常态峰会始终的一个“主旋律”。

那么百度Feioar力推“集成创新”的背后是一种怎样的逻辑呢?

首先,集成创新是时代的需求。

不同于以往的算法优先,人工智能进入工业量产阶段,需要算法、数据、计算力的合力发挥,碰撞出更多创新的新价值。

这一次,在开发、培训、部署等环节,百度飞桨的细节技术升级都是基于这样一个原则。

比如文心厄尼开源的四种前期训练模式,在技术上不是“单线程”,而是“1 > 2”,产生更多的创新价值。

其次,企业发展到一定程度后,面对激烈的行业竞争,单靠技术的发展是无法突破固有瓶颈的。

只有跨界融合,模式创新,才能适应日益严峻的竞争。

但除了技术和跨界的融合,还有一点很重要,不可或缺。

那就是深度学习平台开源生态的整合与创新,包括行业、开发者社区、人才培养。

这对应了百度飞桨的“大航海”系列计划。

截至目前,飞桨已聚集320万开发者,服务12万家企业,创造36万个模型,涉足医疗、金融、娱乐、环境、能源、工业制造等多个领域。

之所以能达到这样的规模,正是因为技术、模式、人才、跨界等诸多方面的融合创新,大大降低了AI开发的门槛,丰富了产生的价值。

既能创建灵活全面的建模方法,又能满足定制场景的需求。

那么,集成创新下的AI价值应该以什么样的路线带入工业生产活动?

对此,百度集团副总裁吴添总结了一条三段式路线:为了支持开拓者在寻路阶段的快速验证落地,Feioar为行业引入AI验证提供了真实场景打磨的工业模型库,通过便捷的多终端、多平台部署推理机,解决AI落地的“最后一公里”问题。为了帮助工场应用阶段的团队应用AI创新,百度飞桨降低了门槛,让小团队不用重复做轮子,从移植重用到针对性重写再到完成自研的全流程提供支持。为了支持工业量产阶段的多人多任务协作,通过对计算能力资源的高效管理和开发者的集成开发环境,提高整个过程的效率。开源并支持多种硬件,可以实现多个企业间的社会化协同生产。

可见,飞桨已经走过了AI产业化应用的整个阶段,为大家找到了一条可借鉴、可实现的道路。

你觉得这个百度飞桨和这个520够诚意吗?

结束-

量子QBITAI头条号签约

关注我们,第一时间了解前沿科技动态。



本文网址:http://www.xizd.com/news/949.html

相关标签:医学教师

最近浏览:

相关产品:

相关新闻:

在线客服
分享