揭开618与英特尔数据中心GPU背后的故事

来源:科技正能量

又是一年618。

每到电商销售旺季,都会迎来雪片一样的订单,这既考验电商平台承担的速度和效率,更是对物流公司的分拣和运送能力的检验。互联网让用户变得更为挑剔,用户很难接受狂欢之后的等待,优质的物流则是保证用户体验的第一环。

揭开618与英特尔数据中心GPU背后的故事

今年618期间,上海区域200多家韵达网点全部开启了“预售极速达”服务,旨在将预售订单第一时间送至客户手中。在这项服务的背后,是AI、大数据和IT系统结合的力量。

1)AI让分拣压力化为无形

物流行业,通常有仓储和分拣两个关键环节,而在物流系统中,分拣是最为繁琐,用时最长的环节。

揭开618与英特尔数据中心GPU背后的故事

用户在电商平台上下单,由系统分拣模块,将货物根据订单地址进行区分,分配至不同地点的仓库。订单抵达仓库之后,即开始分拣。接着出库抵达下一级分拨中心或者中转站,最后进入配送。

在电商销售旺季,处于流程前端的下单量会短时间内激增,唯有提高分拣流程的效率,才能提升整个物流系统的效率,为用户提供优质的服务。一些优秀的物流公司,正在求助于AI,在分拣流程的几个关键环节以智能化的手段,获得更高的分拣效率。

为了应对电商购物节期间的业务量洪峰。韵达在分拣中心实施了网格仓策略,借助由视觉人工智能 (AI) 驱动的智能共配分拣系统对快件进行自动分拣。

通常的智能分拣中心,现场的人力并不多,核心业务流程都依靠系统控制,流水线的运行速度也飞快,会有一种看到水在流动的视觉感受,就像是力与美的结合。

在这种“美感”的反面,则是分拣线面临的准确度与低时延的压力。分拣线会对快件面单上的信息进行三段码 OCR (Optical Character Recognition) 检测,由于识别的结果决定着快件在分拣线上的去向,因此该步骤对分拣效率至关重要,对系统的识别准确度和时延有较高要求。

一旦识别出现错误,就会造成分拣线回流,即快件需重新再过分拣线或需要人工分拣;而当错误率较高时,更会加重网点的操作压力。故而,韵达提出系统识别的准确度须达到 95% 以上。另一方面,系统时延与分拣线传输速度息息相关,检测算法的时延会直接影响分拣传输的效率,过慢就会造成快件积压,进而影响分拣速度和派送时效,韵达经过评估后发现智能分拣线系统的时延必须要小于130ms才能满足他们对高效率的需求。 

为了解决这些难题,韵达选择了英特尔的解决方案,基于英特尔® 数据中心GPU Flex系列 170和英特尔® 分发版OpenVINO™ 工具套件来优化其三段码OCR检测系统和分拨视频分析平台性能。

为验证方案性能,韵达进行了三段码 OCR 测试和TSM (Temporal Shift Module) 测试。在三段码OCR测试中,共对2450张图片进行了识别,测试结果显示平均运行时间为 114ms,很好地满足了韵达对低时延的需求;准确度能够达到 97%-98%,也优于韵达 95%的预期基准。

在TSM测试中,选用了1200个视频并分不同实例和批量大小做了测试,测试结果如图所示。

揭开618与英特尔数据中心GPU背后的故事

综合测试和网店测试结果,韵达的视觉AI方案从算力、时延、准确度、并发能力、稳定性和散热能力等多个方面都能很好地满足韵达的需求,并带来了如下企业优势:

第一,提升业务效率并降低成本:智能分拣系统的部署显著提升了分拣线效率,进而提升了派送效率和派送时效;此外,高效的智能分拣系统还帮助韵达实现了人力和成本节约。

第二,优化业务管理和决策:英特尔® 数据中心GPU Flex系列170带来的高算力让韵达实现了更高效的分拨视频流分析,可帮助韵达在跨年度/跨季度预测、合理定价、网点时效提升和奖惩制定等方面做出优化。

2)每个物流场景,都少不了英特尔的身影

实际上,这仅仅只是韵达基于英特尔GPU的解决方案,其实韵达与英特尔和合作远不止于此。

早在2018年,韵达就与英特尔展了全方位的技术交流与协作,英特尔的至强®️ 可扩展处理器及其他一系列软硬件产品技术在“大小件测量”、“数据中心异常检测”以及“件量预测”等多个关键环节上为韵达构建起高效的AI应用底座。

揭开618与英特尔数据中心GPU背后的故事

在2020年,为了利用AI视觉技术解决在物流运输、分拣、派送等过程中遇到的难题,韵达也采用了英特尔CPU及其他软硬件组合,完成了智慧视觉解决方案的优化,实现了分转中心智能数据处理,但也同时遭遇了新的技术挑战:

一方面,由于物流场景的复杂性与多变性,物流行业有着爆仓识别、违规操作分析、车辆到站识别、装载率识别等非常复杂的场景,一个场景甚至会出现几十种不同的情况,未经优化 的算法可能会出现效率与精度问题,影响设计目标的实现。

另一方面,因为视频推理等人工智能负载对于硬件有着严苛的需求,传统的硬件在边缘侧难以满足视频推理在性能、精度、功耗等方面的需求,同时,专用的硬件方案也有成本昂贵、开发与部署门槛高等问题。

当然,从深度学习算法自身来看,面向图像识别的深度学习模型也常会存在解释性差的问题,模型复杂度高、优化困难,计算强度高、对于算力有着较高要求,需要进一步实现算法优化。

在此项目中,英特尔和韵达一起构建了基于至强® 可扩展处理器和酷睿™ 处理器的边缘计算解决方案,将工作负载转移到网络边缘,不仅降低了网络负载与人工智能推理延迟,还切实降低了人工智能基础设施平台的采购成本,以及高带宽网络的部署与运维成本。

值得一提的是,除了硬件之外,韵达还通过英特尔® SVET开源套件快速搭建了视频拉流、解码、抓图编码分发业务,同时利用OpenVINO™️ 工具套件,在英特尔平台上优化了视觉算法,提升了性能。

不止韵达,也有其他物流公司选择了英特尔基于异构的基础设施,利用XPU实现AI推理加速,同时借英特尔® 分发版 OpenVINO™ 工具套件和英特尔® oneAPI工具套件等简化开发与运维,实现应用跨 XPU 的无缝切换。有效监测园区内是否存在攀爬传送带等危险作业,踩踏、暴力分拣等违规作业,以及未戴安全帽等着装安全问题。

英特尔还将以更多、更高性能的专用加速器,持续为物流行业及合作伙伴带来更多场景的优化方案。

3)AI驱动,让每个包裹都能准时送达

通过以上案例,我们也发现不同物流场景中都面临着相似的难题:比如模型开发与维护难度大,计算强度高,再比如专用的硬件方案也有着成本昂贵、开发与部署门槛高等问题。

走向AI驱动的智慧物流,要跨越这些难题,英特尔显然已经给出了自己的答案:

那就是更加全面、异构化的产品布局,用更加完备的软硬件产品组合为全开发链路护航。

  • 通用计算芯片:如至强®️ 可扩展处理器,其部署门槛最低,可以充分利用企业现有的IT基础设施;
  • 通用加速芯片:英特尔®️ 数据中心GPU Flex系列主攻视觉类的AI推理加速,而数据中心GPU Max系列包含有超过1000亿晶体管,可为AI模型的高效训练提供强有力的支持,同时其还能兼顾科学计算,加速多个架构中的SC和AI工作负载;
  • 专用加速器:Habana®️ Gaudi2®️ 的发布也已近在眼前,据悉7月它就会正式与用户们见面,并且在6月27日刚刚发布的MLPerf新一代测试报中,它已经有了先声夺人的表现——不论是大家非常熟悉的BERT、ResNet、Unet模型,还是最近半年异军突起的大语言模型GPT-3,Gaudi2️® 都有非常靓眼的表现。

当然,跨异构XPU的切换,少不了软件的支持。借助OpenVINO™️ 工具套件和oneAPI工具套件等可以帮助用户简化AI应用开发并实现跨XPU的无缝切换。用户可以根据自身工作负载的需求,选择更适合的芯片的运行。

4)小结

物流业是支撑经济社会发展的基础性产业。在数字经济时代,物流不仅是单行道,还促进了新的零售业和新的制造,提高了传统的库存周转率,构建了灵活的供应链。

揭开618与英特尔数据中心GPU背后的故事

随着物流业的规模不断扩大,传统物流的运营模式受到挑战,急需向智能化转型升级。以数字化技术,尤其是AI技术的赋能,物流行业走向智慧化,精细化,高效化是大势所趋。

但AI应用的开发和优化并非易事,尤其是在异构计算兴起的今天更是变得越来越复杂。英特尔拥有强大且专业的技术团队,完备的异构硬件产品布局,易用的软件工具组合,可以为物流乃至更多行业AI应用的开发、部署、落地应用提供支持。

让AI驱动物流行业智能化转型,让每个包裹都能准时送达。

文章版权声明

 1 原创文章作者:黄昏日落,如若转载,请注明出处: https://www.52hwl.com/84801.html

 2 温馨提示:软件侵权请联系469472785#qq.com(三天内删除相关链接)资源失效请留言反馈

 3 下载提示:如遇蓝奏云无法访问,请修改lanzous(把s修改成x)

 免责声明:本站为个人博客,所有软件信息均来自网络 修改版软件,加群广告提示为修改者自留,非本站信息,注意鉴别

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023年7月18日 上午8:15
下一篇 2023年7月18日 上午8:16