大家好,我是卖萌酱。
制造业作为国民经济主体,是国家创造力、竞争力和综合国力的重要体现。作为制造强国建设的主攻方向,智能制造发展水平关乎我国未来制造业的全球地位。制造业与物流结合紧密,随着制造业的高速发展,对自动化率、全产业链协同和生产效率再提高等方向均提出了更高的要求,需要物流仓储能够匹配相应的生产节奏。同时,据统计,我国制造业生产成本中,物流占比高达三成,降低物流成本成为了制造业利润提升的关键一环。今天,小编锁定智能制造-精益物流场景,分享从快递单信息抽取到智能立体库盘点两大产业落地方案。
5条标注数据搞定物流快递单信息抽取
据统计,2021年国内快递件数超1000亿件。作为劳动密集型产业,固有模式下出现的快递人员短缺、配送效率疲软、物流承载有限等问题,俨然成为物流行业面临的最直接挑战。利用智能化手段来提高工作效率、提升用户体验,是物流行业最强烈且迫切的需求。在下单环节,“买卖东西一时爽,信息输入超麻烦”、“门牌号、手机号码,这输错一个数字就是千差万别”、“名字还有生僻字,找都找不到”都道出了不少人的心声,特别是每天都需处理大量订单的商家和物流工作人员更是苦不堪言,而这个问题可以靠NLP信息抽取技术来解决。
飞桨自然语言处理模型库PaddleNLP开源通用信息抽取技术UIE,能够大大加快快递单信息结构化效率。可以实现从用户提供的文字信息中快速抽取姓名、电话、省、市、区、详细地址等内容,形成结构化的信息,降低客户填单成本。
图1:物流快递单信息抽取
信息抽取是一个行业应用价值很高的技术,却因为任务多样、领域多样、数据获取和标注成本高,导致落地成本居高不下。由中科院软件所和百度共同提出的大一统诸多任务的通用信息抽取技术UIE(Universal Information Extraction),在实体、关系、事件和情感等4个信息抽取任务、13个数据集的全监督、低资源和少样本设置下,均取得了SOTA性能,这项成果发表在ACL’22 [1]。飞桨PaddleNLP结合文心大模型中的知识增强NLP大模型ERNIE 3.0,发挥了UIE在中文任务上的强大潜力,开源了首个面向通用信息抽取的产业级技术方案,不需要标注数据(或仅需少量标注数据),即可快速完成各类信息抽取任务。
图2:传统方案 vs UIE统一建模方案
在物流快递单信息抽取任务中,仅标注了5条样本,F1值即提升18个点,达到93%。相对于传统序列标注方案动辄标注几百条、几千条的高额标注成本,PaddleNLP开源的通用信息抽取工具简直是国货之光!
这么酷炫的技术能力,如何快速应用到业务中呢?
通过调用paddlenlp.Taskflow API即可实现零样本(zero-shot)抽取多种类型的信息,话不多说,直接上代码,看效果:
# 快递单信息抽取
from paddlenlp import Taskflow
schema = ['姓名', '省份', '城市', '县区']
ie("北京市海淀区上地十街10号18888888888张三")
>>> [{'姓名': [{'text': '张三', 'start': 24, 'end': 26, 'probability': 0.97369767177317}],
'城市': [{'text': '北京市', 'start': 0, 'end': 3, 'probability': 0.9992830142165161}],
'县区': [{'text': '海淀区', 'start': 3, 'end': 6, 'probability': 0.9997933003097614}]}]
对于复杂目标,可以标注少量数据(Few-shot)进行模型训练,以进一步提升效果。PaddleNLP打通了从数据标注-训练-部署全流程,不仅能够方便地进行定制化训练,在部署阶段我们也提供了基于ONNXRuntime引擎部署、半精度(FP16)推理等多种加速方案,满足CPU、GPU等不同场景下的部署需求。
GitHub地址:
https://github.com/PaddlePaddle/PaddleNLP/tree/develop/model_zoo/uie
所有源码及模型均已开源,欢迎大家使用,star鼓励~
此外,PaddleNLP还开源了物流快递单信息抽取产业实践范例,通过完整的代码实现,提供从数据准备到模型调优的全过程解析,堪称产业落地的“自动导航”。百度高工还将带来手把手进行全流程代码实践,轻松直达项目POC阶段。
飞桨产业实践范例:
https://aistudio.baidu.com/aistudio/projectdetail/4038499
智能立体库盘点
物流行业的货物存储库有从单一存储特性的立体库向多功能智能化物流仓转化的发展趋势,包括赋能智慧物流集收货、配送、分拣、客户化定制等功能一体的智能物流库,赋能智能制造集存储、线边自动补给、集成自动化生产工艺为一体的多功能物流库。
针对这一趋势下的多功能智能化物流仓进行智能盘点,相较传统物流仓而言,其难度也增加了不少,主要包括:前端工艺、安全管理制约、存储点动态监控、全流程多点监控等,如图3所示。
图3:多功能智能化物流仓的智能盘点难度
飞桨零门槛AI开发平台EasyDL可从0到1快速构建针对多功能智能化物流仓的智能盘点的AI模型,最快15分钟即可完成模型训练。使用流程如图4所示。
图4: AI模型训练及部署流程
无需关注模型细节,即便是没有任何AI基础,也能快速上手使用!使用EasyDL-图像分割任务进行模型训练,最终模型效果可以达到99.9%,充分满足产业应用的需求。
图5: 模型效果
物流行业自动化近年来蓬勃发展,智能化立体库、自动码垛、自动搬运、自动装车、智能分拣等相关设备在各行业应用广泛。在产品在途、在库信息查询、产品溯源等各个环节中,AI技术都发挥了至关重要的作用,大大节约了物流成本,提高了物流效率和盘点效率。
即刻上手使用EasyDL,快速构建属于您的AI盘点模型吧!
飞桨EasyDL官网地址:
https://ai.baidu.com/easydl/
精彩课程预告
6月7日,百度高级工程师和太原市凯创科技总经理将带来直播讲解,分析物流快递单信息抽取和智能立体库盘点项目中的技术难点,分享业务落地经验,深入讲解PaddleNLP和EasyDL的玩法和潜力,通过以下海报扫码预约,进群还有更多福利哦~
扫码获取视频课程链接
加入技术交流群
更多精彩抢先看
相关文献:
[1] Unified Structure Generation for Universal Information Extraction.