本文约8688字,建议阅读15分钟
本文介 绍了华为云边缘云创新实验室启动的边缘AI研发落地生态挑战调研结果。
随着边缘设备的广泛使用和性能提升,将机器学习相关的部分任务迁移到边缘,也即边缘AI技术,已成为必然趋势,甚至能够同时结合云侧算力和边侧数据来完成机器学习任务。机器学习服务将边缘产生的数据转换为知识的过程中,需要在边缘快速响应并处理本地产生的数据。在落地过程中,我们发现,在连接海量边缘节点的边缘云时代,随着AI服务与边缘用户的距离缩短,通用AI原本部分挑战在边缘场景下变得更加尖锐。
基于一些落地经验,华为云边缘云创新实验室(ECIL,Edge Cloud Innovation Lab,Huawei Cloud)系列文章中曾介绍过数据异构等四大技术挑战。针对这些挑战,各个技术方案落地与成果转化到产业的进程正在紧锣密鼓地进行。但仅凭技术是不足够完成落地和产业转化的。当前学界业界很多团队已经遇到各式各样的困难,比如数据集难以获取、通用方案无法满足特定业务、缺乏商业成功案例等。
因此除了技术挑战外,华为云边缘云创新实验室一直密切关注边缘AI的生态挑战*。为了让更多边缘AI领域的朋友多快好省地完成技术研发落地和商业闭环,华为云边缘云创新实验室启动了边缘AI研发落地生态挑战调研。本次调研通过问卷发放的方式,希望进一步了解边缘AI方案落地与产业落地过程中遇到的生态挑战。截至2021年11月29日,已回收有效答卷175份,问卷开放选项采集到49条补充意见和8条补充建议。对答卷中共计20项量表题项进行分析,信度Cronbach.𝛼**为0.975。
根据调研结果,对边缘AI各角色而言,当前阻碍研发落地,首当其冲生态挑战分别是:
算法开发者:“真实业务数据集及其基线算法、预训练模型难以获取”
服务开发者:“通用方案整体性能不一定满足特定业务需求”
技术布道者:“缺乏商业成功案例”
具体调研报告结果请见下文。
*比如研发资源难获取、工具链不完备等主要依赖社区分工与共享的非技术挑战,在本文中定义为生态挑战
**信度指同一问卷对同一组对象重复测量时所得结果的一致性程度,用于测量样本回答结果是否可靠。如果在0.8以上,则该测验或量表的信度非常好;如果低于0.6,量表就需要重新设计题项。
调研对象职业主要是工业界从业者(53.45%),其次是在校学生(31.03%)和学术界研究者(25.86%)。
调研对象的技术方向主要是边缘AI及其应用(55.75%)、AI及其应用(49.43%)、边缘计算及其应用(42.53%)。也有约四分之一的方向为云计算及其应用(25.86%),以及少量的其它方向(13.22%)。
本问卷中,边缘AI算法开发者是指研发联邦学习、协同推理乃至深度学习调度等边缘AI典型算法的角色。有80.46%调研对象填写了边缘AI算法开发者相关问卷调研选项。对每个挑战的负面影响有四种选项,包括“不了解可跳过”“可维持现状”“建议改进”“亟需改进”。
本章先介绍答卷中关于各个算法开发生态挑战的不同维度调研结果,本章末尾将小结各不同维度的结论。
若选择“不了解跳过”或“可维持现状”记为0分,“建议改进”记为5分,“亟需改进”记为10分,答卷中对边缘AI算法开发者各挑战的平均分值如下图所示。对比认为“还有其他重要挑战”的1.43分,问卷中所罗列的各挑战都超过了5分,可以认为各挑战都有改进的需求。
其中,平均分值最高(6.87分)的挑战是: “真实业务数据集及其基线算法、预训练模型难以获取”
在截尾均值* 6.09分以上的其它头部挑战还包括:
“算法研发迭代中,重复部署整套端边云系统过于沉重”
“缺乏AI工具,包括资源监控、节点仿真、标注工具等”
“算法找不到对应业务场景,或很难得知实际业务落地性能”
*截尾均值指是指在一个数列中,去掉两端的极端值后所计算的算术平均数。在本问卷中用于屏蔽最后一个开放选项的影响,下同。
从“边缘AI及其应用”方向细分工业界、学术界和在校学生等不同职业调研对象(三者在调研对象中的比例大致为2:1:1),细化算法开发者各项挑战平均分:
“边缘AI及其应用”方向下各职业平均分值最高的算法开发挑战分别是:
工业界:“缺乏AI工具,包括资源监控、节点仿真、标注工具等” (平均分7.5)
学术界:“缺乏真实业务及其研究需求的固定来源” (平均分7.14)
在校学生:“真实业务数据集及其基线算法、预训练模型难以获取”(平均分7.68)
在截距均值以上的其它头部挑战还包括:
工业界(截距均值6.19):
“真实业务数据集及其基线算法、预训练模型难以获取”(平均分7.1)
“算法研发迭代中,重复部署整套端边云系统过于沉重”(平均分7)
“边缘AI系统部署等起步过程中缺乏指南文档”(平均分6.35)
学术界(截距均值6.30):
“真实业务数据集及其基线算法、预训练模型难以获取”(平均分6.96)
“缺乏AI工具,包括资源监控、节点仿真、标注工具等”(平均分6.72)
在校学生(截距均值6.77):
“缺乏真实业务及其研究需求的固定来源”(平均分7.41)
“算法找不到对应业务场景,或很难得知实际业务落地性能”(平均分7.59)
对于边缘AI算法开发者,问卷中提及的挑战被选为“亟需改进”的比例通常三分之一左右,高于“还有其他重要挑战”的6.36%,可以认为各个挑战都有相当的迫切需求。
其中被选为“亟需改进”的挑战中比例最高(42.77%)的是:“真实业务数据集及其基线算法、预训练模型难以获取”
在截尾均值(33.33%)以上的其它头部挑战还包括:
“算法研发迭代中,重复部署整套端边云系统过于沉重”
“缺乏AI工具,包括资源监控、节点仿真、标注工具等”
“算法找不到对应业务场景,或很难得知实际业务落地性能”
“边缘AI系统部署等起步过程中缺乏指南文档”
可以看到,除了一个挑战,“亟需改进”和“平均分”头部挑战基本保持一致,这个有区别的挑战是:“边缘AI系统部署等起步过程中缺乏指南文档”
但可以观察到,除了“亟需改进”维度,该挑战其实在“平均分”维度也是非常接近头部(距离截尾均值0.02),这说明其重要性。
问卷中的绝大部分挑战都以较大比例(63.1% - 69.94% )被选为“建议改进”和“亟需改进”(下总称“可改进”),对比认为“有其他重要挑战”需改进的比例仅为13.87%,说明列举在问卷中相关挑战大部分都明显有改进的需求。
其中,被认为“可改进”的挑战中比例最高(69.94%)的是:“真实业务数据集及其基线算法、预训练模型难以获取”
在截尾均值(67.06%)以上的其它头部挑战还包括:
“缺乏真实业务及其研究需求的固定来源”
“边缘AI系统部署等起步过程中缺乏指南文档”
“缺乏AI工具,包括资源监控、节点仿真、标注工具等”
“算法研发迭代中,重复部署整套端边云系统过于沉重”
与“亟需改进”相比,“可改进”维度头部部分选项排名有变化。
1、在“可改进”维度头部选项中,比“亟需改进”排名更高的挑战,可以认为是有一定的重要性,但相对不那么紧急。这些可能看上去更“长远”的“重要不紧急”挑战包括:
“缺乏真实业务及其研究需求的固定来源”
“边缘AI系统部署等起步过程中缺乏指南文档”
第二个挑战也与“亟需改进”部分结论一致。
2、在“亟需改进”维度头部选项中,比“可改进”排名更高的挑战,可以认为是一定的重要性,但相对比较紧急,这些看上去更“紧迫”的“重要且紧急”挑战包括:
“算法研发迭代中,重复部署整套端边云系统过于沉重”
“缺乏AI工具,包括资源监控、节点仿真、标注工具等”
对边缘AI算法开发者有以下结论:
1、平均分值最高(6.87分)的挑战是:“真实业务数据集及其基线算法、预训练模型难以获取”
2、其它头部重要挑战中
“重要不紧急”头部重要挑战包括:“缺乏真实业务及其研究需求的固定来源”“边缘AI系统部署等起步过程中缺乏指南文档”
“重要且紧急”头部重要挑战包括:“算法研发迭代中,重复部署整套端边云系统过于沉重”“缺乏AI工具,包括资源监控、节点仿真、标注工具等”
3、“边缘AI及其应用”方向下算法开发各职业平均分值最高的生态挑战分别是:
工业界:“缺乏AI工具,包括资源监控、节点仿真、标注工具等”(平均分7.5)
学术界:“缺乏真实业务及其研究需求的固定来源” (平均分7.14)
在校学生:“真实业务数据集及其基线算法、预训练模型难以获取”(平均分7.68)
问卷中也尝试调研边缘AI算法开发其余重要挑战,调研结果词云如下所示,包括边缘AI概念与定义、硬件方案、人才协作、工具与文档、场景需求、AI效果等24条意见,由于篇幅限制不一一阐述。
本问卷中,边缘AI服务开发者是指,在给定算法基础上开发工业、Re-ID、能源、机器人等边缘AI服务的角色。有74.90%的调研对象填写了边缘AI服务开发者相关问卷调研选项。对每个挑战的负面影响有四种选项,包括“不了解可跳过”“可维持现状”“建议改进”“亟需改进”。
本章先介绍答卷中关于各个算法开发生态挑战的不同维度调研结果,本章末尾将小结各不同维度的结论。
若选择“不了解跳过”或“可维持现状”记为0分,“建议改进”记为5分,“亟需改进”记为10分,答卷中对边缘AI服务开发者各挑战的平均分值如下图所示。对比认为“还有其他重要挑战”的1.24分,问卷中所罗列的各挑战都超过了5分,可以认为各挑战都有改进的需求。
其中,平均分值最高(6.76分)的挑战是: “通用方案整体性能不一定满足特定业务需求”
在截尾均值6.09分以上的其它头部挑战还包括:
“自研业务算法和系统方案周期长成本高”
“方案效果复现困难或通用方案应用范围存疑”
从“边缘AI及其应用”方向细分工业界、学术界和在校学生等不同职业调研对象(三者在调研对象中的比例大致为2:1:1),细化服务开发者各项挑战平均分:
“边缘AI及其应用”方向下各职业平均分值最高的服务开发挑战完全一致:
工业界:“通用方案整体性能不一定满足特定业务需求” (平均分7.1)
学术界:“通用方案整体性能不一定满足特定业务需求” (平均分7.8)
在校学生:“通用方案整体性能不一定满足特定业务需求”(平均分7.5)
在截距均值以上的其它头部挑战还包括:
工业界(截距均值5.99):
“自研业务算法和系统方案周期长成本高”(平均分6.63)
“方案效果复现困难或通用方案应用范围存疑”(平均分6.1)
学术界(截距均值5.75):
“自研业务算法和系统方案周期长成本高”(平均分7.00)
“方案效果复现困难或通用方案应用范围存疑”(平均分6.60)
在校学生(截距均值5.84):
“方案效果复现困难或通用方案应用范围存疑”(平均分6.88)
“自研业务算法和系统方案周期长成本高”(平均分6.46)
对于边缘AI服务开发者,问卷中提及的挑战被选为“亟需改进”的比例都在20%以上,高于“还有其他重要挑战”的6.36%,可以认为各个挑战都有一定的迫切需求。
其中被选为“亟需改进”的挑战中比例最高(36.78%)的是:“通用方案整体性能不一定满足特定业务需求”
在截尾均值(25.57%)以上的其它头部挑战还包括:
“自研业务算法和系统方案周期长成本高”
“现场人员只会开关机,希望简化现场安装部署”
与“平均分”维度相比,“亟需改进”维度头部部分选项排名有变化。
1、在“亟需改进”维度才进入头部的挑战有一个,在“平均分”部分其实也是非常接近头部(距离截尾均值0.06),这可能说明该挑战比较重要,而且需求比较迫切,这个挑战是:
“现场人员只会开关机,希望简化现场安装部署”
2、在“平均分”维度有一个头部挑战在“亟需改进”维度排名下降,意味着其有一定的重要性,但相对紧急程度较低,可能是“重要不紧急”的、更为“长远”的需求,这个挑战是:
“方案效果复现困难或通用方案应用范围存疑”
问卷中的绝大部分挑战都以较大比例(59.77% - 68.96% )被选为“建议改进”和“亟需改进”(下总称“可改进”),对比认为“有其他重要挑战”需改进的比例仅为10.92%,说明列举在问卷中相关挑战大部分都明显有改进的需求。
其中,被认为“可改进”的挑战中比例最高(68.96%)的是:“通用方案整体性能不一定满足特定业务需求”
在截尾均值(61.78%)以上的其它头部挑战还包括:
“自研业务算法和系统方案周期长成本高”
“方案效果复现困难或通用方案应用范围存疑”
与“亟需改进”相比,“可改进”维度头部部分选项排名有变化。
1、在“可改进”维度头部选项中,比“亟需改进”排名更高的挑战,可以认为是有一定的重要性,但相对不那么紧急,看上去更“长远”的“重要不紧急”挑战包括:“方案效果复现困难或通用方案应用范围存疑”,这与“亟需改进”章节结论一致。
2、在“亟需改进”维度头部选项中,比“可改进”排名更高的挑战,可以认为是一定的重要性,但相对比较紧急,这些看上去更“紧迫”的“重要且紧急”挑战包括:“现场人员只会开关机,希望简化现场安装部署”,这与“亟需改进”章节结论一致。
对边缘AI服务开发者有以下结论:
1、平均分值最高(6.76分)的挑战是:“通用方案整体性能不一定满足特定业务需求”
2、其它头部重要挑战中
“重要不紧急”头部重要挑战包括:“方案效果复现困难或通用方案应用范围存疑”
“重要且紧急”头部重要挑战包括:“现场人员只会开关机,希望简化现场安装部署”
头部重要挑战还包括:“自研业务算法和系统方案周期长成本高”
3、“边缘AI及其应用”方向下服务开发各职业平均分值最高的生态挑战完全一致:
工业界:“通用方案整体性能不一定满足特定业务需求” (平均分7.1)
学术界:“通用方案整体性能不一定满足特定业务需求” (平均分7.8)
在校学生:“通用方案整体性能不一定满足特定业务需求”(平均分7.5)
问卷中也尝试调研边缘AI服务开发其余重要挑战,调研结果词云如下所示。包括场景定制化、培训与指南、部署安装、硬件资源、技术方案等18条挑战,由于篇幅原因不一一阐述。
本问卷中,边缘AI技术布道者是指开展边缘AI技术演讲布道,推广甚至销售现有边缘AI技术与服务的角色。有69.94%调研对象填写了边缘AI技术布道者相关问卷调研选项。对每个挑战的负面影响有四种选项,包括“不了解可跳过”“可维持现状”“建议改进”“亟需改进”。
本章先介绍答卷中关于各个算法开发生态挑战的不同维度调研结果,本章末尾将小结各不同维度的结论。
若选择“不了解跳过”或“可维持现状”记为0分,“建议改进”记为5分,“亟需改进”记为10分,答卷中对边缘AI技术布道者各挑战的平均分值如下图所示。对比认为“还有其他重要挑战”的0.73分,问卷中所罗列的各挑战都超过了5分,可以认为各挑战都有改进的需求。
其中,平均分值最高(6.61分)的挑战是: “缺乏商业成功案例”
在截尾均值5.77分以上的其它头部挑战还包括:
“缺乏与现有方案系统对比,包括成本、部署要求”
“受众对边缘AI不了解”
从“边缘AI及其应用”方向细分工业界、学术界和在校学生等不同职业调研对象(三者在调研对象中的比例大致为2:1:1),细化技术布道者各项挑战平均分:
“边缘AI及其应用”方向下各职业平均分值最高的技术布道挑战分别是:
工业界:“缺乏与现有方案系统对比,包括成本、部署要求” (平均分6.63)
学术界:“缺乏商业成功案例” (平均分6.59)
在校学生:“受众对边缘AI不了解”(平均分6.25)
在截距均值以上的其它头部挑战还包括:
工业界(截距均值5.98):
“受众对边缘AI不了解”(平均分6.15)
“缺乏商业成功案例”(平均分6.43)
学术界(截距均值5.40):
“受众对边缘AI不了解”(平均分5.91)
“缺乏与现有方案系统对比,包括成本、部署要求”(平均分5.68)
在校学生(截距均值5.46):
“缺乏商业成功案例”(平均分6.05)
“缺乏直观的UI界面和Demo”(平均分6.05)
“缺乏与现有方案系统对比,包括成本、部署要求”(平均分5.53)
对于边缘AI技术布道者,问卷中提及的挑战被选为“亟需改进”的比例都在20%以上,高于“还有其他重要挑战”的1.72%,可以认为各个挑战都有一定的迫切需求。
其中被选为“亟需改进”的挑战中比例最高(32.18%)的是:“缺乏商业成功案例”
在截尾均值(25.00%)以上的其它头部挑战还包括:
“缺乏与现有方案系统对比,包括成本、部署要求”
“缺乏直观的UI界面和DEMO”
与“平均分”维度相比,“亟需改进”维度头部部分选项排名有变化。
1、在“亟需改进”维度才进入头部的挑战有一个,在“平均分”部分其实也是非常接近头部(距离截尾均值0.06),这可能说明该挑战比较重要,而且需求比较迫切。这个“重要且紧急”挑战是: “缺乏直观的UI界面和DEMO”
2、在“平均分”维度有一个头部挑战在“亟需改进”维度排名下降,意味着其有一定的重要性,但相对紧急程度较低,更为“长远”的需求。这个“重要不紧急”挑战是:“受众对边缘AI不了解”
问卷中的绝大部分挑战都以较大比例(54.02% - 62.07%) 被选为“建议改进”和“亟需改进”(下总称“可改进”),对比认为“有其他重要挑战”需改进的比例仅为6.89%,说明列举在问卷中相关挑战大部分都明显有改进的需求。
其中,被认为“可改进”的挑战中比例最高(62.07%)的是:“缺乏商业成功案例”
在截尾均值(57.61%)以上的其它头部挑战还包括:
“缺乏与现有方案系统对比,包括成本、部署要求”
“受众对边缘AI不了解”
与“亟需改进”相比,“可改进”维度头部部分选项排名有变化。
1、在“可改进”维度头部选项中,比“亟需改进”排名更高的挑战,可以认为是有一定的重要性,但相对不那么紧急,看上去更“长远”的挑战包括:“受众对边缘AI不了解”,这与“亟需改进”章节结论一致。
2、在“亟需改进”维度头部选项中,比“可改进”排名更高的挑战,可以认为是一定的重要性,但相对比较紧急,这些看上去更“紧迫”的“重要且紧急”挑战包括:
“缺乏直观的UI界面和DEMO”,这与“亟需改进”章节结论一致。
对边缘AI技术布道者有以下结论:
1、平均分值最高(6.61分)的挑战是:“缺乏商业成功案例”
2、其它头部重要挑战中
“重要不紧急”头部重要挑战包括:“受众对边缘AI不了解”
“重要且紧急”头部重要挑战包括:“缺乏直观的UI界面和DEMO”
头部重要挑战还包括:“缺乏与现有方案系统对比,包括成本、部署要求”
3、“边缘AI及其应用”方向下技术布道各职业平均分值最高的生态挑战分别是:
工业界:“缺乏与现有方案系统对比,包括成本、部署要求” (平均分6.63)
学术界:“缺乏商业成功案例” (平均分6.59)
在校学生:“受众对边缘AI不了解”(平均分6.25)
问卷中也尝试调研边缘AI技术布道其余重要挑战,调研结果词云如下所示。包括边缘AI价值和方案配套等7条意见,由于篇幅原因不一一阐述。
作为KubeEdge社区SIG AI重要成员,华为云边缘云创新实验室将依据调研结果有针对性地向KubeEdge社区SIG AI持续贡献。KubeEdge是业界首个云原生边缘计算框架、当前云原生计算基金会内部唯一孵化级边缘计算开源项目。KubeEdge在全球已拥有800+贡献者和60+贡献组织,在Github获得4.6k+Stars和1.3k+Forks。作为KubeEdge中唯一的AI特别兴趣小组(Special Interest Group),KubeEdge社区SIG AI致力于使能AI应用在边缘更好地运行,聚焦边缘AI技术讨论、API定义、参考架构、开源实现等。为全球开发者提供相关研发支持并孵化繁荣生态,当前已开源边缘AI平台Sedna,包括其跨边云的协同推理、联邦学习、增量学习和终身学习特性。
作为信奉开源文化的社区,KubeEdge始终都强调“Best ideas win”,领域发展自然也不例外。为了交出一个更有竞争力和创意的提案,本次调研了解每位关注开源与边缘AI的朋友对相关方案落地过程遇到的困难,然后选取Best idea,对社区内容进行优化,以便为大家呈现一个体现开源开放精神的资源分享社区生态。
除了之前章节提及的内容,问卷中还包括调研对象的建议。其中“提供公开数据集、预处理和基线代码,构建Benchmark”的建议无论在总览、还是在边缘AI方向的工业界、学术界和在校学生中票数均排名第一,比例分别为82.18%、92.98%、87.10%、86.67%,并且显著高于其它建议,相信此建议需要重点关注。社区也可以根据上面的阐述细分相关职业需求,进一步优化边缘AI生态。
问卷也尝试调研其余重要建议。包括场景演示和研发支撑等8条建议:
场景演示
增加demo展示
深入了解行业落地痛点
找准一个典型领域或场景进行全方案的落地测试,包括训练和推理结合实际业务形成一套端到端的解决方案
光调研开发者不足够,并非方案用户,要落地还得调研边缘AI的最终客户需求
研发支撑
最重要还是数据公开
希望能提供更多的例子,示例怎么完成一个任务的训练和部署。联邦学习目前了解的人比较少,希望对它的优势和使用方法做更多介绍,降低系统使用门槛。
需要对相关开源平台的了解,也可以搞合作
提供更多的开发者使用模式,不局限于现在example
——END——