沃尔玛既是全球最大的零售商,同时也是一家极具竞争力的科技公司。而造就沃尔玛如此双重身份的背后推手,正是NVIDIA GPU和RAPIDS数据科学软件。
日前,在旧金山举行的VentureBeat Transform大会上,沃尔玛首席数据官Bill Groves发表了演讲,并与参会者们共同探讨了沃尔玛的数据处理和机器学习生态系统。
在和NVIDIA的数据科学总经理Josh Patterson的对话中,Groves提到:“如今,零售模式已经发生改变了。现在,我们有了过去所没有的工具来帮助我们将曾经无法实现想法,一一付诸实践。”在过去,由于缺乏算力支持,诸如神经网络这类想法根本无法实现。
他补充道:“正是由于GPU的助力,这些曾经无法实现的技术才能逐一变成现实,并帮助我们解决更多的难题。”
NVIDIA RAPIDS是沃尔玛的一项重要工具。这套GPU加速库开源套件是帮助沃尔玛在大规模数据分析和机器学习方面取得突破的关键所在。
Patterson说到:“几乎每个上过大学的人都听说过数据科学,而我们想做的是将其发扬光大。通过在GPU上进行数据分析,我们可以让他们以更快的速度处理更多的数据。”
Groves的团队将RAPIDS与Dask和XGBoost相结合。
Dask是一个Python的并行计算库,他们用Dask扩展数据科学工作负载。
XGBoost是一种流行的机器学习算法,他们使用XGBoost在配备有多个GPU的服务器上训练他们的机器学习模型。
这种组合的结果是:Groves的团队能够以比传统方法快100倍的速度处理数据。
左侧为此次对话的主持人,科技产业分析师Maribel Lopez,中间是沃尔玛首席数据官Bill Groves,右侧是NVIDIA数据科学总经理 Josh Patterson。
对于沃尔玛而言,这样的加速至关重要。从商品预测到供应链管理,再到顾客购买动向预测,以及最后一英里配送。沃尔玛每周要接待2.65亿人次的顾客,而机器学习算法能够帮助沃尔玛为顾客提供更好的服务。
如今,沃尔玛正在使用此项技术用于预测其每周超过5亿件的商品库存。
Groves说到:“更强大的算力让我们可以处理更多的数据,而且速度也更快。” 他解释说,天气和当地体育赛事等活动只是简单零售101,仅是推动了销售。而GPU则为他的团队提供了强大的算力,让他们对此类活动所产生的数据加以利用。
Groves说:“我们的工作目标是,当顾客想要购买某件商品的时候能够随时在货架上找到。”
沃尔玛计划将这项技术应用在其它用例当中,包括:供应链,物流,展销以及其它实体店和电商功能。
沃尔玛与NVIDIA合作,能够很快地集成尖端GPU技术,为沃尔玛带来先发优势,帮助他们节省资金,并指导开发和优化以满足特定的用例的需求。
“我们无法建造一切,也不想这么做,”Groves说。“我们想建立的是一个基础平台,让下一代的数据科学家能够借助这个平台解决更多的问题。”
对于NVIDIA而言,与沃尔玛这样的全球最大零售商合作,使用其工具和技术应对实时产品数据,其中所涉及到的数据规模之大,不是其它公司所能比的。
“有这样的团队,真的使得整个生态系统快速成长,而且也能够确保我们有可用的软件,” Patterson说到。
完善产品预测准确性
到目前为止,Grove及其团队已经看到了产品预测准确性的显著提高,过去需要在CPU上运行数周的模型,如今只需要4个小时。
Groves解释道,运行一个相同的预测模型,相比于一个20节点的CPU服务器,GPU服务器的运行时间仅是CPU服务器的4%。
如果没有这样的算力支持,数据科学家们就只能通过把他们的算法尽量简化,才能使算法运行的快一些。
“GPU能够让我们做到从前无法实现的事情,”Groves随后说到。
Groves调侃道,借助于GPU,沃尔玛的数据科学家们可以测试更多的新特性并减少开发周期,但这也意味着沃尔玛的数据科学家的空闲时间变得越来越少了。
“在过去三五十年的时间里,数学和科学不曾发生过大的改变,”Groves说,“发生改变的是科技,而科技的进步又赋予了我们过去不曾拥有的机遇。”
其结果是:沃尔玛能够以更低的成本获得了更多的计算能力,并且其对环境的影响也变得更小了。而这一切努力的目的,都是为了给每天在沃尔玛购物的消费者们带来更多选择和更低商品价格。