主要观点: ChatGPT带来大模型时代变革,数据要素重要性提升 ChatGPT是由OpenAI研发的一种语言AI模型,其特点在于使用海量语料库来生成与人类相似的反应。初代GPT模型参数1.17亿,GPT2模型、GPT3模型参数分别达到15亿、1750亿。不断提升的参数量级,使得ChatGPT3当前已经能够应用在商业、研究和开发活动中。 当前此类参数体量庞大的模型,成为各大科技厂商研发重点。大模型的基础为高质量大数据。ChatGPT的前身GPT-3就使用了3,000亿单词、超过40T的数据。此类大数据基础的前提为三部分1)有效场景下的采集数据;2)大数据的存储、清洗和标注;3)数据质量检验。 大模型发展之下,算力与网络设施建设成为刚需 算力:ChatGPT类人工智能需要更充足的算力支持其处理数据,带来更多高性能的算力芯片需求。英伟达表示,GPT-3需要512颗V100显卡训练7个月,或者1024颗A100芯片训练一个月。2012年以来,AI训练任务中的算力增长(所需算力每3.5月翻一倍)已经超越摩尔定律(晶体管数量每18月翻一倍)。 网络设施:以微软Azure为例,其AI基础设施由互联的英伟达AmpereA100TensorCoreGPU组成,并由QuantuminfiniBand交换机提供横向扩展能力。服务器节点多、跨服务器通信需求巨大,网络带宽性能成为GPU集群系统的瓶颈,解决方式包括增加单节点通信带宽与降低网络收敛比,带来光模块、交换机等需求。 下游应用场景丰富,多行业落地可期 1)“生成式AI(generativeAI)”在互联网及元宇宙领域市场化空间较为广阔。基于现行的NLP算法发展程度及数据集规模。在不久的将来,生成式AI有较大可能在“智能客服”和“搜索引擎”进行增值,并有希望以“插件”的形式赋能现有的“生产力工具链(工程软件/音视频制作工具等)”。 2)AI在制造业的应用可分为三方面:a)智能装备:指具有感知、分析、推理、决策、控制功能的制造装备,典型代表有工业机器人、协作机器人、数控机床等;b)智能工厂:重点在于实现工厂的办公、管理及生产自动化,典型的代表场景有协作机器人、智能仓储物流系统等;c)智能服务:指个性化定制、远程运维及预测性维护等。 3)人工智能在智能汽车领域的应用包括:a)智能驾驶依托AI,将从驾驶辅助发展至自动驾驶;b)智能座舱在AI支持下,从出行工具演变为出行管家。