3月15日 OpenAI发布多模态大模型GPT-4,其不仅在语言处理能力上提高,还具备对图像的理解和分析能力。GPT-4商业化进程加快,开放API的同时还发布了在6个不同商业场景的应用落地。随后微软发布了震撼的微软365 Copilot,极大提升office的生产力和交互方式。此前,ChatGPT就已经展示了强大的能力,在文字创造、人机交互、教育、影音、零售等多场景落地应用。我们认为,多模态大模型已在多领域具有专家能力,未来将深度赋能千行百业,改变生产生活方式。 **1. 2023年3月15日,OpenAI目前最强大的多模态预训练大模型GPT-4正式发布。**其能够处理文本、图像两种模态的输入信息,单次处理文本量是ChatGPT的8倍,GPT-4的表现大大优于目前最好的语言模型,同时在学术考试中的水平远超GPT3.5。这意味着GPT-4不仅在学术层面上实现了模型优化与突破,同时也展现出了成为部分领域专家的能力。
**2. GPT-4商业化进程加快。**GPT-4在发布时便开放了其纯文本输入的API,这与GPT-3和GPT-3.5的滞后开放不同。同时,GPT-4这次一起推出了6个商业场景的具体应用落地,在优化人机交互体验、提供专业服务、提升组织效能、文化传承与保护等方面都展现了巨大的潜能,未来有望看到更多场景中的商业化拓展与落地。 **3. ChatGPT已经刮起GPT生态狂潮。**2023年3月1号,OpenAI基于GPT 3.5 Turbo模型开放了ChatGPT API。API收费模式为0.002美元/1000tokens。相较于前一代开放接口GPT 3.5,性能更强的同时,价格下降90%,加速ChatGPT相关应用生态的发展。 **4.应用百花齐放,创造新的生产方式。**微软先后在搜索引擎Bing、企业服务平台Dynamic 365及开发者工具平台Power Platform等接入 ChatGPT/GPT-4能力。微软还发布了震撼的Microsoft 365 Copilot,极大提升office的生产力和交互方式。与此同时,在越来越多的企业宣布接入ChatGPT的能力,其中不乏一些已经取得优秀商业化的应用。如Jasper、Quizlet、Shop等,在语言文字创造、人机交互、教育、绘画、影音、零售等多场景落地应用。 5. 我们认为以GPT4/ChatGPT为代表的预训练大模型是这一轮AI浪潮的重要革新,重点推荐关注海内外优秀应用落地情况,AI芯片产业链等投资机遇。
**GPT技术发展不及预期:**GPT属于先进AI算法,若后续GPT算法更新迭代效果不及预期,则会影响GPT演进及拓展,进而会影响其商业化落地等; **算法歧视与人权道德风险:**GPT引入基于人工反馈的强化学习,在人工反馈中,不可避免的会参杂歧视问题,从而会将歧视带入后续的人机交互中;大模型在进行预训练过程中,使用了大量数据,其中会涉及相关隐私问题; **数据数量与数据质量不及预期:**大模型需要大量的高质量数据进行训练,若数据数量和质量存在短板,则会影响模型效果。 **GPT接口开放不明确:**目前GPT是否能对国内开放API还不明朗,若未来无法接入,可能将导致相关应用在国内无法落地。 **算力受限:**目前大模型训练以GPU为主,尤其是英伟达的GPU。未来若GPU产能或者中美摩擦升级,可能导致国内厂商的算力布局。