学习如何使用大型语言模型构建成本效益高的应用程序
在《基于大型语言模型的解决方案:如何通过成本效益高的生成式人工智能应用交付价值》一书中,亚马逊网络服务公司的首席数据科学家Shreyas Subramanian为开发者和数据科学家提供了一个实用指南,教他们如何构建和部署成本效益高的大型语言模型(LLM)解决方案。在这本书中,你将找到包括如何选择模型、数据的预处理和后处理、提示工程以及指令微调等一系列关键话题的覆盖。
作者探讨了优化推理的技术,如模型量化和剪枝,以及适用于典型生成式人工智能(GenAI)应用的不同且经济的架构,包括搜索系统、代理协助和自主代理。你还会发现:
有效策略以应对LLM高计算成本的挑战 协助解决构建和部署经济型生成式AI应用的复杂性,包括调优和推理技术 选择模型的标准,特别考虑到紧凑、灵活和特定领域的模型 非常适合希望部署基础模型的开发者和数据科学家,或计划扩大使用GenAI的商业领袖,基于大型语言模型的解决方案也将惠及项目领导者和经理、技术支持人员及对此主题有兴趣或责任的行政管理人员。
封底介绍 平衡性能与成本优化,释放人工智能的潜力 随着人工智能和机器学习的兴起,大型语言模型(LLM)日益流行,但其高昂的计算成本对许多组织而言是一大障碍。这本书提供了构建和部署LLM的成本效益高的方法。在整个过程中,从模型选择和提示工程到微调和部署,你都可以在不过度牺牲性能的情况下最小化成本。 这本书为开发者和数据科学家撰写,提供实用的技术知识,用以实施有价值的生成式人工智能应用,如搜索系统、代理协助和自主代理。书中探讨了优化推理的技术,例如模型量化和剪枝,以及在基础设施层面降低成本的机会。它还考虑了LLM成本优化的未来趋势,使你能在生成式人工智能的下一阶段保持竞争力。 作者介绍 SHREYAS SUBRAMANIAN,博士,是AWS的首席数据科学家,AWS是全球最大的构建并提供大型语言模型企业用途的组织之一。他目前在为亚马逊内部团队及大型企业客户提供生成式人工智能应用的构建、调优和部署的建议。Shreyas开展以机器学习为焦点的成本优化工作坊,帮助客户减少云上机器学习应用的成本。Shreyas还积极参与基础模型的高级训练、调优和部署技术的前沿研究与开发。