Translated title: GPT-4能否进行神经架构搜索？ Translated abstract: 我们探究了 GPT-4~\cite{gpt4} 在设计有效的神经网络架构上的潜力，即神经架构搜索 (NAS)。我们提出的方法，名为GPT-4信息驱动的神经架构搜索(GINAS)，利用GPT-4作为黑盒优化器的生成能力，快速浏览架构搜索空间，寻找有前途的候选项，并迭代完善这些候选项来提高性能。我们在多个基准测试中评估了GINAS的性能，与现有的最先进的NAS技术进行比较，以说明其有效性。我们的目标不是追求最先进的性能，而是通过一个简单提示方案来强调GPT-4在挑战性技术问题研究方面的潜力，这需要相对有限的领域专业知识。更广泛地说，我们认为我们的初步结果指向了未来利用通用语言模型进行各种优化任务方面的研究。我们还强调了我们研究的重要局限性，并指出了对AI安全性的影响。 (Can GPT-4 Perform Neural Architecture Search?)

2023 年 4 月 21 日

Can GPT-4 Perform Neural Architecture Search?

翻译：Translated title: GPT-4能否进行神经架构搜索？ Translated abstract: 我们探究了 GPT-4~\cite{gpt4} 在设计有效的神经网络架构上的潜力，即神经架构搜索 (NAS)。我们提出的方法，名为GPT-4信息驱动的神经架构搜索(GINAS)，利用GPT-4作为黑盒优化器的生成能力，快速浏览架构搜索空间，寻找有前途的候选项，并迭代完善这些候选项来提高性能。我们在多个基准测试中评估了GINAS的性能，与现有的最先进的NAS技术进行比较，以说明其有效性。我们的目标不是追求最先进的性能，而是通过一个简单提示方案来强调GPT-4在挑战性技术问题研究方面的潜力，这需要相对有限的领域专业知识。更广泛地说，我们认为我们的初步结果指向了未来利用通用语言模型进行各种优化任务方面的研究。我们还强调了我们研究的重要局限性，并指出了对AI安全性的影响。

Mingkai Zheng,Xiu Su,Shan You,Fei Wang,Chen Qian,Chang Xu,Samuel Albanie

We investigate the potential of GPT-4~\cite{gpt4} to perform Neural Architecture Search (NAS) -- the task of designing effective neural architectures. Our proposed approach, \textbf{G}PT-4 \textbf{I}nformed \textbf{N}eural \textbf{A}rchitecture \textbf{S}earch (GINAS),leverages the generative capabilities of GPT-4 as a black-box optimiser to quickly navigate the architecture search space, pinpoint promising candidates, and iteratively refine these candidates to improve performance.We assess GINAS across several benchmarks, comparing it with existing state-of-the-art NAS techniques to illustrate its effectiveness. Rather than targeting state-of-the-art performance, our objective is to highlight GPT-4's potential to assist research on a challenging technical problem through a simple prompting scheme that requires relatively limited domain expertise. More broadly, we believe our preliminary results point to future research that harnesses general purpose language models for diverse optimisation tasks. We also highlight important limitations to our study, and note implications for AI safety.

翻译：

相关内容

GPT-4

关注 29

北京时间2023年3月15日凌晨，ChatGPT开发商OpenAI 发布了发布了全新的多模态预训练大模型 GPT-4，可以更可靠、更具创造力、能处理更细节的指令，根据图片和文字提示都能生成相应内容。具体来说来说，GPT-4 相比上一代的模型，实现了飞跃式提升：支持图像和文本输入，拥有强大的识图能力；大幅提升了文字输入限制，在ChatGPT模式下，GPT-4可以处理超过2.5万字的文本，可以处理一些更加细节的指令；回答准确性也得到了显著提高。

评估ChatGPT的信息提取能力:对性能、可解释性、校准和忠实度的评估

专知会员服务

76+阅读 · 2023年4月26日

生成式推荐: 迈向下一代推荐系统新范式

专知会员服务

48+阅读 · 2023年4月15日

百篇论文纵览大型语言模型最新研究进展

专知会员服务

70+阅读 · 2023年3月31日

《校准自主性中的信任》2022最新16页slides

专知会员服务

20+阅读 · 2022年12月7日