AI for mathematics | 谷歌Minerva & Autoformalization项目原作解读

2022 年 10 月 25 日 机器之心

自动证明数学定理是人工智能的一个初衷，也是一直以来的难题（a long-standing problem of AI）。近年来人工智能的发展让我们渐渐意识到自动证明变成一种可能。尤其是近几年的大语言模型，更加让我们对现有智能的推理能力抱有很大的期望。

到目前为止，人类数学家使用了两种不同的方式来书写数学。第一种是大家都熟悉的方式，即用自然语言来描述数学证明。大部分的数学都是以这种方式书写的，这包括我们的数学课本，数学论文，等等。这个形式的数学虽然非常灵活，但它的问题是证明的正确性一般很难检验。

第二种称之为形式化数学（formal mathematics）。这是近半个世纪计算机科学家创造的，用来检验数学证明的一种工具。数学家可以在这样的一个程序里写数学证明，而证明的正确性可以被形式化证明系统来检验。但这个方式来证明数学定理并不常用，因为在形式化证明系统里要书写的数学证明要比在一般情况下的证明复杂的多。

两种不同形式的数学各有千秋，而真正的有意思的研究问题便在于如何结合两种数学的优点去创造一个伟大的数学智能。

机器之心最新一期线上分享邀请到了谷歌研究科学家吴宇怀（Yuhuai Tony Wu），介绍他们在 AI for mathematics 领域取得数学智能 SOTA 的探索。

分享主题：AI for mathematics ｜数学智能 SOTA：Minerva & Autoformalization

分享嘉宾：吴宇怀 (Yuhuai Tony Wu)，谷歌研究科学家，斯坦福博士后，多伦多大学博士。立志于创造一个善于推理的人工智能，用于解决所有数学难题。

分享摘要：我们从 Minerva开始说起。Minerva 是一个大语言模型。当训练在足够多的数学相关的数据之后，我们发现它的数学能力非常强，可以在波兰、英国高中数学测试中拿到高于平均分的分数。然而这样的语言模型也有不足，它只能模仿，而不能自主训练而提高数学水平。形式化证明系统(formal proving systems)提供了一个训练环境，但形式化数学的数据非常少。因此我们需要自动形式化（autoformalization）来作为一个桥梁连接自然语言数学。接下来的讨论也就会关于如何用大语言模型来帮助我们做这个桥梁，从而享用两种方式的优点（enjoy the best of both worlds）。

相关链接：

1.Solving Quantitative Reasoning Problems with Language Models, NeurIPS, 2022.

论文地址：

https://arxiv.org/abs/2206.14858

Google blog:

https://ai.googleblog.com/2022/06/minerva-solving-quantitative-reasoning.html

2.Autoformalization with LLMs, NeurIPS, 2022

论文地址：

https://arxiv.org/abs/2205.12615

Media coverage:

https://www.newscientist.com/article/2322999-ai-translates-maths-problems-into-code-to-make-them-easier-to-solve/

https://trustmyscience.com/ia-permet-automatiser-traduction-enonce-probleme-code-informatique/

3.Draft, Sketch, and Prove: Guiding Formal Theorem Provers with Informal Proofs

论文地址：

https://openreview.net/forum?id=SMa9EAovKMC

加群看直播

直播间 ：关注机器之心机动组视频号，北京时间 10 月 26 日 10:00 开播。

交流群： 本次直播设有 QA 环节，欢迎加入本次直播交流群探讨交流。

如群已超出人数限制，请添加机器之心小助手：syncedai2、syncedai3、syncedai4 或 syncedai5，备注「Minerva」即可加入。

如果你也有最新工作希望分享或提交你感兴趣的内容方向，随时告诉我们吧： https://jiqizhixin.mikecrm.com/fFruVd3

机器之心 · 机动组

机动组是机器之心发起的人工智能技术社区，聚焦于学术研究与技术实践主题内容，为社区用户带来技术线上公开课、学术分享、技术实践、走近顶尖实验室等系列内容。机动组也将不定期举办线下学术交流会与组织人才服务、产业技术对接等活动，欢迎所有 AI 领域技术从业者加入。

登录查看更多

相关内容

数学

关注 103

数学是关于数量、结构、变化等主题的探索。

【Latex数学排版简洁指南】《Short Math Guide for LATEX》by Michael Downes

专知会员服务

53+阅读 · 2022年2月14日

ICLR 2022接受论文列表出炉！1095 篇论文都在这了！

专知会员服务

76+阅读 · 2022年1月30日

Nature论文: DeepMind用AI引导直觉解决数学猜想难题

专知会员服务

31+阅读 · 2021年12月2日

【MIT经典书】计算机科学数学，918页pdf

专知会员服务

129+阅读 · 2021年6月23日

近期必读的六篇AAAI 2021【对抗攻击（Adversarial Attack）】相关论文和代码

专知会员服务

55+阅读 · 2021年2月17日

【GPT-3作者亲解】超大型语言模型少样本学习，109页ppt

专知会员服务

110+阅读 · 2020年12月19日

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

专知会员服务

73+阅读 · 2020年5月30日

【ICLR2020-Facebook 2020】深度学习符号化数学，Deep Learning for Symbolic Mathematics，

专知会员服务

23+阅读 · 2020年4月7日

Google AI发布Meena-构建一个无所不聊的含26亿参数模型的聊天机器人

专知会员服务

54+阅读 · 2020年1月29日

【AAAI2020】从BERT归纳关系知识（Inducing Relational Knowledge from BERT），法阿尔图瓦大学副教授Zied Bouraoui、卡迪夫大学讲师Jose Camacho-Collados

专知会员服务

29+阅读 · 2019年12月5日

AI再卷数学界，DSP新方法将机器证明成功率提高一倍

机器之心

0+阅读 · 2022年11月20日

百万青橙奖今年颁给他：32岁，搞量子力学，土生土长的“古典学者”

量子位

0+阅读 · 2022年11月6日

中山大学HCP Lab系列论文：AI解题新突破，神经网络推开数学推理大门

PaperWeekly

0+阅读 · 2022年11月5日

谷歌、OpenAI学者谈AI：语言模型正在努力「攻克」数学

机器之心

0+阅读 · 2022年11月1日

AMiner助力SOTA！模型AI开发者社区，模型代码论文一键达！

学术头条

0+阅读 · 2022年10月21日

「我觉得AI领域乙烷」网友：你说的太多了，让AI来总结一下

THU数据派

0+阅读 · 2022年8月9日

AI做题不止高数！Google新模型Minerva称霸工科竞赛：秘诀竟是保留LaTeX表达式？

新智元

0+阅读 · 2022年7月4日

AI做题家卷疯了！高数考试正确率81%，竞赛题成绩超过计算机博士

THU数据派

0+阅读 · 2022年7月1日

赛尔讲坛第16期｜微软研究院首席研究员楼建光博士讲座

哈工大SCIR

0+阅读 · 2021年12月5日

DeepMind新Nature论文: 用AI引导直觉解决数学猜想难题

专知

0+阅读 · 2021年12月2日

金属/氮化物纳米多层膜氦离子辐照的界面效应研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于有限环的量子纠错码理论研究

国家自然科学基金

0+阅读 · 2012年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

时滞Nicholson飞蝇模型的若干动力学问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于可信语义Wiki的知识库构建方法与应用研究

国家自然科学基金

1+阅读 · 2012年12月31日

不确定多层规划及其应用

国家自然科学基金

1+阅读 · 2012年12月31日

不确定性Web数据质量在线评估技术研究

国家自然科学基金

0+阅读 · 2010年12月31日

Sonazoid肝脏超声造影诊断肝硬化的实验研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于数字样机的民机虚拟维修训练关键技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

鼠疫耶尔森氏菌生物膜形成的转录调控的分子机制研究

国家自然科学基金

0+阅读 · 2009年12月31日

Generalization in Deep Learning

Arxiv

0+阅读 · 2022年12月11日

On the Fair Termination of Client-Server Sessions

Arxiv

0+阅读 · 2022年12月11日

Going Beyond XAI: A Systematic Survey for Explanation-Guided Learning

Arxiv

0+阅读 · 2022年12月7日

Multi-Object Tracking with Deep Learning Ensemble for Unmanned Aerial System Applications

Arxiv

26+阅读 · 2021年10月5日

VideoDG: Generalizing Temporal Relations in Videos to Novel Domains

Arxiv

14+阅读 · 2021年9月17日

The Modern Mathematics of Deep Learning

Arxiv

49+阅读 · 2021年5月9日

Attribute-Guided Adversarial Training for Robustness to Natural Perturbations

Arxiv

15+阅读 · 2020年12月3日

Causal Embeddings for Recommendation

Arxiv

23+阅读 · 2018年8月3日

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

16+阅读 · 2018年6月27日

CoNet: Collaborative Cross Networks for Cross-Domain Recommendation

Arxiv

13+阅读 · 2018年4月20日

VIP会员