一、基础能力测试:混元VS Claude3VS Mistral 1、数学能力:Claude3>混元>Mistral。测试3道高数题、1道线代题、1道概率题,Claude3正确率为80%,混元正确率为60%,Mistral正确率为40%。 2、编程能力:混元>Claude3Mistral。测试数据分析、编写应用程序、贪吃蛇、爬虫,共5道编程题。编程1次运行成功率混元为80%,Claude和Mistral均为40%, 二、应用:腾讯内部诸多应用均已接入混元大模型 1、截至2023年9月7日,超过50个腾讯内部业务接入混元。2023年10月27日,增长至180个。其中包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等核心业务和产品。 2、腾讯会议:在会议界面接入“AI小助手”,仅付费用户可用。可以总结会议纪要,并对会议内容进行提问,能够回答并给出依据。 3、腾讯文档:加入“AI智能助手”,功能划分为教育教学、职场办公、营销策划、生活娱乐、大学生专区五个板块,共13+29+10+10+5=67种功能。 4、QQ浏览器:右上角接入PDF阅读助手,可上传文档并提问;上传英伟达年报,无法总结文档内容,但可以回答答案位于第14页的问题。