一、基础能力测试:混元VS Claude3VS Mistral  1、数学能力:Claude3>混元>Mistral。测试3道高数题、1道线代题、1道概率题,Claude3正确率为80%,混元正确率为60%,Mistral正确率为40%。  2、编程能力:混元>Claude3Mistral。测试数据分析、编写应用程序、贪吃蛇、爬虫,共5道编程题。编程1次运行成功率混元为80%,Claude和Mistral均为40%,  二、应用:腾讯内部诸多应用均已接入混元大模型  1、截至2023年9月7日,超过50个腾讯内部业务接入混元。2023年10月27日,增长至180个。其中包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等核心业务和产品。  2、腾讯会议:在会议界面接入“AI小助手”,仅付费用户可用。可以总结会议纪要,并对会议内容进行提问,能够回答并给出依据。  3、腾讯文档:加入“AI智能助手”,功能划分为教育教学、职场办公、营销策划、生活娱乐、大学生专区五个板块,共13+29+10+10+5=67种功能。  4、QQ浏览器:右上角接入PDF阅读助手,可上传文档并提问;上传英伟达年报,无法总结文档内容,但可以回答答案位于第14页的问题。

成为VIP会员查看完整内容
83

相关内容

大模型是基于海量多源数据打造的预训练模型,是对原有算法模型的技术升级和产品迭代,用户可通过开源或开放API/工具等形式进行模型零样本/小样本数据学习,以实现更优的识别、理解、决策、生成效果和更低成本的开发部署方案。
Al Agent--大模型时代重要落地方向
专知会员服务
106+阅读 · 2024年4月8日
CCCF专题:史元春 | 自然人机交互
中国计算机学会
25+阅读 · 2018年5月18日
【紫冬精选】国内近三年模式分类研究现状综述
中国科学院自动化研究所
14+阅读 · 2018年4月3日
阿里流行音乐趋势预测-深度学习LSTM网络实现代码分享
机器学习研究会
11+阅读 · 2017年12月5日
【知识图谱】当知识图谱遇上聊天机器人
产业智能官
13+阅读 · 2017年11月10日
深度学习实战(二)——基于Keras 的深度学习
乐享数据DataScientists
15+阅读 · 2017年7月13日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2012年12月31日
Arxiv
174+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
494+阅读 · 2023年3月31日
VIP会员
相关资讯
CCCF专题:史元春 | 自然人机交互
中国计算机学会
25+阅读 · 2018年5月18日
【紫冬精选】国内近三年模式分类研究现状综述
中国科学院自动化研究所
14+阅读 · 2018年4月3日
阿里流行音乐趋势预测-深度学习LSTM网络实现代码分享
机器学习研究会
11+阅读 · 2017年12月5日
【知识图谱】当知识图谱遇上聊天机器人
产业智能官
13+阅读 · 2017年11月10日
深度学习实战(二)——基于Keras 的深度学习
乐享数据DataScientists
15+阅读 · 2017年7月13日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2012年12月31日
微信扫码咨询专知VIP会员