成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
0
挑战OpenAI!以色列AI21 Labs推最新语言模型:侏罗纪-X
2022 年 7 月 26 日
新智元
新智元报道
编辑:Lichtung
【新智元导读】
近日,以色列初创公司AI21 Labs完成了6400万美元的B轮融资,总额达到1.185亿美元。
|融合生态 价值共创——「2022新智者大会」开启,诸多业界大咖,精彩分享不间断!点击预约👇🏻
最近,AI21 Labs完成了6400万美元的B轮融资,公司估值为6.64亿美元。
本轮融资由阿伦创新资本基金牵头,Mobileye首席执行官兼联合创始人Amnon Shashua、Walden Catalyst、Pitango、TPY Capital和Mark Leslie参与,使得A21 Labs的总融资额达到1.185亿美元。
AI21 Labs由Goshen、Shashua和斯坦福大学教授Yoav Shoham于2017年共同创立。
该公司的第一款产品是Wordtune,这是一种人工智能驱动的写作辅助工具,旨在与Grammarly竞争,它在用户输入内容时给予新的措辞建议。
去年8月,
AI21
发布了平台AI Studio,并推出了对于Jurassic-1模型「即用即付 」的服务-开发者可以根据其要求的独特数据集进行定制模型以及微调。
Jurassic-1系列模型可用于转述(如从产品描述中生成简短的产品名称),从文本中提取数字,按主题或类别标记电子邮件和笔记。
这些模型还可以通过Wordtune中被称为Wordtune Read的功能来总结内容,包括文章、报告和PDF文件的片段。
然而由于语言模型是被互联网上的大量数据(包括社交媒体)训练出来的,因此它们能够根据在训练过程中遇到的类似语言生成有毒和有偏见的文本。
AI21 Labs
的模型也不例外。
虽然
AI21 Labs
要求客户同意使用条款政策和使用指南,但它还没有对其API产生的潜在有毒内容实施过滤。
对此,
AI21 Labs
表示其模型比GPT-3「略微少一些偏见」,并说他们在手动审查并微调模型以打击滥用。
而据Goshen说,Jurassic-1模型的最新版本Jurassic-X使用了所谓的「模块化推理知识系统」,用在线计算器和货币转换器等「离散推理专家」来增强其答案。
Jurassic-X可以回答用自然语言表述的「非平凡」数学运算,以及简化可能绊倒其他语言模型的「复杂」问题。
相较于Jurassic-1,Jurrasic-X克服了前身模型不擅于推理、更新昂贵、不能有效处理时序数据等缺点。
当然,值得注意的是,
AI21 Labs
还没有委托对其Jurassic-X模型与其他商业语言模型进行比较,所以目前的全部依据仅来自声明。
该公司最近的营销噱头并没有给人带来巨大的信心,相反令人质疑。
6月,
AI21 Labs
推出了一个以已故最高法院法官露丝-巴德-金斯伯格(Ruth Bader Ginsburg)的法律意见为模型的聊天机器人。
然而一些人工智能技术专家将其定性为误导。
AI21 Labs
在回应批评时表示,该聊天机器人「只是一个实验」,并承认它可以给出不准确的回答,应该「谨慎对待」。
对于此轮融资,Goshen表示,新资金将用于研发,特别是开发更大、更复杂的语言模型,以及招聘人才。
AI21 Labs目前拥有120名员工,他们计划在今年年底前再招聘约50名员工,以对抗宏观经济趋势。
当被问及收入时,Goshen拒绝透露确切的数字,以及对增长的估计。
他表示,Studio有数百个「付费客户和设计合作伙伴」,但他也不愿意透露这些人的名字。此外他还说有超过1万名免费计划的用户,而Wordtune则有「数百万」用户。
鉴于训练复杂模型的成本,投资者可能面临巨大的扩张压力。
AI21 Labs自己的研究表明,开发一个具有15亿个参数(即模型用于生成和分析文本的变量)的文本生成模型的费用高达160万美元。
而Jurassic-1模型包含了1780亿个参数,这还不包括为模型提供服务的托管费用;AI21 Labs 表示,它保留了美国和国外「几家」第三方云提供商的服务。
「缺乏市场知识是因为语言模型技术还是新生并且刚被采用。」Goshen说,「有了新的资金,
AI21 Labs
将继续履行其使命来建立具有前所未有的自然语言理解和生成能力的AI系统。」
「随着越来越多的公司迁移到远程工作,人们需要用文字传达他们通常会口头分享的内容。我们专有的大型语言模型的核心能力允许摄取大量的企业数据使用......自定义的内容创建、总结和分类。」
你看好AI21吗?
参考资料:
https://techcrunch.com/2022/07/12/openai-rival-ai21-labs-raises-64m-to-ramp-up-its-ai-powered-language-services/
http://transtech.lingosail.com/news/detail/188209/cn
https://hub.baai.ac.cn/view/9199
登录查看更多
点赞并收藏
0
暂时没有读者
0
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
语言模型
关注
11
【DeepMind】结构化数据少样本学习,51页ppt
专知会员服务
33+阅读 · 2022年8月13日
Google最新NAACL2022《使用文本编辑模型生成文本》教程,附235页ppt以及视频
专知会员服务
38+阅读 · 2022年7月14日
英国国防部《人类增强——新范式的黎明》,110页pdf
专知会员服务
33+阅读 · 2022年4月16日
1370亿参数、接近人类水平,谷歌对话AI模型LaMDA放出论文
专知会员服务
45+阅读 · 2022年1月24日
神经文本生成可用么?斯坦福Abigail博士论文《开放式文本和对话的神经生成》,192页pdf
专知会员服务
26+阅读 · 2021年9月1日
【斯坦福CS224N硬核课】如何融合知识到语言模型中,60页ppt
专知会员服务
61+阅读 · 2021年3月8日
知识增强的文本生成研究进展
专知会员服务
99+阅读 · 2021年3月6日
自然语言处理ACL2020最佳论文出炉!微软摘得最佳论文,Bengio论文获时间检验奖
专知会员服务
45+阅读 · 2020年7月9日
1750亿参数!GPT-3来了!31位作者,OpenAI发布小样本学习器语言模型
专知会员服务
73+阅读 · 2020年5月30日
Google AI博客解读论文《Reformer: The Efficient Transformer》,百万量级注意力机制
专知会员服务
70+阅读 · 2020年1月17日
AI帮写代码67元/月!
夕小瑶的卖萌屋
0+阅读 · 2022年6月27日
Meta AI开放1750亿参数大模型:首次毫无保留公开训练代码及使用代码、日志记录
AI前线
2+阅读 · 2022年5月5日
重磅!Meta AI开源OPT-175B:1750亿参数大模型
CVer
1+阅读 · 2022年5月4日
观点丨DALL-E 2、AI研究的未来以及OpenAI的商业前景
大数据文摘
1+阅读 · 2022年4月19日
多模态新王登基!OpenAI发布DALL·E 2,生成图像「指哪打哪」
新智元
0+阅读 · 2022年4月10日
AI说话也有小情绪!Meta AI连发三篇Textless NLP论文:语音生成的终极答案?
新智元
0+阅读 · 2022年4月7日
这个预训练不简单!BLIP:统一视觉-语言理解和生成任务
CVer
5+阅读 · 2022年2月6日
马斯克走后,结局已注定!OpenAI 竟10亿美元出售「灵魂」
THU数据派
0+阅读 · 2021年9月7日
OpenAI科学家一文详解自监督学习
新智元
18+阅读 · 2019年11月20日
NLP Chinese Corpus:大规模中文自然语言处理语料
PaperWeekly
14+阅读 · 2019年2月18日
面向大规模高性能计算的低开销回卷恢复容错技术
国家自然科学基金
0+阅读 · 2012年12月31日
癌症的靶向基因 - 痘苗溶瘤病毒治疗策略
国家自然科学基金
1+阅读 · 2012年12月31日
语义知识驱动的网络上下文广告投放高效方法研究
国家自然科学基金
0+阅读 · 2012年12月31日
大型语义辞典的自动生成及在文本分析中的应用
国家自然科学基金
1+阅读 · 2012年12月31日
可编辑三维电视中多视点视图合成理论与方法
国家自然科学基金
0+阅读 · 2012年12月31日
面向Web的大规模社会网络数据提取理论与方法研究
国家自然科学基金
2+阅读 · 2011年12月31日
大规模应用层覆盖网络节点部署理论研究
国家自然科学基金
0+阅读 · 2011年12月31日
知识驱动的软件需求和体系结构文档的归档方法研究
国家自然科学基金
0+阅读 · 2011年12月31日
基于语义的图像合成
国家自然科学基金
0+阅读 · 2011年12月31日
垃圾邮件过滤的优化目标、建模及顺序回归研究
国家自然科学基金
0+阅读 · 2009年12月31日
Towards advanced robotic manipulation
Arxiv
0+阅读 · 2022年9月19日
Doge Tickets: Uncovering Domain-general Language Models by Playing Lottery Tickets
Arxiv
0+阅读 · 2022年9月19日
Quantifying How Hateful Communities Radicalize Online Users
Arxiv
0+阅读 · 2022年9月19日
A comparison of different methods of identifying publications related to the United Nations Sustainable Development Goals: Case Study of SDG 13: Climate Action
Arxiv
0+阅读 · 2022年9月15日
Dizzy: Large-Scale Crawling and Analysis of Onion Services
Arxiv
0+阅读 · 2022年9月15日
Artificial Intelligence for the Metaverse: A Survey
Arxiv
31+阅读 · 2022年2月15日
Cross-Domain Few-Shot Graph Classification
Arxiv
13+阅读 · 2022年1月20日
Cold-start Sequential Recommendation via Meta Learner
Arxiv
15+阅读 · 2020年12月10日
Towards a Human-like Open-Domain Chatbot
Arxiv
14+阅读 · 2020年1月27日
Feature Denoising for Improving Adversarial Robustness
Arxiv
15+阅读 · 2018年12月9日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
语言模型
OpenAI
AI
融合
Mobileye
微调
相关VIP内容
【DeepMind】结构化数据少样本学习,51页ppt
专知会员服务
33+阅读 · 2022年8月13日
Google最新NAACL2022《使用文本编辑模型生成文本》教程,附235页ppt以及视频
专知会员服务
38+阅读 · 2022年7月14日
英国国防部《人类增强——新范式的黎明》,110页pdf
专知会员服务
33+阅读 · 2022年4月16日
1370亿参数、接近人类水平,谷歌对话AI模型LaMDA放出论文
专知会员服务
45+阅读 · 2022年1月24日
神经文本生成可用么?斯坦福Abigail博士论文《开放式文本和对话的神经生成》,192页pdf
专知会员服务
26+阅读 · 2021年9月1日
【斯坦福CS224N硬核课】如何融合知识到语言模型中,60页ppt
专知会员服务
61+阅读 · 2021年3月8日
知识增强的文本生成研究进展
专知会员服务
99+阅读 · 2021年3月6日
自然语言处理ACL2020最佳论文出炉!微软摘得最佳论文,Bengio论文获时间检验奖
专知会员服务
45+阅读 · 2020年7月9日
1750亿参数!GPT-3来了!31位作者,OpenAI发布小样本学习器语言模型
专知会员服务
73+阅读 · 2020年5月30日
Google AI博客解读论文《Reformer: The Efficient Transformer》,百万量级注意力机制
专知会员服务
70+阅读 · 2020年1月17日
热门VIP内容
开通专知VIP会员 享更多权益服务
《人工智能——智能艺术?人机交互与创作实践》最新293页书籍
《生成人工智能对抗性使用对国土安全的影响》美国土安全部最新99页报告
JADC2 如何转变军事行动
《自主武器与未来战争》481页书籍
相关资讯
AI帮写代码67元/月!
夕小瑶的卖萌屋
0+阅读 · 2022年6月27日
Meta AI开放1750亿参数大模型:首次毫无保留公开训练代码及使用代码、日志记录
AI前线
2+阅读 · 2022年5月5日
重磅!Meta AI开源OPT-175B:1750亿参数大模型
CVer
1+阅读 · 2022年5月4日
观点丨DALL-E 2、AI研究的未来以及OpenAI的商业前景
大数据文摘
1+阅读 · 2022年4月19日
多模态新王登基!OpenAI发布DALL·E 2,生成图像「指哪打哪」
新智元
0+阅读 · 2022年4月10日
AI说话也有小情绪!Meta AI连发三篇Textless NLP论文:语音生成的终极答案?
新智元
0+阅读 · 2022年4月7日
这个预训练不简单!BLIP:统一视觉-语言理解和生成任务
CVer
5+阅读 · 2022年2月6日
马斯克走后,结局已注定!OpenAI 竟10亿美元出售「灵魂」
THU数据派
0+阅读 · 2021年9月7日
OpenAI科学家一文详解自监督学习
新智元
18+阅读 · 2019年11月20日
NLP Chinese Corpus:大规模中文自然语言处理语料
PaperWeekly
14+阅读 · 2019年2月18日
相关基金
面向大规模高性能计算的低开销回卷恢复容错技术
国家自然科学基金
0+阅读 · 2012年12月31日
癌症的靶向基因 - 痘苗溶瘤病毒治疗策略
国家自然科学基金
1+阅读 · 2012年12月31日
语义知识驱动的网络上下文广告投放高效方法研究
国家自然科学基金
0+阅读 · 2012年12月31日
大型语义辞典的自动生成及在文本分析中的应用
国家自然科学基金
1+阅读 · 2012年12月31日
可编辑三维电视中多视点视图合成理论与方法
国家自然科学基金
0+阅读 · 2012年12月31日
面向Web的大规模社会网络数据提取理论与方法研究
国家自然科学基金
2+阅读 · 2011年12月31日
大规模应用层覆盖网络节点部署理论研究
国家自然科学基金
0+阅读 · 2011年12月31日
知识驱动的软件需求和体系结构文档的归档方法研究
国家自然科学基金
0+阅读 · 2011年12月31日
基于语义的图像合成
国家自然科学基金
0+阅读 · 2011年12月31日
垃圾邮件过滤的优化目标、建模及顺序回归研究
国家自然科学基金
0+阅读 · 2009年12月31日
相关论文
Towards advanced robotic manipulation
Arxiv
0+阅读 · 2022年9月19日
Doge Tickets: Uncovering Domain-general Language Models by Playing Lottery Tickets
Arxiv
0+阅读 · 2022年9月19日
Quantifying How Hateful Communities Radicalize Online Users
Arxiv
0+阅读 · 2022年9月19日
A comparison of different methods of identifying publications related to the United Nations Sustainable Development Goals: Case Study of SDG 13: Climate Action
Arxiv
0+阅读 · 2022年9月15日
Dizzy: Large-Scale Crawling and Analysis of Onion Services
Arxiv
0+阅读 · 2022年9月15日
Artificial Intelligence for the Metaverse: A Survey
Arxiv
31+阅读 · 2022年2月15日
Cross-Domain Few-Shot Graph Classification
Arxiv
13+阅读 · 2022年1月20日
Cold-start Sequential Recommendation via Meta Learner
Arxiv
15+阅读 · 2020年12月10日
Towards a Human-like Open-Domain Chatbot
Arxiv
14+阅读 · 2020年1月27日
Feature Denoising for Improving Adversarial Robustness
Arxiv
15+阅读 · 2018年12月9日
大家都在搜
洛克菲勒
自主可控
大规模语言模型
研究报告
兵棋推演
交通仿真
事理图谱
炼丹
量化交易
社区分享 | 用 PoseNet + TensorFlow.js 在浏览器实现体感游戏
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top