成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
0
多语种、懂 Notion、还能帮你开会:我为什么用 Notta 做语音转写
2022 年 3 月 22 日
少数派
出于外贸工作的原因,公司经常会有各种各样的会议,很多会议会涉及到客户的定制化业务,需要记录和留存。记录会议耗时耗力,我希望找到一款能语音转写帮我记录会议的软件。经过一番了解和对比,我最终选择了 Notta。随着功能的更新补全,Notta 能给我的已经不止转写会议,它成为了我工作流中不可或缺的一环。
▍
作为专业语音转写服务的 Notta
目前,市面上专业的语音转写软件大多采用实时转写 + 整段导入云端转写两种方案混合输出,以保证转写的准确度。
与手机输入法或者手机自带的免费应用相比,专用语音转写软件面对
长时间录制
或
对准确度要求较高
的场景表现明显更好,这也是我接触 Notta 的起因。
市面上的语音转写软件的转写原理大同小异。有能力的软件训练自己的识别和转写引擎,如讯飞、Otter;没有引擎的公司根据自身转写和功能需求,付费使用第三方公司的转写引擎,如 Notta、RIMO。语音转写技术发展到今天,无论是哪种方式,精准度都已达到了及格线。它们的差别主要在于对语言细节与专业词汇的识别能力。
我准备了中英文/两组素材分别导入 Notta 和讯飞听见里进行转写。
转写结果中两种软件在文本准确度方面几乎持平,准确率均在 95% 左右,在涉及人名、地名、品牌名等一些特殊的词汇上,两者都有不同程度的错误。但这些错误不会造成语义理解的问题,并没有对会后整理素材造成太大的影响。
但如果观察转写界面就会发现。Notta 将文本切得更细,每段/每句后都直接附上了原声语音切片。讯飞则直接呈现了完整的段落。如果后期工作需要以编辑校对为主,尤其是相关术语近音词可能造成歧义的,切得细的相对容易进行二次校验。至于段落完整的,则更适合阅读,算是应用取向的差异,各有千秋。在文末可以获取转写原文对比。
完成转写之后,Notta 在导出文本时还具备良好的兼容性。
Notta 除了支持实时录音转写,还支持音频、视频的主流格式导入转写,我们在网上下载的音频视频文件无需转换格式可直接导入 Notta 中获取转写文字,并可导出多种格式的文本档案,如 PDF、DOCX、SRT 等格式。
语言支持方面也是 Notta 的优势,Notta 集成 Google、AMI、微软、思必驰等多家引擎服务商,支持中文(简体、繁体、粤语)、英语、日语等多达数十种语言,还包含多种口音,如印度英语、澳大利亚英语等,系统会根据不同的语言智能匹配不同的引擎。
你也可以在转写后的文本中进行文档标记、并在标记处做标签笔记,插入图片,并将转写文档建组归档。
▍
作为效率工具的 Notta
在很多实际场景中,转写准确度只是基础技能。比如在会议、课堂等场景下,我们用手机录音,但很少人会使用手机对长文本进行编辑校对,所以转写服务最好实现多端同步,在大屏上实现编辑和校对功能。
如果仅仅作为转写工具,Notta 有很多的替代品,中文有讯飞、英文有 Otter,在准确度和基础的功能方面,体验相差不大。而除了先前提到的多端同步,Notta 还围绕转写结果开发了一系列功能,为后续的整理与处理提供了不少便利。
发送至 Notion,让工作流成为闭环
在最近一周的更新中,Notta 的网页端和移动端陆续支持了推送到 Notion 的功能。
经过非常简单的配置后,Notta 的转写文档可以轻松推送到 Notion 里,进行归档和进一步使用。
支持 Notion 这件事让我惊喜好久,因为我个人的笔记系统就围绕 Notion 搭建,Notta 支持推送到 Notion 直接补齐了以往我笔记体系中的一个缺口。
在工作/生活中,我们有很多类型的笔记,《卡片式笔记写作法》一书中将笔记分为:闪念笔记、永久笔记、项目笔记以及文献笔记。这些笔记来自不同的的场景。通过 flomo 记录的灵感,同步在 Notion 成为闪念笔记;通过 Notta 转写记录的会议、网页音频、视频,推送到 Notion,一部分成为项目笔记,另一部分与通过 Web Clipper 抓取的文章、文献一起,组成 Notion 的文献库。
这些不同的场景产生的笔记最后汇聚在 Notion,让自己的工作流形成闭环。经过加工整理最终成为文献笔记、项目笔记、永久笔记,成为自己的专属知识库。
个人认为,不是所有的工具都能做成我们想要的 All-in-One。SaaS 服务商都希望自己成为全能选手,把用户留在自己的 App 内,不如与主流的工具连接,成为不可或缺的辅助。
让学习更高效的 Chrome 插件
Notta Chrome 插件带来的则是使用体验上里程碑式的提升。
在 Chrome Web Store 下载 Notta 插件后,我们就能轻松获得网页端的音频文件,还可以获取对应的转写结果。
我现在常常把在小破站看到的技能技巧视频,通过 Notta Chrome 插件录制转写,推送到 Notion,保存在自己的知识库;UP 主的有趣观点,也可以录制转写后推送到 Notion 做成文献笔记。
帮你开会的 Notta Bot
因为疫情影响,远程会议、网课成为我们生活日常。Notta 在去年推出的 Zoom 会议机器人,可以帮忙参会并进行实时转写。
一些不需要发言的网络研讨会、开放性的会议可以使用 Notta Bot 定时参会,空闲时候回顾音频和文本。公司例会和客户会议可以通过 Notta Bot 记录文档,推送到 Notion 留存。
目前 Notta Bot 已经支持 Zoom/Google Meet/Microsoft Teams,还可以同步自己的日历,实现自动参会。
▍
总结
两周前,我认为 Notta 是一款专业的语音转写工具。现在,我把 Notta 当成一款基于转写结果的效率工具。
Notta 在体验方面也不断进步。作为一款云服务,隐私是绕不开的话题。部署在海外的服务器和足够克制的软件使用权限是我选择这款软件的决定性因素。在 Apple 要求 App Store 上架的应用必须支持「账户删除」功能后,Notta 也已经支持删除账户。这也让我乐于为它付费。
当然,它也有这样那样的问题,例如它坚持 EDM 邮件告知更新,以至于移动 / Web 端更新了重大功能,而用户需要使用的时候才知道。
但如果你希望有一款能帮你提高工作学习效率的产品,我仍然会推荐你尝试 Notta。
Notta 目前提供移动端 App 与网页端服务,并提供免费试用。试用方案包括每月 120 分钟的转写时长,以及线上会议转写、转写结果标注等基本功能。付费版本 Notta Pro 支持年付费与月付费两种计费模式,iOS 端月付 48 元/月,年付为 228 元/年,约合 19 元/月;或在 Android 端及网页端月订阅 13.99 美元,年付 99 美元;会员资格多端通用,网页端显示语言可能与网络环境相关。
你可以前往 https://www.notta.ai、
App Store
、
Play Store
、
Chrome Web Store
查看并试用 Notta。
转写对比
Notta
中文:
https://bit.ly/nottasspaicn
英文:
https://bit.ly/nottasspaien
讯飞
中文:
https://bit.ly/iflysspaicn
英文:
https://bit.ly/iflysspaien
原文链接:
https://sspai.com/post/72093?utm_source=wechat&utm_medium=social
作者:一只Tom
责编:北鸮
/
更多热门文章
/
登录查看更多
点赞并收藏
0
暂时没有读者
0
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
软件
关注
20
软件(中国大陆及香港用语,台湾作软体,英文:Software)是一系列按照特定顺序组织的计算机数据和指令的集合。一般来讲软件被划分为编程语言、系统软件、应用软件和介于这两者之间的中间件。软件就是程序加文档的集合体。
653页PDF,含PPT,斯坦福大学、科罗拉多大学最新【语音与语言处理】书稿《语音与语言处理:自然语言处理、计算语言学与语音识别概论 "Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition》
专知会员服务
46+阅读 · 2022年2月25日
自动化机器学习,67页ppt
专知会员服务
72+阅读 · 2021年7月3日
多模态预训练模型简述
专知会员服务
109+阅读 · 2021年4月27日
【斯坦福CS224N硬核课】自然语言生成NLG,79页ppt
专知会员服务
36+阅读 · 2021年2月22日
中国AI语音识别市场研究报告(附PDF下载)
专知会员服务
77+阅读 · 2020年12月30日
纽约大学最新《语音识别Speech Recognition》2020课程,不可错过!
专知会员服务
43+阅读 · 2020年11月2日
多模态摘要简述
专知会员服务
142+阅读 · 2020年9月6日
【清华大学】低资源语言:回顾综述和未来的挑战,14页pdf
专知会员服务
36+阅读 · 2020年6月16日
【资源】100+本免费数据科学书
专知会员服务
107+阅读 · 2020年3月17日
【综述】用于语音自动处理的深度神经网络综述:从大型语料库到有限数据的调查
专知会员服务
23+阅读 · 2020年3月9日
为什么 Discord 语音聊天不用拨号?
人人都是产品经理
0+阅读 · 2022年4月7日
打工人,离职也要「躲躲藏藏」
36氪
0+阅读 · 2022年2月21日
K8s 为什么这么复杂?
CSDN
0+阅读 · 2022年2月10日
百度翻译十年:语种全球首破200大关,质量提升30个百分点,每天翻译超千亿字符
量子位
0+阅读 · 2021年12月21日
用了那么久 Mac,你可能不知道「访达」还有这个功能
少数派
0+阅读 · 2021年12月10日
初创公司如何训练大型深度学习模型
AI前线
0+阅读 · 2021年12月6日
Meta发布支持128种语言的新语音模型:指向元宇宙跨语种交流,可在线试玩
量子位
0+阅读 · 2021年11月22日
不止于听!试试在元宇宙打工,讯飞听见发布智慧办公服务平台
新智元
0+阅读 · 2021年10月27日
python语音识别终极指南
AI100
13+阅读 · 2018年4月5日
语音识别之--韩语语音识别
微信AI
15+阅读 · 2017年8月2日
辐射热传导问题的非重叠型区域分解并行算法
国家自然科学基金
0+阅读 · 2014年12月31日
基于语谱图信息的汉语词汇整体识别和语音增强方法研究
国家自然科学基金
0+阅读 · 2014年12月31日
非母语汉语学习过程中语音生成与习得研究
国家自然科学基金
0+阅读 · 2013年12月31日
环境参数对激光水中传输衰减特性的影响
国家自然科学基金
0+阅读 · 2012年12月31日
无线通信系统压缩采样定时同步机制研究
国家自然科学基金
1+阅读 · 2012年12月31日
面向高准确率语音转写的用户反馈学习与识别结果优化
国家自然科学基金
0+阅读 · 2012年12月31日
驾驶舱话音记录器音源识别和说话人识别的基础研究
国家自然科学基金
0+阅读 · 2012年12月31日
基于DBN协同建模的中文及跨语种语音结构事件检测研究
国家自然科学基金
0+阅读 · 2011年12月31日
适于含噪语音信号过程的随机过程叠加与声学语音特征研究
国家自然科学基金
0+阅读 · 2009年12月31日
南海低纬地区晚第四纪孢粉记录及气候环境演变
国家自然科学基金
1+阅读 · 2009年12月31日
Robin-Dirichlet alternating iterative procedure for solving the Cauchy problem for Helmholtz equation in an unbounded domain
Arxiv
0+阅读 · 2022年4月20日
An Empirical Study on the Relationship Between the Number of Coordinated Views and Visual Analysis
Arxiv
0+阅读 · 2022年4月20日
Functional Calibration under Non-Probability Survey Sampling
Arxiv
0+阅读 · 2022年4月20日
Functional Covering of Point Processes
Arxiv
0+阅读 · 2022年4月20日
On the Performance Evaluation of Action Recognition Models on Transcoded Low Quality Videos
Arxiv
0+阅读 · 2022年4月19日
The maximum likelihood degree of sparse polynomial systems
Arxiv
0+阅读 · 2022年4月19日
Supervised Contrastive Learning for Recommendation
Arxiv
0+阅读 · 2022年4月19日
Faster-Than-Native Alternatives for x86 VP2INTERSECT Instructions
Arxiv
0+阅读 · 2022年4月16日
Unsupervised Domain Clusters in Pretrained Language Models
Arxiv
11+阅读 · 2020年4月5日
Compositional GAN: Learning Conditional Image Composition
Arxiv
31+阅读 · 2018年7月19日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
软件
DOCX
语义理解
Google Chrome
香港理工大学
思必驰
相关VIP内容
653页PDF,含PPT,斯坦福大学、科罗拉多大学最新【语音与语言处理】书稿《语音与语言处理:自然语言处理、计算语言学与语音识别概论 "Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition》
专知会员服务
46+阅读 · 2022年2月25日
自动化机器学习,67页ppt
专知会员服务
72+阅读 · 2021年7月3日
多模态预训练模型简述
专知会员服务
109+阅读 · 2021年4月27日
【斯坦福CS224N硬核课】自然语言生成NLG,79页ppt
专知会员服务
36+阅读 · 2021年2月22日
中国AI语音识别市场研究报告(附PDF下载)
专知会员服务
77+阅读 · 2020年12月30日
纽约大学最新《语音识别Speech Recognition》2020课程,不可错过!
专知会员服务
43+阅读 · 2020年11月2日
多模态摘要简述
专知会员服务
142+阅读 · 2020年9月6日
【清华大学】低资源语言:回顾综述和未来的挑战,14页pdf
专知会员服务
36+阅读 · 2020年6月16日
【资源】100+本免费数据科学书
专知会员服务
107+阅读 · 2020年3月17日
【综述】用于语音自动处理的深度神经网络综述:从大型语料库到有限数据的调查
专知会员服务
23+阅读 · 2020年3月9日
热门VIP内容
开通专知VIP会员 享更多权益服务
军用数据链:武器装备神经,联合作战基石,31页pdf
【ETHZ博士论文】超越像素深度:通过深度学习增强超分辨率技术,198页pdf
2018∼2023年国家自然科学基金人工智能学科人才项目申请及资助综述
【NeurIPS2024】《AmoebaLLM:构建任意形状的大型语言模型以实现高效和即时部署》
相关资讯
为什么 Discord 语音聊天不用拨号?
人人都是产品经理
0+阅读 · 2022年4月7日
打工人,离职也要「躲躲藏藏」
36氪
0+阅读 · 2022年2月21日
K8s 为什么这么复杂?
CSDN
0+阅读 · 2022年2月10日
百度翻译十年:语种全球首破200大关,质量提升30个百分点,每天翻译超千亿字符
量子位
0+阅读 · 2021年12月21日
用了那么久 Mac,你可能不知道「访达」还有这个功能
少数派
0+阅读 · 2021年12月10日
初创公司如何训练大型深度学习模型
AI前线
0+阅读 · 2021年12月6日
Meta发布支持128种语言的新语音模型:指向元宇宙跨语种交流,可在线试玩
量子位
0+阅读 · 2021年11月22日
不止于听!试试在元宇宙打工,讯飞听见发布智慧办公服务平台
新智元
0+阅读 · 2021年10月27日
python语音识别终极指南
AI100
13+阅读 · 2018年4月5日
语音识别之--韩语语音识别
微信AI
15+阅读 · 2017年8月2日
相关基金
辐射热传导问题的非重叠型区域分解并行算法
国家自然科学基金
0+阅读 · 2014年12月31日
基于语谱图信息的汉语词汇整体识别和语音增强方法研究
国家自然科学基金
0+阅读 · 2014年12月31日
非母语汉语学习过程中语音生成与习得研究
国家自然科学基金
0+阅读 · 2013年12月31日
环境参数对激光水中传输衰减特性的影响
国家自然科学基金
0+阅读 · 2012年12月31日
无线通信系统压缩采样定时同步机制研究
国家自然科学基金
1+阅读 · 2012年12月31日
面向高准确率语音转写的用户反馈学习与识别结果优化
国家自然科学基金
0+阅读 · 2012年12月31日
驾驶舱话音记录器音源识别和说话人识别的基础研究
国家自然科学基金
0+阅读 · 2012年12月31日
基于DBN协同建模的中文及跨语种语音结构事件检测研究
国家自然科学基金
0+阅读 · 2011年12月31日
适于含噪语音信号过程的随机过程叠加与声学语音特征研究
国家自然科学基金
0+阅读 · 2009年12月31日
南海低纬地区晚第四纪孢粉记录及气候环境演变
国家自然科学基金
1+阅读 · 2009年12月31日
相关论文
Robin-Dirichlet alternating iterative procedure for solving the Cauchy problem for Helmholtz equation in an unbounded domain
Arxiv
0+阅读 · 2022年4月20日
An Empirical Study on the Relationship Between the Number of Coordinated Views and Visual Analysis
Arxiv
0+阅读 · 2022年4月20日
Functional Calibration under Non-Probability Survey Sampling
Arxiv
0+阅读 · 2022年4月20日
Functional Covering of Point Processes
Arxiv
0+阅读 · 2022年4月20日
On the Performance Evaluation of Action Recognition Models on Transcoded Low Quality Videos
Arxiv
0+阅读 · 2022年4月19日
The maximum likelihood degree of sparse polynomial systems
Arxiv
0+阅读 · 2022年4月19日
Supervised Contrastive Learning for Recommendation
Arxiv
0+阅读 · 2022年4月19日
Faster-Than-Native Alternatives for x86 VP2INTERSECT Instructions
Arxiv
0+阅读 · 2022年4月16日
Unsupervised Domain Clusters in Pretrained Language Models
Arxiv
11+阅读 · 2020年4月5日
Compositional GAN: Learning Conditional Image Composition
Arxiv
31+阅读 · 2018年7月19日
大家都在搜
智能推荐
笛卡尔
大型语言模型
全面综述
空战战术
大模型
MoE
汽车智能化
无人艇
出海产品从 0 到 1 该怎么做
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top