今天沙龙君测试了几款术语提取工具,它们各有特色,但共同的特点是:开源(免费)、可以在线使用无需下载,所以,为什么不尝试一下呢?
访问我们的网站“翻译技术速递”(transtech.lingosail.com),了解更多机器翻译、翻译项目管理、本地化知识。
TermoStat Web 3.0
网址:http://termostat.ling.umontreal.ca/index.php?lang=en_CA
TermoStat 是一款术语抽取工具,应用了语言学法和统计学法,同时还会考虑潜在术语的结构和相对的出现频率。TermoStat免费开放,但用户需要注册才能使用。
(提取结果页面)
沙龙君觉得很有趣的一个功能是,点击页面左上的“Cloud”,可以根据如下的一张映射图,图中术语的字体越大,说明它出现得越频繁,点击图上的术语,可以看到它所在的句子。
TaaS
网址:http://www.taas-project.eu/
TaaS是一款基于云计算技术的平台,支持24种欧盟官方语言以及俄语。该平台引领着术语工作的新风尚,即运用语言智能自动完成术语识别,通过主要术语进行译文查找,最终人工完成译文的核验。
VocabGrabber
网址:https://www.visualthesaurus.com/vocabgrabber/
它分析任何文本,生成列表列出最有用的词汇,并显示在上下文中如何使用这些单词,然后可以对词汇表进行排序、过滤和保存。VocabGrabber还提供视觉词库映射和单词定义。
VocabGrabber 和前面提到的 TermoStat 比较像,不过VocabGrabber 能按领域分类显示提取到的潜在术语。
TerMine
网址:http://www.nactem.ac.uk/software/termine/
TerMine专门用于生物药学领域。其在生物医学文献领域的术语(例如基因、蛋白质、化合物、药物等)数量增长很快。现有的术语资源和科学数据库无法跟上新词的出现。TerMine支持所有支持Unicode的语言。
文本上传:可以通过以下任何一种方式将文本提交进行分析:在最上方的文本窗口中输入要分析的文本;从计算机的硬盘驱动器中指定文本文件(.txt格式或.pdf格式),或输入网页资源的URL(.html格式或 .pdf格式)。
语帆术语宝
网址:http://termbox.lingosail.com/
沙龙君觉得,和前面几款术语工具相比,语帆术语宝能进行双语文本的自动对齐,因此它的“双语提取”功能显得很方便。另外,语帆术语宝同时支持TMX格式、DOCX格式和TXT格式。
ref:
https://termcoord.eu/discover__trashed/free-term-extractors/term-extraction-tools/