相关研究论文以“Restoring and attributing ancient texts using deep neural networks”为题,以封面文章形式发表在权威科学期刊 Nature 上。 研究结果显示,当 Ithaca 单独被用于复原受损铭文时,准确率可以达到 62%,而参与此次研究的历史学家,单独预测准确率仅为 25%;而当 Ithaca 与历史学家“合作”后,这一数字可以提升到 72%。
基于以上原因,这些铭文解读起来,既困难又费时。 历史学家的 AI 助手 如何解决上述问题?如今,AI 做得或许要更好一些。 当前,自然语言处理(NLP)模型通常会使用大量单词来进行训练,因为这些单词在句子中出现的顺序与它们之间的关系可以提供额外的含义。比如,“once upon a time” 一起出现,就比单个字符或单词更有含义。