成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
词向量表示
关注
37
分散式表示即将语言表示为稠密、低维、连续的向量。 研究者最早发现学习得到词嵌入之间存在类比关系。比如apple−apples ≈ car−cars, man−woman ≈ king – queen 等。这些方法都可以直接在大规模无标注语料上进行训练。词嵌入的质量也非常依赖于上下文窗口大小的选择。通常大的上下文窗口学到的词嵌入更反映主题信息,而小的上下文窗口学到的词嵌入更反映词的功能和上下文语义信息。
综合
百科
VIP
热门
动态
论文
精华
On the Emergence of Linear Analogies in Word Embeddings
Arxiv
0+阅读 · 10月23日
Spatio-temporal Sign Language Representation and Translation
Arxiv
0+阅读 · 10月22日
Closed-Form Training Dynamics Reveal Learned Features and Linear Structure in Word2Vec-like Models
Arxiv
0+阅读 · 10月16日
Scalable Multi-phase Word Embedding Using Conjunctive Propositional Clauses
Arxiv
0+阅读 · 10月17日
Quantifying Gender Stereotypes in Japan between 1900 and 1999 with Word Embeddings
Arxiv
0+阅读 · 10月4日
Static Word Embeddings for Sentence Semantic Representation
Arxiv
0+阅读 · 9月30日
Computational Detection of Intertextual Parallels in Biblical Hebrew: A Benchmark Study Using Transformer-Based Language Models
Arxiv
0+阅读 · 6月30日
Intertextual Parallel Detection in Biblical Hebrew: A Transformer-Based Benchmark
Arxiv
0+阅读 · 7月1日
Let's Simply Count: Quantifying Distributional Similarity Between Activities in Event Data
Arxiv
0+阅读 · 9月11日
Closed-Form Training Dynamics Reveal Learned Features and Linear Structure in Word2Vec-like Models
Arxiv
0+阅读 · 5月28日
Protecting Copyright of Medical Pre-trained Language Models: Training-Free Backdoor Model Watermarking
Arxiv
0+阅读 · 4月15日
Word Embedding Techniques for Classification of Star Ratings
Arxiv
0+阅读 · 4月18日
A Data-driven Investigation of Euphemistic Language: Comparing the usage of "slave" and "servant" in 19th century US newspapers
Arxiv
0+阅读 · 3月19日
A Simplified Retriever to Improve Accuracy of Phenotype Normalizations by Large Language Models
Arxiv
0+阅读 · 3月4日
Words as Bridges: Exploring Computational Support for Cross-Disciplinary Translation Work
Arxiv
0+阅读 · 3月24日
参考链接
父主题
语言表示
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top