[Python] 字詞轉向量(Word2vec): gensim

gensim
https://github.com/RaRe-Technologies/gensim

[NLP] 秒懂詞向量Word2vec的本質
https://zhuanlan.zhihu.com/p/26306795

自然語言處理入門- Word2vec小實作
https://medium.com/pyladies-taiwan/f8832d9677c8

Gensim Word2Vec 簡易教學
https://www.kaggle.com/jerrykuo7727/word2vec

以 gensim 訓練中文詞向量
http://zake7749.github.io/2016/08/28/word2vec-with-gensim/

gensim是一個python的自然語言處理庫,能夠將文檔根據TF-IDF, LDA, LSI 等模型轉化成向量模式,gensim還實現了word2vec功能,以便進行進一步的處理。

word2vec核心主要為將輸入的分詞為集群,可用來映射每個詞到一個向量後,並再計算出各詞之間的距離,亦表示詞對詞之間的關係。該向量為神經網路之隱藏層,並可表示文本字詞語義上的相似度。


#gensim, word2vec. python, 字詞, 向量, 相似度, 自然語言

留言