[智能体-271]：Word2Vec的使用示例-港品优选

Word2Vec 完整使用示例（gensim，分 4 种常用场景）

前置安装

bash

运行

pip install gensim

语料（已分词）

python

运行

from gensim.models import Word2Vec # 分词后的句子列表 sentences = [ ["苹果", "很甜", "是", "水果"], ["香蕉", "软糯", "是", "水果"], ["西瓜", "多汁", "是", "水果"], ["猫咪", "可爱", "属于", "动物"], ["小狗", "温顺", "属于", "动物"] ] # 训练模型 sg=1 SkipGram；sg=0 CBOW，用现有的语料库进行训练 model = Word2Vec(sentences, sg=1, vector_size=50, window=2, min_count=1, epochs=20) # 词向量容器：字典 wv = model.wv # 词向量容器

示例 1：获取单个词向量

python

运行

# 根据单词名称，查找词向量字典表 vec = wv["苹果"] print(vec)

示例 2：查询近义词 most_similar

python

运行

# 找出与目标词相邻的词汇 # 根据“单词”，在字典中，找到对应的索引。 # 找到语义相邻的三个“词” res = wv.most_similar("苹果", topn=3) print("苹果相似词：", res) # 输出优先：香蕉、西瓜

示例 3：计算两个词语余弦相似度

python

运行

sim1 = wv.similarity("苹果", "香蕉") sim2 = wv.similarity("苹果", "猫咪") print("苹果-香蕉：", sim1) print("苹果-猫咪：", sim2) # sim1 >> sim2

示例 4：词语类比运算（经典：A-B+C）

python

运行

# 水果 - 苹果 + 香蕉 ≈西瓜 res = wv.most_similar(positive=["香蕉","水果"], negative=["苹果"], topn=1) print(res)

示例 5：保存 / 加载模型

python

运行

# 保存 model.save("word2vec.model") # 加载：训练好的模型，可以直接使用 new_model = Word2Vec.load("word2vec.model")

关键参数速记

sg=1：SkipGram (常用)；sg=0：CBOW
vector_size：向量维度 (50/100/300)
window：上下文窗口大小
min_count：出现次数少于该值直接丢弃词语

衔接前文技术链

OneHot（孤立无关系）→Word2Vec（近义词可计算、静态向量）→BERT（动态一词多义）→BGE/E5（段落语义）。

企业官网建设流程全解析

Word2Vec 完整使用示例（gensim，分 4 种常用场景）

前置安装

语料（已分词）

示例 1：获取单个词向量

示例 2：查询近义词 most_similar

示例 3：计算两个词语余弦相似度

示例 4：词语类比运算（经典：A-B+C）

示例 5：保存 / 加载模型

关键参数速记

衔接前文技术链

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

Word2Vec 完整使用示例（gensim，分 4 种常用场景）

前置安装

语料（已分词）

示例 1：获取单个词向量

示例 2：查询近义词 most_similar

示例 3：计算两个词语余弦相似度

示例 4：词语类比运算（经典：A-B+C）

示例 5：保存 / 加载模型

关键参数速记

衔接前文技术链

热门文章

文章分类

标签云

相关文章

w64devkit：Windows平台C/C++开发终极指南

Windows下GTK开发环境配置：从Dev-C++到跨平台GUI编程实战

3分钟搞定B站CC字幕下载转换：告别手动抄录的终极指南

需要专业的网站建设服务？