成品电影网站建设,专业建网站 优帮云,wordpress图片加链接,个人网站建站系统【Pytorch】学习记录分享7——PyTorch自然语言处理基础-词向量模型Word2Vec 1. 词向量模型Word2Vec)1. 如何度量这个单词的#xff1f;2.词向量是什么样子#xff1f;3.词向量对应的热力图#xff1a;4.词向量模型的输入与输出1. 如何度量这个单词的2.词向量是什么样子3.词向量对应的热力图4.词向量模型的输入与输出 2.如何构建训练数据2.1 构建训练数据2.2 不同模型对比(传入中间词预测上下文传入上下文预测中间词汇) 3.如何训练3.1 如何设计驯联网络3.2 改进方案加入一些负样本负采样模型3.3 词向量训练过程 1. 词向量模型Word2Vec)
1. 如何度量这个单词的 2.词向量是什么样子 3.词向量对应的热力图 4.词向量模型的输入与输出 2.如何构建训练数据
2.1 构建训练数据
类似wiki与合乎说话逻辑的文本均可以作为训练数据
2.2 不同模型对比(传入中间词预测上下文传入上下文预测中间词汇)
CBOW: Skip-gram模型所需训练数据集 :
3.如何训练
3.1 如何设计驯联网络
如果一个语料库稍微大一些可能的结果简直太多了最后一层相当于softmax计算起来十分耗时有什么办法来解决嘛 初始方案输入两个单词看他们是不是前后对应的输入和输出也就相当于一个二分类任务但是这样做之后 出发点非常好但是此时训练集构建出来的标签全为1无法进行较好的训练
3.2 改进方案加入一些负样本负采样模型 3.3 词向量训练过程
1.初始化词向量矩阵 2.通过神经网络返向传播来计算更新此时不光更新权重参数矩阵W也会更新输入数据