当前位置: 首页 > news >正文

网站已备案 还不能访问企业网是什么

网站已备案 还不能访问,企业网是什么,Wordpress博客欣赏,nginx php7 wordpressPyTorch 实现 GloVe#xff08;Global Vectors for Word Representation#xff09; 的完整代码#xff0c;使用 中文语料 进行训练#xff0c;包括 共现矩阵构建、模型定义、训练和测试。 1. GloVe 介绍 基于词的共现信息#xff08;不像 Word2Vec 使用滑动窗口预测Global Vectors for Word Representation 的完整代码使用 中文语料 进行训练包括 共现矩阵构建、模型定义、训练和测试。 1. GloVe 介绍 基于词的共现信息不像 Word2Vec 使用滑动窗口预测  适合较大规模的数据比 Word2Vec 更稳定 学习出的词向量能捕捉语义信息如类比关系 import torch import torch.nn as nn import torch.optim as optim import numpy as np import jieba from collections import Counter from scipy.sparse import coo_matrix# 1. 数据预处理 corpus [我们 喜欢 深度 学习,自然 语言 处理 是 有趣 的,人工智能 改变 了 世界,深度 学习 是 人工智能 的 重要 组成部分 ]# 分词 tokenized_corpus [list(jieba.cut(sentence)) for sentence in corpus] vocab set(word for sentence in tokenized_corpus for word in sentence) word2idx {word: idx for idx, word in enumerate(vocab)} idx2word {idx: word for word, idx in word2idx.items()}# 计算共现矩阵 window_size 2 co_occurrence Counter()for sentence in tokenized_corpus:indices [word2idx[word] for word in sentence]for center_idx in range(len(indices)):center_word indices[center_idx]for offset in range(-window_size, window_size 1):context_idx center_idx offsetif 0 context_idx len(indices) and context_idx ! center_idx:context_word indices[context_idx]co_occurrence[(center_word, context_word)] 1# 转换为稀疏矩阵 rows, cols, values zip(*[(c[0], c[1], v) for c, v in co_occurrence.items()]) X coo_matrix((values, (rows, cols)), shape(len(vocab), len(vocab)))# 2. 定义 GloVe 模型 class GloVe(nn.Module):def __init__(self, vocab_size, embedding_dim):super(GloVe, self).__init__()self.w_embeddings nn.Embedding(vocab_size, embedding_dim) # 中心词嵌入self.c_embeddings nn.Embedding(vocab_size, embedding_dim) # 上下文词嵌入self.w_bias nn.Embedding(vocab_size, 1) # 中心词偏置self.c_bias nn.Embedding(vocab_size, 1) # 上下文词偏置nn.init.xavier_uniform_(self.w_embeddings.weight)nn.init.xavier_uniform_(self.c_embeddings.weight)def forward(self, center, context, co_occur):w_emb self.w_embeddings(center)c_emb self.c_embeddings(context)w_bias self.w_bias(center).squeeze()c_bias self.c_bias(context).squeeze()dot_product (w_emb * c_emb).sum(dim1)loss (dot_product w_bias c_bias - torch.log(co_occur 1e-8)) ** 2return loss.mean()# 初始化模型 embedding_dim 10 model GloVe(len(vocab), embedding_dim)# 3. 训练 GloVe criterion nn.MSELoss() optimizer optim.Adam(model.parameters(), lr0.01) num_epochs 100# 转换数据 co_occurrence_tensor torch.tensor(X.data, dtypetorch.float) pairs list(zip(X.row, X.col, co_occurrence_tensor))for epoch in range(num_epochs):total_loss 0np.random.shuffle(pairs)for center, context, co_occur in pairs:optimizer.zero_grad()loss model(torch.tensor([center], dtypetorch.long),torch.tensor([context], dtypetorch.long),torch.tensor([co_occur], dtypetorch.float) # 修正数据类型)loss.backward()optimizer.step()total_loss loss.item()if (epoch 1) % 10 0:print(fEpoch [{epoch 1}/{num_epochs}], Loss: {total_loss:.4f})# 4. 获取词向量 word_vectors model.w_embeddings.weight.data.numpy()# 5. 计算相似度 def most_similar(word, top_n3):if word not in word2idx:return 单词不在词汇表中word_vec word_vectors[word2idx[word]].reshape(1, -1)similarities np.dot(word_vectors, word_vec.T).squeeze()similar_idx similarities.argsort()[::-1][1:top_n 1]return [(idx2word[idx], similarities[idx]) for idx in similar_idx]# 测试 test_words [深度, 学习, 人工智能] for word in test_words:print(f【{word}】的相似单词:, most_similar(word))数据预处理 分词使用 jieba.cut()构建共现矩阵计算窗口内的单词共现频率使用稀疏矩阵存储提高计算效率 GloVe 模型 Embedding 层 训练词向量中心词和上下文词分开Bias 变量 用于调整预测值损失函数 最小化 log(共现次数) 与词向量点积的差值 计算词向量相似度 使用 cosine similarity找出 top_n 最相似的单词
http://www.hkea.cn/news/14321550/

相关文章:

  • 企业网站开源设计院是网页设计公司是什么意思
  • 做软件需要网站吗wordpress主题 食品
  • 手机网站关键词优化刚注册的域名卖了100万
  • 南京电商网站建设公司排名如需手机网站建设
  • 杭州网站设计公司价格常州专门做网站的公司有哪些
  • 中山移动网站建设报价国家企业信用信息公示系统官网全国
  • 用php如何建设网站wordpress小工具点
  • 汉中北京网站建设中国小康建设网是骗子网站吗?
  • 深圳网站建设总部大连大久建设集团有限公司
  • 俄罗斯免费网站推广网站外链建设记住5种外链方式不可用
  • 个人做网站如何赚钱建设学校网站的意义
  • 南京网站建设培训如何做一个免费的网站
  • 网站上怎么做企业推广wordpress网易云插件
  • 福建省建设局实名制网站东莞市公共资源交易中心
  • 厦门企业官方网站建设网站 js 广告代码大全
  • php网站如何编辑高端网站建设联系方式
  • 网站设计的主要步骤怎么开公众号
  • 响应式网站模板企业wordpress cms社交
  • 家具设计师培训班长沙网络优化推广公司
  • 做研究的网站怎么下载有风险的软件
  • 企业网站建设计划书html什么意思
  • 营销网站建设的目的手机版网站开发用什么语言
  • 企业网站建设立项请示wordpress登录工具
  • 网站怎么被搜到首页室内设计公司免费网站
  • 国外移动网站设计往网站上传照片怎么做
  • 用电脑做服务器的建一个网站淘宝的网络营销模式
  • 做dnf辅助网站什么网站可以做机票行程单
  • 郑州 做网站青海服装网站建设公司
  • 做照片书的网站网站美化教程下载
  • 高清的宝安网站推广wordpress制作网站步骤