当前位置: 首页 > news >正文

安徽网站建设详细策划合肥集团网站建设公司

安徽网站建设详细策划,合肥集团网站建设公司,返利系统网站开发,中国人社app下载安装Word2vec 涉及到两种优化方式#xff0c;一种是负采样#xff0c;一种是层序Softmax 先谈一下负采样#xff0c;以跳字模型为例。中心词生成背景词可以由两个相互独立事件的联合组成来近似#xff08;引自李沐大神的讲解#xff09;。 第一个事件是#xff0c;中心词和…Word2vec 涉及到两种优化方式一种是负采样一种是层序Softmax 先谈一下负采样以跳字模型为例。中心词生成背景词可以由两个相互独立事件的联合组成来近似引自李沐大神的讲解。 第一个事件是中心词和背景词同时出现在窗口中。第二个事件是中心词和K个噪声词不同时出现在窗口数据中其中噪声词由噪声分布随机生成。 这里我们就可以知道上一个文章开头说到的负采样是一种等价操作还是近似操作我们在第二个事件中使用了K个噪声词。但是实际上呢应该远远大于K。 还是那个例子句子为我/永远/爱/中国/共产党中心词为’爱’我们在选择噪声词的时候选择了K个但是实际上在词汇表中排除掉’我’‘永远’‘中国’‘共产党’ 这四个词汇的其他词都可以算做我的噪声词然而为了减少复杂度我只选择了其中的K个所以当然应该是近似了。 接下来我们看层序Softmax。 层序Softmax 对应的就是在输出层使用一个霍夫曼树代替了原本在输出层统一进行的softmax。 首先我们需要了解霍夫曼树在这里是如何构建的。 简单讲霍夫曼树是一个二叉树以语料中出现过的词当做叶子节点以各词在语料中出现的次数当做权值进行构造。其中叶子节点有N个就是词典的大小非叶子节点有N-1个包括根节点。 比如说我的所有文章中“共产党”这个词出现了 100次是最大的那么根节点的左分支或者右分支就对应着”共产党“这个词另一个分支做与根节点相同的操作找到排除”共产党“这个词之外的所有词中最大的词比如”中国“作为其中的左分支或者右分支以此类推一个霍夫曼树就成功构建。 霍夫曼树中我们需要注意的是每个非叶子节点对应一个向量每个叶子节点对应一个向量。两种向量都会随着模型的训练进行更新。 其中叶子节点的向量就是我们的词向量而非叶子节点上的向量就是没有什么实际含义它的作用就是帮助我们计算模型在霍夫曼树上不断的进行二分类时候的概率。 以上面那句话为例我们现在中心词为‘爱’然后我要预测背景词‘中国’。首先我们要确定的是我的叶子节点是包含所有单词的也就是包含了我这个简单句子的五个单词不考虑前期数据清洗低频率词的情况。 也就是说在这个霍夫曼树上有且仅有一条路径让我从根节点出发经过多次判断也就是说走过了多个非叶子节点最终走到了“中国”这个叶子节点对应的概率就是每个节点概率的连乘。 然后这个时候我们想一下霍夫曼树是不是一种近似 当然我们每更新一个词向量只是涉及到了可以到达叶子节点的这一条路径上节点。所以复杂度就是树的高度也就是 O(log|V|)
http://www.pierceye.com/news/630997/

相关文章:

  • 网站制作过程个人网站吗
  • gta5网站建设中温州建设局老网站
  • 凤岗仿做网站专业网站设计制作优化排名
  • 企业网站seo优化德国设计网站大全
  • 重庆网站制作公司电话whois域名查询
  • 六安网站自然排名优化价格自己做网站前端开发
  • 网站发布与推广怎么写广东省城乡建设厅网站
  • 用ipv6地址做网站访问上海网址推广
  • 手把手教你做网站 3北京网站建设是什么
  • 建设商务网站目的及功能定位惠州专业网站建设公司哪里有
  • 网站建设技术 教材迈若网站建设
  • 服务器正常网站打不开旅游app排行榜前十名
  • 网站建设服务套餐免费net网站空间
  • 导购网站怎么推广公司建多个网站
  • 做相册集什么网站电脑谷歌浏览器打开是2345网址导航
  • 做网站顾客提现金额后台私做网站名电子章
  • ps做网站素材文件打包开源软件开发
  • 焦作网站建设价格asp网站怎么运行
  • 宜昌市做网站的公司页面设计图片大全
  • 购买网站空间多少钱石家庄权威发布
  • 网站开发数据库动态管理网页制作商品页面模板
  • 电商网站设计模板平面设计师兼职网站
  • 网站建设的技术手段如何选择最好的域名
  • 汕头企业网站建设服务环境艺术设计网站推荐
  • 小米网站建设外贸网站建设哪家公司好
  • 怎样推广产品专业黑帽seo推广
  • 网站调用字体在阿里云备案网站通过
  • 手机网站做落地页石家庄网络营销
  • 如何把网站主关键词做到百度首页网站页面设计优化方案
  • 做门户网站多少钱做视频解析网站播放器和接口