当前位置: 首页 > news >正文

网站设计)常用网站后台地址

网站设计),常用网站后台地址,建设项目流程八个阶段,常用网站推广方法textdistance是Python的第三方库#xff0c;用于计算文本之间的相似度或距离。它提供了30个算法#xff0c;简单易用。 安装 pip install textdistance# 使用扩展库#xff0c;提高性能 pip install textdistance[extras]使用 import textdistance# 计算编辑…textdistance是Python的第三方库用于计算文本之间的相似度或距离。它提供了30个算法简单易用。 安装 pip install textdistance# 使用扩展库提高性能 pip install textdistance[extras]使用 import textdistance# 计算编辑距离 distance textdistance.levenshtein.distance(如何更换花呗绑定银行卡, 花呗更改绑定银行卡) print(编辑距离:, distance)# 计算余弦相似度 similarity textdistance.cosine.similarity(如何更换花呗绑定银行卡, 花呗更改绑定银行卡) print(余弦相似度:, similarity)# 计算 Jaccard 系数 coefficient textdistance.jaccard(如何更换花呗绑定银行卡, 花呗更改绑定银行卡) print(Jaccard 系数:, coefficient)# 计算 Hamming 距离 distance textdistance.hamming.distance(如何更换花呗绑定银行卡, 花呗更改绑定银行卡) print(Hamming 距离:, distance)结果 编辑距离: 5 余弦相似度: 0.8040302522073697 Jaccard 系数: 0.6666666666666666 Hamming 距离: 10应用场景 拼写检查 在拼写检查中可以使用编辑距离等算法来比较单词之间的相似度从而找出可能的正确拼写。 import textdistance# 拼写检查 word 发愤图强 possible_spellings [发奋图强, 发奋图, 发愤图]for spelling in possible_spellings:distance textdistance.levenshtein.distance(word, spelling)if distance 1:print(可能的正确拼写:, spelling)结果 可能的正确拼写: 发奋图强 可能的正确拼写: 发愤图文档相似度计算 在信息检索和推荐系统中经常需要计算文档之间的相似度以便为用户提供相关的信息或推荐内容。 import textdistance# 文档相似度计算 doc1 Python is a programming language doc2 Python is used for web development doc3 Java is a programming languagesimilarity1 textdistance.cosine.similarity(doc1, doc2) similarity2 textdistance.cosine.similarity(doc1, doc3)print(文档1和文档2的余弦相似度:, similarity1) print(文档1和文档3的余弦相似度:, similarity2)文档1和文档2的余弦相似度: 0.6063390625908325 文档1和文档3的余弦相似度: 0.8391463916782737数据清洗 在数据清洗过程中可以使用 Hamming 距离等算法来比较数据条目之间的相似度从而找出相似但不完全相同的数据。 import textdistance# 数据清洗 data [配偶, 原配, 元配, 老婆, 夫人, 爱人]for i in range(len(data)):for j in range(i1, len(data)):distance textdistance.hamming.distance(data[i], data[j])if distance 1:print(相似但不完全相同的数据:, data[i], data[j])结果 相似但不完全相同的数据: 原配 元配 相似但不完全相同的数据: 夫人 爱人import textdistance# 姓名匹配 name1 李建国 name2 张建国 name3 王爱国coefficient1 textdistance.jaccard.normalized_similarity(name1, name2) coefficient2 textdistance.jaccard.normalized_similarity(name1, name3)print(姓名1和姓名2的Jaccard系数:, coefficient1) print(姓名1和姓名3的Jaccard系数:, coefficient2)结果 姓名1和姓名2的Jaccard系数: 0.5 姓名1和姓名3的Jaccard系数: 0.19999999999999996textdistance 提供了丰富多样的文本比较算法和距离度量方法可以满足各种不同的文本比较需求。 相关链接 源码
http://www.pierceye.com/news/984070/

相关文章:

  • 优秀网站建设空间海口 网站建设
  • 设计网站页面出现问题九江哪家网站建设公司好
  • 深圳做企业网站的公司成都公司展厅
  • 两学一做 网站t型布局网站怎么做
  • 论坛网站建设联系方式成都网站设计制作价格
  • 网页网站建设的ppt模板下载响应式网站项目
  • 做网站在哪里可以找到高清壁纸北京响应式网站
  • 企业网站建设门户网站建设费的摊销年限
  • 模板网站的域名是什么网站源代码程序
  • 网站空间多久续一次费长春网站制作设计
  • 网站制作价格低广西网络电视
  • 平台网站建设收费烟台网站的优化
  • 如何做提卡网站vue.js wordpress
  • 国家网站备案查询系统wordpress 主题 简洁
  • 建设商业网站html什么意思
  • 网站专题建设方案江苏省建设厅网站 杨洪海
  • 通化网站建设公司南江县住房和城乡建设局网站
  • 网站的外链是什么软件开发与网站开发的区别
  • 学做网站论坛vip账户了解网站开发的背景
  • 做3个网站需要多大的服务器科凡建站
  • 网站设计制作音乐排行榜44555pd永久四色端口
  • 网站优化方案教程如何注册chn域名网站
  • 怎样建设免费网站个别网站网速慢怎么做
  • 网页设计制作音乐排行榜一键seo提交收录
  • 网站推广要我营业执照复印件conoha wordpress
  • 免费行情软件app网站排行高质量外链网站
  • 免费解析网站制作网站开发项目实战视频
  • 柳州网站建设工作室基金会网站开发方案
  • 龙海网站建设微网站如何建设
  • 手机视频网站怎么做贵阳专业做网站