当前位置: 首页 > news >正文

网站广告做的好的企业案例分析带有响应式的网站

网站广告做的好的企业案例分析,带有响应式的网站,html中秋节网页制作代码,网站建设实力宣传海报文章目录 简介MTEBC-MTEB参考资料 简介 MTEB(Massive Text Embedding Benchmark)是目前评测文本向量很重要的一个参考#xff0c;其榜单也是各大文本向量模型用来展示与其他向量模型强弱的一个竞技台。 C-MTEB则是专门针对中文文本向量的评测基准。 MTEB MTEB的目的是为了… 文章目录 简介MTEBC-MTEB参考资料 简介 MTEB(Massive Text Embedding Benchmark)是目前评测文本向量很重要的一个参考其榜单也是各大文本向量模型用来展示与其他向量模型强弱的一个竞技台。 C-MTEB则是专门针对中文文本向量的评测基准。 MTEB MTEB的目的是为了评估向量模型在不同向量任务上的表现希望作为寻找适用于不同任务的通用文本向量的入口。在论文里说包括涵盖112种语言的58个数据集针对如下8种任务 Bitext miningclassificationclusteringpair classificationrerankingretrievalSTSsummarization 在记录的此刻MTEB的榜单上写的支持的数据集是150个、语言是113种 在论文里作者们说在评测了30多个模型后发现没有任何一个模型能够在全部任务上占据优势即使在记录的2024年3月榜单上也没有一个模型能在所有任务上都排名第一。 MTEB基于如下需求构建 多样性Diversity涵盖不同的任务、不同的语言、句子级别和篇章级别的数据集简单易用Simpilicity, 提供一个API可以应用于不同的模型可扩展性Extensibility新数据集很容易加入到基准中可复现性Reproducibility给数据集和软件添加版本使得很容易复现评测结果 上图展示了基准中包括的8类任务对应的数据集。任务描述详情如下 Bitext mining输入是来自两种不同语言的两个句子集对于来自第一个句子集的句子找到在第二个子集中最匹配的句子。模型将句子编码成向量后用余弦相似度来寻找最相似的句子对。F1是主要的评估指标、Accuracy、precision、recall也一并计算了。classification训练集和测试集通过给定模型编码测试集向量被用来训练一个LR分类器(最多100次迭代)然后使用测试集来打分主要评估指标是accuracy with average precision同时包括F1。clustering给定句子集或段落集将其分组为有意义的簇。在编码后的文档上训练一个 mini-batch k-means 模型(batch size为32, k是不同标签的个数)然后使用v-meature为模型打分。pair classification输入是一对带标签的文本两个文本被编码后计算多种距离cosine similarity, dot product, euclidean distance, manhattan distance。接着使用最佳阈值来计算accuracy, average precision, f1, precision, recall。基于余弦相似度的平均精度是主要指标。reranking输入是一个查询语句以及一个包含相关和不相关文本的列表。模型编码文本后比较与查询语句的余弦相似性。每个查询语句的分数都被计算并平均所有查询语句的分数。指标有平均 M R R k MRRk MRRk和MAP(主要指标)retrieval每个数据集包括一个语料集查询语句及其与语料中的相关文档的映射。模型编码所有查询语句和语料文档之后计算余弦相似度对每一个查询语句的结果排序后计算k的多个取值所对应的nDCGk, MRRk, MAPk, precisionk , recallk。使用BEIR相同的设置nDCG10是主要指标。STS 给定句子对计算它们的相似度标签是连续得分(越大相似度越高)。模型编码句子后计算使用不同的距离指标计算它们的相似性计算好的距离与标签相似度基准比较Pearson和Spearman相关性。主要指标是基于余弦相似度的Spearman相关性。summarization包括一个手写摘要和机器生成摘要数据集目标是给机器生成摘要打分。模型编码所有摘要然后对于每一个机器生成摘要向量计算其与所有手写摘要向量的距离将相似度最大的分数作为单个机器生成摘要的分数接下来与基准比较计算Pearson和Spearman相关性。主要指标是基于余弦相似度的Spearman相关性。 MTEB中的数据集可以归为三类 Sentence to sentence(S2S)Paragraph to paragraph (P2P)Sentence to paragraph (S2P) C-MTEB C-MTEB是为了评估中文文本向量共收集了如上图所示的35个公共数据集一共分为6类的评估任务 retrieval包括查询语句和语料库对于每个查询从语料库中查询最相似的top-k个文档使用BEIR相同的设置nDCG10是主要指标。re-ranking包括查询语句和候选文档集一个正样本和N个负样本基于向量相似性来重排序MAP是主要指标。STS (semantic textual similarity)基于向量相似度比较两个句子的相关性计算了Spearman 相关性并作为主要指标。classification与MTEB一样。pair classification比较一对句子的相似性使用平均精度作为主要指标。clustering评测方法与MTEB一样。 向量在每个任务上的表现是对应任务下所有数据集的平均指标来决定而向量整体性能是所有数据集的平均值决定的。 参考资料 MTEB github 和 MTEB huggingface 榜单 和MTEB对应的论文)C-MTEB 对应的论文
http://www.pierceye.com/news/831483/

相关文章:

  • 微信上可以做网站吗网页设计作业讲解
  • 长春好的做网站公司潍坊 网站
  • 做网站自己装服务器谷歌排名规则
  • 58.搜房等网站怎么做效果才好商贸公司企业简介模板
  • 中国最早做网站是谁卖网站怎样做
  • 张店专业网站优化哪家好书画工作室网站模板网站建设
  • 兰州网站制作怎么样青海哪家做网站的公司最大
  • 云龙湖旅游景区网站建设招标网站升级改版需要几天
  • 高端大气网络设计建设公司网站织梦模板沈阳模板建站哪家好
  • 郑州哪有做网站的高端网站建设与制作
  • 江阴网站网站建设蓝色 宽屏 网站 模板下载
  • 网站建设设计大作业重庆公共信息交易资源网
  • 做公司网站的多少钱公司建网站价格
  • 河间米各庄网站建设制作网站页面模板 建设中
  • wordpress首页添加站点统计小工具住房城乡建设部门门户网站
  • 网站建设在哪块做创业园网站建设
  • 郑州搭建网站公司互联网公司网站建设的目的
  • 响应式视频网站什么是权重高的网站
  • 做教育网站挣钱我的网站域名是什么
  • django 网站开发实例哪里可以检测胎儿性别
  • 刷排名凡搜网站宝微信5000人接推广费用
  • 网站优化外包服务专业网站建设服务商
  • 江西企业网站建设费用wordpress正在执行例行维护_请一分钟后回来.
  • 苏宁推客如何做网站创建一个网站的步骤
  • 优化网站广告优化东莞美食网站建设报价
  • 单页网站的营销定制应用软件有哪些
  • 如何建立一个网站详细步骤品牌建设可以从哪方面入手
  • 杨浦做网站福州网站公司
  • 厦门网站建设工程汽车网站正在建设中模板
  • 关于网站规划建设方案书怎么制作官网