当前位置: 首页 > news >正文

福州网站推广定制新加坡网站建设公司

福州网站推广定制,新加坡网站建设公司,中科建建设发展有限公司网站,为什么要学电商网站建设简介 非结构化数据 世界上大约超过百分之八十的数据都是非结构化数据#xff0c;例如#xff1a;图像、音视频、自然语言等#xff0c;这些模型不遵循预定义的模式或组织方式#xff0c;可以使用各种人工智能 (AI) 和机器学习 (ML) 模型转换为向量。 嵌入向量#xff0…简介 非结构化数据 世界上大约超过百分之八十的数据都是非结构化数据例如图像、音视频、自然语言等这些模型不遵循预定义的模式或组织方式可以使用各种人工智能 (AI) 和机器学习 (ML) 模型转换为向量。 嵌入向量Embedding vectors 嵌入向量是非结构化数据的特征抽象例如电子邮件、物联网传感器数据、Instagram 照片、蛋白质结构等等。从数学上来说嵌入向量是浮点数或二进制数的数组。现代嵌入技术用于将非结构化数据转换为嵌入向量。 向量相似度搜索 向量相似性搜索是将向量与数据库进行比较以查找与查询向量最相似的向量的过程。近似最近邻ANN - Approximate nearest neighbor搜索算法用于加速搜索过程。如果两个嵌入向量非常相似则意味着原始数据源也相似。 索引 FLAT 不经过量化扁平的索引没有分层或分组进行相似度搜索时系统会计算查询向量与所有存储向量之前的相似度。因为它需要计算查询向量与所有存储向量之间的相似度这会随着数据量的增加而变得非常昂贵大规模数据集时需要更复杂的索引结构如IVF_FLAT。 特点每个向量都是扁平的即未经过量化或者降维的处理简单高效更新效率高不涉及倒排文件等结构。 适用场景适用于较小规模百万级的数据集特别是当数据集能够完全加载到内存中时。 IVF_FLAT Inverted File with FLAT (or non-quantized) vectors即具有 flat或非量化向量的倒排文件索引对应的还有一个 GPU 版本GPU_IVF_FLAT。 特点使用了倒排文件Inverted File的结构可以高效地处理大规模数据集。同时每个向量也是扁平的即未经过额外处理的原始向量。** 适用场景适用于需要在大规模数据集中进行相似度搜索的情况在搜索精度上与FLAT没有区别但是在大规模数据集上可以先用倒排文件更快定位包含可能相似向量的倒排列表从而减少计算相似度量的开销。 IVF_SQ8 Inverted File with Scalar Quantizer of 8 bits即具有8位标量量化器的倒排文件索引。模型量化介绍 特点它在量化向量时使用了较小的位数8位可以在保持较低存储开销的同时实现相对较快的搜索速度。然而由于使用了量化可能会牺牲一些精度。 适用场景用于在有限的磁盘、CPU 和 GPU 内存资源下追求显著的资源消耗降低。这意味着在资源受限的环境中它可以带来存储和内存的显著减少。 IVF_PQ Inverted File with Product Quantization对应的还有一个 GPU 版本GPU_IVF_PQ 特点使用了一种叫做 Product Quantization 的技术这种技术可以在加快查询速度的同时对准确度进行一定的牺牲。 适用场景用于追求高查询速度会牺牲一定准确度。 HNSW Hierarchical Navigable Small World是一种基于图的索引结构适用于对搜索效率要求较高的场景。这种索引结构通过构建一个分层的可导航小世界图以支持高效的搜索操作。 相似度度量 欧氏距离Euclidean Distance 常用输入计算机图像领域的内嵌Float向量 适用于连续的数值型数据如图像处理、数值分析等领域。当各个特征的重要性相等时欧氏距离是一个常见的选择。 余弦相似度Cosine Similarity 常用输入文本领域的内嵌Float向量 余弦相似度计算两组数据之间的夹角假设它们都是从[0,0,…]开始的线它的值范围是[-1, 1]值越大相似度越高。 主要用于衡量两个向量之间的夹角而不受向量大小的影响。适用于高维稀疏数据比如文本数据 内积Inner Product 常用输入文本/图形像素领域的内嵌Float向量 内积的计算是将两个向量对应位置的元素相乘后再相加。常用于度量两个向量的相似性特别是在向量表示的语境中如自然语言处理中的词向量。两个向量的内积越大表示它们在方向上越相似而越小则表示它们在方向上差异较大。内积主要用于度量向量之间的相似度适用于密集向量。 Jaccard相似度Jaccard Similarity 常用输入文本领域的内嵌Binary向量 主要应用于集合数据如文档相似度计算、推荐系统中用户行为的相似性等。 Jaccard相似度计算的是两个集合交集与并集的比值。
http://www.pierceye.com/news/96352/

相关文章:

  • 常州做网站的公司在盐城做网站的网络公司电话
  • seo站外推广如何用wampp 做网站
  • 怎样用手机做网站中企动力百度百科
  • 哪些网站可以做任务挣钱免费app软件
  • 国内简约网站平潭县机场建设网站
  • wordpress 全站通知wordpress怎样打开速度快
  • 广州市建设职业培训学校网站移除wordpress版本
  • 如何申请一个网站 新网动画制作大师
  • 动易后台 网站统计调查 报表类型怎样使用手机相册备份网站源码
  • 做网站放到百度上需要什么查看wordpress使用什么主题
  • 深圳企业网站seo郑州汉狮专业做网站公司
  • 广东网站建设多少钱辛集专业网站建设
  • 怎样做网站公司的销售小程序推广计划怎么赚钱
  • 网站开发文档编写wordpress小说站群
  • 南宁网站开发推广网站html模板下载
  • 网络编辑的网站建设题二手域名交易平台
  • 定制网站开发商业计划书贵南县网站建设公司
  • 如何免费发布个人网站网站项目需求分析
  • 太原免费网站建设网站开发合作协议书
  • 深圳龙华做网站上海响应式网站制作公司
  • 招投标 网站建设专业型网站和个人网站
  • 网站建设需要那些基础增城线上教学
  • 专注移动网站建设免费咨询电脑维修
  • 六里桥做网站公司惠州做网站 百度优化
  • 做网站怎么选择上市公司wordpress 进销存
  • 做视频网站用哪个模板昆明贤邦网站建设
  • 自建网站工具wordpress仿内涵段子
  • 做推广最好的网站是哪个菜鸟网站建设
  • 首钢建设公司网站微信网站怎么做的好处
  • 西安网站开发费用网站即将 模板