当前位置: 首页 > news >正文

建设高流量网站温江建网站

建设高流量网站,温江建网站,大安市网站,什么是权重高的网站LanceDB 建立在 Lance#xff08;一种开源列式数据格式#xff09;之上#xff0c;具有一些有趣的功能#xff0c;使其对 AI/ML 具有吸引力。例如#xff0c;LanceDB 支持显式和隐式矢量化#xff0c;能够处理各种数据类型。LanceDB 与 PyTorch 和 TensorFlow 等领先的 M… LanceDB 建立在 Lance一种开源列式数据格式之上具有一些有趣的功能使其对 AI/ML 具有吸引力。例如LanceDB 支持显式和隐式矢量化能够处理各种数据类型。LanceDB 与 PyTorch 和 TensorFlow 等领先的 ML 框架集成。Cooler 仍然是 LanceDB 的快速邻居搜索它能够使用近似最近邻算法有效地检索相似的向量。所有这些结合在一起创建了一个快速、易于使用且轻量级的矢量数据库可以部署在任何地方。 LanceDB 能够查询兼容 S3 对象存储中的数据。这种组合非常适合构建高性能、可扩展和云原生的 ML 数据存储和检索系统。MinIO 为不同的硬件、位置和云环境带来了性能和无与伦比的灵活性使其成为此类部署的自然选择。 完成本教程后您将准备好使用 LanceDB 和 MinIO 来应对任何数据挑战。 什么是Lance? Lance 文件格式是一种针对 ML 工作流和数据集优化的列式数据格式。它旨在轻松快速地进行版本控制、查询和用于训练适用于各种数据类型包括图像、视频、3D 点云、音频和表格数据。此外它还支持高性能随机访问Lance 报告基准测试的速度比 Parquet 快 100 倍。Lance 的速度在一定程度上是在 Rust 中实现的结果以及它的云原生设计其中包括零拷贝版本控制和优化的矢量操作等功能。 它的主要功能之一是能够执行向量搜索允许用户在 1 毫秒内找到最近的邻域并将 OLAP 查询与向量搜索相结合。lance 格式的其他生产应用包括用于 ML 应用的边缘部署低延迟向量数据库自动驾驶汽车公司中多模态数据的大规模存储、检索和处理以及电子商务公司中亿级 向量个性化搜索。Lance 文件格式的部分吸引力在于它与流行的工具和平台兼容例如 Pandas、DuckDB、Polars 和 Pyarrow。即使您不使用 LanceDB您仍然可以在数据堆栈中使用 Lance 文件格式。 专为 AI 和机器学习而构建 像 LanceDB 这样的矢量数据库为 AI 和机器学习应用提供了明显的优势这要归功于它们高效的解耦存储和计算架构以及对数据的高维矢量表示的检索。以下是一些关键用例 自然语言处理NLP 语义搜索根据含义查找类似于查询的文档或段落而不仅仅是关键字。这为聊天机器人响应、个性化内容推荐和知识检索系统提供支持。 问答通过根据语义相似性查找相关文本段落来理解和回答复杂的问题。 主题建模发现大型文本集合中的潜在主题这对于文档聚类和趋势分析很有用。 计算机视觉 目标检测和分类通过高效检索相似的训练数据提高目标检测和分类模型的准确性。 视频推荐根据之前观看过的视频的视觉内容推荐类似视频 视频推荐根据之前观看过的视频的视觉内容推荐类似视频 将 MinIO 与 LanceDB 结合使用有几个好处包括 可扩展性和性能MinIO 的云原生设计专为扩展和高性能存储和检索而构建。通过利用 MinIO 的可扩展性和性能LanceDB 可以有效地处理大量数据使其非常适合现代 ML 工作负载。 高可用和容错MinIO具有高可用、不可变、高持久性等特点。这确保了存储在 MinIO 中的数据免受硬件故障的影响并提供高可用性和容错能力这对于像 LanceDB 这样的数据密集型应用程序至关重要。 主动-主动复制多站点、主动-主动复制支持在多个 MinIO 部署之间近乎同步地复制数据。这种强大的工艺确保了高耐用性和冗余性使其成为在关键任务生产环境中屏蔽数据的理想选择。 MinIO 和 LanceDB 的结合为管理和分析大规模 ML 数据集提供了高性能、可扩展的云原生解决方案。 要求 要按照本教程进行操作您需要使用 Docker Compose。您可以单独安装 Docker 引擎和 Docker Compose 二进制文件也可以使用 Docker Desktop 一起安装。最简单的选择是安装 Docker Desktop。 通过运行以下命令确保安装了 Docker Compose docker compose version 您还需要安装 Python。你可以从这里下载 Python。在安装过程中请确保选中将 Python 添加到系统的 PATH 的选项。 或者您可以选择创建虚拟环境。最好创建虚拟环境来隔离依赖项。为此请打开终端并运行 python -m venv venv 要激活虚拟环境请执行以下操作 On Windows: 在 Windows 上 .\venv\Scripts\activate On macOS/Linux: 在 macOS/Linux 上 source venv/bin/activate开始 首先从这里克隆项目。完成后导航到终端窗口中下载文件的文件夹并运行 docker-compose up minio 这将启动 MinIO 容器。您可以导航到“http://172.20.0.2:9001”以查看 MinIO 控制台。 使用用户名和密码 minioadmin:minioadmin 登录。 接下来运行以下命令以创建名为 lance 的 MinIO 存储桶。 docker compose up mc此命令在 shell 中执行一系列 MinIO 客户端 mc 命令。 以下是每个命令的细分 until (/usr/bin/mc config host add minio http://minio:9000 minioadmin minioadmin) do echo ‘…waiting…’ sleep 1; done;: 此命令反复尝试配置使用指定参数端点、访问密钥和密钥命名 minio 的 MinIO 主机直到成功。在每次尝试期间它都会回显等待消息并暂停 1 秒钟。 /usr/bin/mc rm -r --force minio/lance; 此命令强制移除删除MinIO lance 中存储桶中的所有内容。 /usr/bin/mc mb minio/lance; 此命令创建一个在 MinIO 中命名 lance 的新存储桶。 /usr/bin/mc policy set public minio/lance; 此命令将 lance 存储桶的策略设置为 public允许 public 读取访问。 exit 0; 此命令确保脚本退出状态代码为 0表示执行成功。 LanceDB 不幸的是LanceDB 没有原生 S3 支持因此您将不得不使用类似 boto3 的东西来连接到您制作的 MinIO 容器。随着 LanceDB 的成熟我们期待原生 S3 支持这将使用户体验更好。 下面的示例脚本将帮助你入门。 使用 pip 安装所需的包。使用以下内容创建名为 requirements.txt 的文件 lancedb~0.4.1 boto3~1.34.9 botocore~1.34.9然后运行以下命令以安装软件包 pip install -r requirements.txt 如果创建 MinIO 容器的方法与上述方法不同则需要更改凭据。 将以下脚本保存到文件中例如 lancedb_script.py . import lancedb import os import boto3 import botocore import randomdef generate_random_data(num_records):data []for _ in range(num_records):record {vector: [random.uniform(0, 10), random.uniform(0, 10)],item: fitem_{random.randint(1, 100)},price: round(random.uniform(5, 100), 2)}data.append(record)return datadef main():# Set credentials and region as environment variablesos.environ[AWS_ACCESS_KEY_ID] minioadminos.environ[AWS_SECRET_ACCESS_KEY] minioadminos.environ[AWS_ENDPOINT] http://localhost:9000os.environ[AWS_DEFAULT_REGION] us-east-1minio_bucket_name lance# Create a boto3 session with path-style accesssession boto3.Session()s3_client session.client(s3, configbotocore.config.Config(s3{addressing_style: path}))# Connect to LanceDB using path-style URI and s3_clientdb_uri fs3://{minio_bucket_name}/db lancedb.connect(db_uri)# Create a table with more interesting datatable db.create_table(mytable, datagenerate_random_data(100))# Open the table and perform a searchresult table.search([5, 5]).limit(5).to_pandas()print(result)if __name__ __main__:main() 此脚本将从随机生成的数据创建一个 Lance 表并将其添加到您的 MinIO 存储桶中。同样如果您不使用上一节中的方法创建存储桶则需要在运行脚本之前执行此操作。请记住更改上面的示例脚本以匹配您对 MinIO 存储桶的名称。 最后脚本打开表而不将其移出 MinIO并使用 Pandas 进行搜索并打印结果。 脚本的结果应类似于下面的结果。请记住数据本身每次都是随机生成的。 vector item price _distance 0 [5.1022754, 5.1069164] item_95 50.94 0.021891 1 [4.209107, 5.2760105] item_100 69.34 0.701694 2 [5.23562, 4.102992] item_96 99.86 0.860140 3 [5.7922664, 5.867489] item_47 56.25 1.380223 4 [4.458882, 3.934825] item_93 9.90 1.427407自行扩展 本教程中提供了许多在此基础上进行构建的方法以创建高性能、可扩展且面向未来的 ML/AI 架构。您的武器库中有两个尖端的开源构建块 - MinIO 对象存储和 LanceDB 矢量数据库 - 将其视为 ML/AI 锦标赛的获胜门票。 不要止步于此。LanceDB 提供了广泛的方法和教程来扩展您在本教程中构建的内容包括最近宣布的关于使用矢量数据库构建生成式 AI 解决方案的 Udacity 课程。特别令人感兴趣的是这个与您的文档聊天的秘诀。我们都致力于打破障碍从您的数据中获得最大收益。
http://www.pierceye.com/news/895994/

相关文章:

  • 个人网站是商业的吗北京网站建设设计
  • 手机网站收费怎么停止网站
  • 网站建设 金疙瘩计划杭州小程序制作公司排行榜
  • 德泰诺网站建设软件著作权登记证书
  • 商标设计网页seo外包公司兴田德润官方地址
  • 网站开发人员岗位成功营销案例分享
  • 赤峰做网站的公司湘潭哪里做网站
  • 免费自助建站郑州官网seo费用
  • 称心的常州网站建设wordpress怎么用两个主题
  • 建设银行北京分行网站做视频网站用什么服务器配置
  • 网站备案流程实名认证医疗网站建设资讯
  • 一个做问卷调查的网站好wordpress七比2
  • 西双版纳网站制作公司临沂企业网站建站模板
  • 培训做网站国内适合个人做外贸的网站有哪些
  • 我想卖自己做的鞋子 上哪个网站好中信银行网站怎么做的怎么烂
  • 在线网站建设工程标准godaddy 上传网站
  • 营销型网站方案ppt模板手机建站平台微点
  • 网站信息备案管理系统电商网页精品欣赏网站
  • 推广公司让实名认证怎么办系统优化设置
  • 公司网站 正式上线如何创建一个软件
  • app备案查询网站上海缪斯设计公司地址
  • 旅游小网站怎样做精不做全组建网站 多少钱
  • 天津城乡住房建设厅网站网站建设观点
  • 电子商务网站建设的认识tk网站免费
  • html网页设计网站开发报告企业做的网站费入什么科目
  • 网站建设辶金手指排名十三郑州经济技术开发区教师招聘公告
  • 企业网站建设课程体会西安网站制作定制
  • 网站主题服务公司管理软件免费版
  • 网站建设主要职责六安网站建设
  • wordpress电影站主题一般做兼职在哪个网站