当前位置: 首页 > news >正文

网站建设中要尽量使用图片重庆最好的网站建设公司

网站建设中要尽量使用图片,重庆最好的网站建设公司,购物软件有哪些,美图秀秀在线制作Meta 刚刚发布了 Llama 2 大模型。如果你和我们一样#xff0c;你一定会迫不及待地想要亲自动手并用它来构建。 推荐#xff1a;用 NSDT设计器 快速搭建可编程3D场景。 使用任何类型的 LLM 进行构建的第一步是将其托管在某处并通过 API 使用它。 然后你的开发人员可以轻松地将…Meta 刚刚发布了 Llama 2 大模型。如果你和我们一样你一定会迫不及待地想要亲自动手并用它来构建。 推荐用 NSDT设计器 快速搭建可编程3D场景。 使用任何类型的 LLM 进行构建的第一步是将其托管在某处并通过 API 使用它。 然后你的开发人员可以轻松地将其集成到你的应用程序中。本指南将介绍如何在Amazon SageMaker 上托管 Llama 2 模型以及如何利用 AWS Lambda 和 AWS API Gateway 通过 API 使用模型。 在开始之前请前往amazon aws 登录或注册帐户。新帐户将自动获得免费套餐访问权限这确实提供了一些 Sagemaker 积分但请留意它们因为根据你的服务器选择账单可能会高得离谱。 1、为什么使用Llama2 当我可以使用 Open AI API 时为什么要使用 llama 2 3个原因 安全性——让敏感数据远离第三方供应商可靠性——确保您的应用程序有正常运行时间一致性——每次提出问题都会得到相同的结果 2、托管Llama2模型 进入 AWS 仪表板后在搜索栏中搜索 AWS Sagemaker然后单击它以转到 AWS Sagemaker AWS Sagemaker 是 AWS 用于部署和托管机器学习模型的解决方案。 2.1 在 AWS Sagemaker 上设置域 单击左侧边栏上的域 单击“创建域” 确保选中“快速设置”框 使用你选择的域填写下面的表格并填写其余选项如屏幕截图中所示。 如果你对此不熟悉请在执行角色类别中选择创建新角色。 否则请选择之前可能创建过的角色。 单击表单上的“提交”以创建你的域 域创建完成后你将看到此屏幕 记下在此处看到的用户名因为下一步部署我们的模型需要它 如果你的域创建时出现错误可能是由于用户权限或 VPC 配置造成的。 2.2 启动 Sagemaker Studio 会话 域创建完成后单击左侧边栏中的 Studio 链接 选择你之前创建的域和用户配置文件然后单击“Open Studio” 这将带你进入 Jupyter 实验室工作室会话如下所示 2.3 选择 Llama-2–7b-chat 模型 我们将部署 llama 2 模型的聊天优化版和 7b版本。 有一个更强大的 70b 型号它更加稳定出于演示目的它的成本太高所以我们将使用较小的型号 单击 SageMaker Jumpstart 选项卡下左侧栏中的模型、笔记本、解决方案 在搜索栏中搜索 Llama 2 模型。 我们正在寻找 7b 聊天模型。 点击模型 如果没有看到此模型那么可能需要关闭并重新启动工作室会话 这将带你进入模型页面。 你可以更改最适合你的用例的部署设置但我们将继续使用默认的 Sagemaker 设置并按原样部署模型 70B 版本需要强大的服务器因此如果你的帐户无权访问它你的部署可能会出错。 在这种情况下请向 AWS 服务配额提交请求。 等待 5-10 分钟以完成部署并确认屏幕显示 记下模型的端点名称因为你需要它来通过 API 使用模型。 至此你现在已经完成了托管模型的第一部分。 2、通过 API 使用Llama 2模型 首先进入AWS Lambda创建Lambda函数lambda 函数将用于调用 LLM 模型的端点。 在AWS控制台搜索栏中搜索Lambda服务然后单击Lambda服务 单击“Create Function” 输入正确的函数名称无论什么选择Python 3.10作为运行时和x86_64架构。 然后点击创建函数 3.1 指定模型的端点 输入前面最后一步中的 LLM 模型的端点名称作为环境变量 单击新创建的模型中的“配置”选项卡 单击环境变量然后单击编辑 单击下一个屏幕上的“Add environment variable” 输入 ENDPOINT_NAME 作为键输入模型的端点名称作为值。 单击“保存” 你可以为想要的键添加任何内容但它需要与我们在代码中编写的内容相匹配以便稍后调用该函数 3.2 编写调用 Llama 模型的代码 返回“代码”选项卡然后复制并粘贴以下代码 import os import io import boto3 import json# grab environment variables ENDPOINT_NAME os.environ[ENDPOINT_NAME] runtime boto3.client(runtime.sagemaker)def lambda_handler(event, context):response runtime.invoke_endpoint(EndpointNameENDPOINT_NAME,ContentTypeapplication/json,Bodyevent[body],CustomAttributesaccept_eulatrue)result json.loads(response[Body].read().decode())return {statusCode: 200,body: json.dumps(result)}代码插入成功后点击Deploy进行部署 4、将Lambda 函数接入 AWS API Gateway 转到 Lambda 函数的主屏幕并单击添加触发器 在“添加触发器”对话框中选择“API 网关”菜单项 填写 API Gateway 对话框如下所示然后单击“添加” 成功创建 API 端点后你可以在“配置”选项卡和“触发器”侧栏下查看 API URL 5、测试Llama2 API 使用以下 JSON 正文向你的 API URL 发出 POST 或 GET 请求 {inputs: [[{role: system, content: You are chat bot who writes songs},{role: user, content: Write a rap about Barbie}]],parameters: {max_new_tokens:256, top_p:0.9, temperature:0.6} }input 键存储一个数组每个元素是你和聊天机器人之间的 1 次对话。 对话由嵌套的 JSON 对象表示其中包含表示对话中“人”的角色和作为提示的内容 检查API 的响应状态码和响应JSON。 状态代码应为 200响应 JSON 将如下所示 [{generation: {role: assistant, content: Yo, listen up, I got a story to tell Bout a doll thats fly, and shes doin well Barbie, Barbie, shes the queen of the scene From Malibu to Kenya, shes always lookin supreme Shes got the style, shes got the grace Shes got the swag, shes got the pace Shes got the cars, shes got the cash Shes livin large, shes got the flash Shes got the perfect body, shes got the perfect face Shes got the perfect hair, shes got the perfect pace Shes got the perfect life, shes got the perfect vibe Shes got it all, shes got the perfect ride Shes got Ken by her side, hes her main man Hes got the skills, hes got the plan Theyre livin large, theyre got the fame Theyre the perfect couple, theyre got the game So listen up,}}]可以使用以下Python代码来测试API。 将 api_url 的值替换为您在上一步 4 中创建的 API Url import requestsapi_url https://spip03jtgd.execute-api.us-east-1.amazonaws.com/default/call-bloom-llmjson_body {inputs: [[{role: system, content: You are chat bot who writes songs},{role: user, content: Write a rap about Barbie}]],parameters: {max_new_tokens:256, top_p:0.9, temperature:0.6} }r requests.post(api_url, jsonjson_body)print(r.json())6、可能的错误 在这种情况下你可能会收到一些错误 权限如果你的角色没有使用 Sagemaker 调用端点策略的权限那么你将无法调用端点。超时根据你的提示和变量可能会收到超时错误。 与权限不同这是一个简单的修复。 单击“配置”、“常规”和“编辑超时”然后将超时值设置为更多秒数 原文链接Llama2云端部署及调用 — BimAnt
http://www.pierceye.com/news/492752/

相关文章:

  • 中信建设有限责任公司洪波seo外链工具
  • 网站服务器和空间有什么区别网站制作的公司哪家效果好
  • 做网站具体收费梅州南站
  • 淘宝禁止了网站建设类wordpress极速优化
  • 山东app网站制作网站建设优化广告流量
  • 做阿里云网站浏览器编程语言
  • 青岛市网站制作企业邮箱密码忘了怎么重置密码
  • 文交所网站开发和业务多一样的平台
  • 如何免费自己做网站wordpress成品图
  • thinkphp做中英文网站电子商务网站建设的步骤一般为
  • 网站编程 mysql小说关键词搜索器
  • 农业网站开发企业名录搜索软件免费
  • 临沂医院手机网站建设上饶专业做网站建设
  • 超酷html5效果的工作室网站程序宝洁网站建设
  • 网销的网站建设与管理曲阜市网站建设
  • 类似一起做网站的网站珠海网站建设王道下拉強
  • wordpress 当前文章id益阳网站seo
  • 湖南对外建设集团网站成都著名网站
  • 手机网站制作的公司wordpress分类目录添加图片
  • 做彩票网站需要多少钱网络营销和传统营销的关系
  • 教育咨询网站模板谷歌外贸网站seo怎么做
  • 怎么制作网站主题郑州推出vip服务
  • 在国外做盗版电影网站吗安卓网站建站系统
  • 网站备案是在哪个部门织梦cms 获得网站流量次数
  • 公司网站放哪些内容ui培训班教程
  • 电子商务网站设计目的及要求百通互联网站建设
  • 网站做端口是什么问题微信最新版本官方版下载安装
  • 活字格能开发企业网站吗本地做网站
  • 建立一个小型网站多少钱微信公众号移动网站开发
  • 网站建设设计师招募建设方案模板范文