当前位置：首页 > news >正文

网站网站环境搭建教程优化算法网站

news 2025/12/21 0:36:58

网站网站环境搭建教程,优化算法网站,广联达工程造价软件,怎样做网站营销最近按照官方例子#xff0c;把Llama2跑起来了测试通了#xff0c;但是想封装成api服务#xff0c;耗费了一些些力气参考#xff1a;https://github.com/facebookresearch/llama/pull/147/files 1. 准备的前提如下按照官方如下命令#xff0c;可以运行成功 torchrun -…最近按照官方例子把Llama2跑起来了测试通了但是想封装成api服务耗费了一些些力气参考https://github.com/facebookresearch/llama/pull/147/files 1. 准备的前提如下按照官方如下命令可以运行成功 torchrun --nproc_per_node 1 example_chat_completion.py \--ckpt_dir llama-2-7b-chat/ \--tokenizer_path tokenizer.model \--max_seq_len 512 --max_batch_size 6使用的模型是llama-2-7b-chat 2. 第一步增加依赖包 fastapi uvicorn3. 第二步增加文件server.py在llama仓库的根目录下 from typing import Tuple import os import sys import argparse import torch import time import jsonfrom pathlib import Path from typing import Listfrom pydantic import BaseModel from fastapi import FastAPI import uvicorn import torch.distributed as distfrom fairscale.nn.model_parallel.initialize import initialize_model_parallelfrom llama import ModelArgs, Transformer, Tokenizer, Llamaparser argparse.ArgumentParser() parser.add_argument(--ckpt_dir, typestr, defaultllama-2-7b-chat) parser.add_argument(--tokenizer_path, typestr, defaulttokenizer.model) parser.add_argument(--max_seq_len, typeint, default512) parser.add_argument(--max_batch_size, typeint, default6)os.environ[MASTER_ADDR] localhost os.environ[MASTER_PORT] 12345 os.environ[WORLD_SIZE] 1app FastAPI()def setup_model_parallel() - Tuple[int, int]:local_rank int(os.environ.get(LOCAL_RANK, 0))world_size int(os.environ.get(WORLD_SIZE, 1))print(world_size, world_size)print(loal_rank, local_rank)dist.init_process_group(backendnccl, init_methodenv://, world_sizeworld_size, ranklocal_rank)initialize_model_parallel(world_size)torch.cuda.set_device(local_rank)# seed must be the same in all processestorch.manual_seed(1)return local_rank, world_sizedef load(ckpt_dir: str,tokenizer_path: str,local_rank: int,world_size: int,max_seq_len: int,max_batch_size: int, ) - Llama:generator Llama.build(ckpt_dirckpt_dir,tokenizer_pathtokenizer_path,max_seq_lenmax_seq_len,max_batch_sizemax_batch_size,model_parallel_size1)return generatordef init_generator(ckpt_dir: str,tokenizer_path: str,max_seq_len: int 512,max_batch_size: int 8, ):local_rank, world_size setup_model_parallel()if local_rank 0:sys.stdout open(os.devnull, w)generator load(ckpt_dir, tokenizer_path, local_rank, world_size, max_seq_len, max_batch_size)return generatorif __name__ __main__:args parser.parse_args()generator init_generator(args.ckpt_dir,args.tokenizer_path,args.max_seq_len,args.max_batch_size,)class Config(BaseModel):prompts: List[str]system_bg: List[str]max_gen_len: int 510temperature: float 0.6top_p: float 0.9if dist.get_rank() 0:app.post(/llama/)def generate(config: Config):dialogs: List[Dialog] [[{role: system,content: config.system_bg[0],},{role: user,content: config.prompts[0],}],]results generator.chat_completion(dialogs, # type: ignoremax_gen_lenconfig.max_gen_len,temperatureconfig.temperature,top_pconfig.top_p,)return {responses: results}uvicorn.run(app, host0.0.0.0, port8042)else:while True:config [None] * 4try:dist.broadcast_object_list(config)generator.generate(config[0], max_gen_lenconfig[1], temperatureconfig[2], top_pconfig[3])except:pass4. 运行测试直接运行python sever.py即可运行成功提供了一个post接口具体信息为 URLhttp://localhost:8042/llamaBody {prompts:[你好你是谁],system_bg:[你需要用中文回答问题] }其中prompts为输入内容system_bg为给提前设定的背景5. 做一个互动的网页想做一个类似OpenAI那样子的对话框继续添加依赖 streamlit添加如下文件chatbot.py import streamlit as st import requests import jsonst.title(llama-2-7b-chat Bot)# Initialize chat history if messages not in st.session_state:st.session_state.messages []# Display chat messages from history on app rerun for message in st.session_state.messages:with st.chat_message(message[role]):st.markdown(message[content])# React to user input if prompt : st.chat_input(What is up?):# Display user message in chat message containerst.chat_message(user).markdown(prompt)# Add user message to chat historyst.session_state.messages.append({role: user, content: prompt})url http://localhost:8042/llamad {prompts: [prompt], system_bg: []}print(d)r_resp_txt requests.post(url, datajson.dumps(d))r_resp_dict json.loads(r_resp_txt.text)response r_resp_dict[responses][0][generation][content]# Display assistant response in chat message containerwith st.chat_message(assistant):st.markdown(response)# Add assistant response to chat historyst.session_state.messages.append({role: assistant, content: response}) 运行streamlit run chatbot.py即可有如下效果

查看全文

http://www.pierceye.com/news/328600/