当前位置: 首页 > news >正文

电子商务做网站实训体会wordpress商城主题woo

电子商务做网站实训体会,wordpress商城主题woo,三盛都会城网站 html5,东城手机网站制作引言 简介 编译Android可用的模型 转换权重 生成配置文件 模型编译 编译apk 修改配置文件 绑定android library 配置gradle 编译apk 手机上运行 安装 APK 植入模型 效果实测 0. 引言 清明时节雨纷纷#xff0c;路上行人欲断魂。 小伙伴们好#xff0c;我是《小… 引言 简介 编译Android可用的模型 转换权重 生成配置文件 模型编译 编译apk 修改配置文件 绑定android library 配置gradle 编译apk 手机上运行 安装 APK 植入模型 效果实测 0. 引言 清明时节雨纷纷路上行人欲断魂。 小伙伴们好我是《小窗幽记机器学习》的小编卖青团的小女孩紧接前文LLM系列。今天这篇小作文主要介绍如何将阿里巴巴的千问大模型Qwen 1.8B部署到手机端实现离线、断网条件下使用大模型。主要包括以下几个步骤 编译Android手机可以使用的Qwen模型 编译打包APK为Qwen在Android手机上运行提供用户交互界面 安装APK和效果实测 如需与小编进一步交流可以在《小窗幽记机器学习》上添加小编好友。 1. 简介 为将Qwen大模型部署到手机实现断网下Qwen模型正常使用本文选择MLC-LLM框架。 MLC LLM机器学习编译大型语言模型Machine Learning Compilation for Large Language Models 是一种高性能的通用部署解决方案将任何语言模型本地化部署在各种硬件后端和本机应用程序上并为每个人提供一个高效的框架以进一步优化自己模型性能。该项目的使命是使每个人都能够使用ML编译技术在各种设备上本机开发、优化和部署AI模型。 以下将以Qwen1.5-1.8B-Chat为例详细说明如何利用mlc-llm将该模型部署到Android手机上最终实现每秒约20个token的生成速度。以下命令执行都在mlc-llm的目类下执行。囿于篇幅将在后文以上篇名义补充介绍对应的环境安装和配置等工作。 2. 编译Android可用模型 MODEL_NAMEQwen1.5-1.8B-Chat QUANTIZATIONq4f16_12.1 权重转换 # convert weights mlc_llm convert_weight /share_model_zoo/LLM/Qwen/$MODEL_NAME/ --quantization $QUANTIZATION -o dist/$MODEL_NAME-$QUANTIZATION-MLC/通过上述命令将hf格式的Qwen模型转为mlc-llm支持的模型格式结果文件存于dist/Qwen1.5-1.8B-Chat-q4f16_1-MLC 2.2 生成配置文件 # 生成配置文件mlc_llm gen_config /share_model_zoo/LLM/Qwen/$MODEL_NAME/ --quantization $QUANTIZATION --model-type qwen2 --conv-template chatml --context-window-size 4096 -o dist/${MODEL_NAME}-${QUANTIZATION}-MLC/此时生成的配置文件dist/Qwen1.5-1.8B-Chat-q4f16_1-MLC/mlc-chat-config.json信息 {model_type: qwen2,quantization: q4f16_1,model_config: {hidden_act: silu,hidden_size: 2048,intermediate_size: 5504,num_attention_heads: 16,num_hidden_layers: 24,num_key_value_heads: 16,rms_norm_eps: 1e-06,rope_theta: 1000000.0,vocab_size: 151936,context_window_size: 4096,prefill_chunk_size: 4096,tensor_parallel_shards: 1,head_dim: 128,dtype: float32},vocab_size: 151936,context_window_size: 4096,sliding_window_size: -1,prefill_chunk_size: 4096,attention_sink_size: -1,tensor_parallel_shards: 1,mean_gen_len: 128,max_gen_len: 512,shift_fill_factor: 0.3,temperature: 0.7,presence_penalty: 0.0,frequency_penalty: 0.0,repetition_penalty: 1.1,top_p: 0.8,conv_template: {name: chatml,system_template: |im_start|system\n{system_message},system_message: A conversation between a user and an LLM-based AI assistant. The assistant gives helpful and honest answers.,add_role_after_system_message: true,roles: {user: |im_start|user,assistant: |im_start|assistant},role_templates: {user: {user_message},assistant: {assistant_message},tool: {tool_message}},messages: [],seps: [|im_end|\n],role_content_sep: \n,role_empty_sep: \n,stop_str: [|im_end|],stop_token_ids: [2],function_string: ,use_function_calling: false},pad_token_id: 151643,bos_token_id: 151643,eos_token_id: [151645,151643],tokenizer_files: [tokenizer.json,vocab.json,merges.txt,tokenizer_config.json],version: 0.1.0 }2.3 模型编译 # 进行模型编译# 2. compile: compile model library with specification in mlc-chat-config.jsonmkdir dist/libsmlc_llm compile ./dist/${MODEL_NAME}-${QUANTIZATION}-MLC/mlc-chat-config.json --device android -o ./dist/libs/${MODEL_NAME}-${QUANTIZATION}-android.tar生成dist/libs/Qwen1.5-1.8B-Chat-q4f16_1-android.tar文件。 3. 编译apk 3.1 修改配置文件 # Configure list of models vim ./android/library/src/main/assets/app-config.json将./android/library/src/main/assets/app-config.json改为 {model_list: [{model_url: https://huggingface.co/Qwen/Qwen1.5-1.8B-Chat,model_lib: qwen2_q4f16_1,estimated_vram_bytes: 4348727787,model_id: Qwen1.5-1.8B-Chat-q4f16_1  # 手机上模型目录要跟这个一致不然无法加载}],model_lib_path_for_prepare_libs: {qwen2_q4f16_1: libs/Qwen1.5-1.8B-Chat-q4f16_1-android.tar} }3.2 绑定android library 需要查看以下系统变量 echo $ANDROID_NDK   # Android NDK toolchain echo $TVM_NDK_CC   # Android NDK clang echo $JAVA_HOME    # Java export TVM_HOME/share/Repository/mlc-llm/3rdparty/tvm # mlc-llm 中的 tvm 目类 echo $TVM_HOME     # TVM Unity runtime是否符合预期。 # Bundle model library cd ./android/library ./prepare_libs.sh上述脚本会基于rustup安装aarch64-linux-android如果比较慢可以进行如下配置 export RUSTUP_DIST_SERVERhttps://mirrors.tuna.tsinghua.edu.cn/rustup export RUSTUP_UPDATE_ROOThttps://mirrors.tuna.tsinghua.edu.cn/rustup/rustup再执行上述脚本。 3.3 配置gradle 修改android/gradle/wrapper/gradle-wrapper.properties 将原始的内容 #Thu Jan 25 10:19:50 EST 2024 distributionBaseGRADLE_USER_HOME distributionPathwrapper/dists distributionUrlhttps\://services.gradle.org/distributions/gradle-8.5-bin.zip zipStoreBaseGRADLE_USER_HOME zipStorePathwrapper/dists可以看出gradle-8.5-bin.zip的路径是android/gradle/wrapper/dist/gradle-8.5-bin.zip 这里需要注意wrapper/dists的完整路径其实是/root/.gradle/wrapper/dists修改为 distributionBaseGRADLE_USER_HOME distributionPathwrapper/dists distributionUrldist/gradle-8.5-bin.zip zipStoreBaseGRADLE_USER_HOME zipStorePathwrapper/dists需要注意distributionUrl 这个的base目录其实是mlc-llm目录下的android/gradle/wrapper。 3.4 编译apk # Build android app cd ..  ./gradlew assembleDebug编译生成的Android apk 文件位于app/build/outputs/apk/debug/app-debug.apk 4. 手机实测 4.1 安装 APK 将手机设置成debug模式数据线连接手机正常连接之后在电脑执行以下命令将上面编译出的apk安装到Android手机上 adb install app-debug.apkPS: 需要预先在本机电脑上安装 adb 命令。 4.2 植入模型 # 改名从而适配之前的配置信息 mv Qwen1.5-1.8B-Chat-q4f16_1-MLC Qwen1.5-1.8B-Chat-q4f16_1# 将模型文件推送到手机的 /data/local/tmp/ 目类 adb push Qwen1.5-1.8B-Chat-q4f16_1 /data/local/tmp/adb shell mkdir -p /storage/emulated/0/Android/data/ai.mlc.mlcchat/files/adb shell mv /data/local/tmp/Qwen1.5-1.8B-Chat-q4f16_1 /storage/emulated/0/Android/data/ai.mlc.mlcchat/files/4.3 聊天实测 实测大约1s可以生成20个token。
http://www.pierceye.com/news/97068/

相关文章:

  • 塘厦做网站定制和订制有什么区别
  • 昆明网站空间好习惯网站
  • 做导航网站赚钱吗建立网站需要多少钱费用
  • 大同网站建设哪家好网站后台登录模板html
  • 网站建设过程中准备的工作手机制作网站
  • 做专业网站设计多少钱代理小企业网站建设
  • 怎样提升网站关键词免费的html模版下载
  • 栖霞网站定制三合一建站网站
  • 免费建立一个个人网站设计官网登录入口
  • 门户网站模板之家北京网上服务平台
  • 合肥网站优化方案东莞做网站那家好
  • 个人备案网站可以做论坛吗山东住房建设厅官网站首页
  • 寺院网站模板网站策划制作公司 北京
  • 昆山教育云平台网站建设宁晋县建设局网站
  • 廊坊网站公司dw做网站背景音乐
  • 阜南做网站搜索引擎优化seo多少钱
  • 贵州建设厅网站怎样查询电工证天津网站备案
  • 常州做网站的公司在盐城做网站的网络公司电话
  • seo站外推广如何用wampp 做网站
  • 怎样用手机做网站中企动力百度百科
  • 哪些网站可以做任务挣钱免费app软件
  • 国内简约网站平潭县机场建设网站
  • wordpress 全站通知wordpress怎样打开速度快
  • 广州市建设职业培训学校网站移除wordpress版本
  • 如何申请一个网站 新网动画制作大师
  • 动易后台 网站统计调查 报表类型怎样使用手机相册备份网站源码
  • 做网站放到百度上需要什么查看wordpress使用什么主题
  • 深圳企业网站seo郑州汉狮专业做网站公司
  • 广东网站建设多少钱辛集专业网站建设
  • 怎样做网站公司的销售小程序推广计划怎么赚钱