当前位置: 首页 > news >正文

如何做优化网站排名超简洁WordPress

如何做优化网站排名,超简洁WordPress,国家免费技能培训官网,软件工程考研学校排名2023年的大型语言模型领域经历了许多快速的发展和创新#xff0c;发展出了更大的模型规模并且获得了更好的性能#xff0c;那么我们普通用户是否可以定制我们需要的大型语言模型呢#xff1f; 首先你需要有硬件的资源#xff0c;对于硬件来说有2个路径可以选。高性能和低性…2023年的大型语言模型领域经历了许多快速的发展和创新发展出了更大的模型规模并且获得了更好的性能那么我们普通用户是否可以定制我们需要的大型语言模型呢 首先你需要有硬件的资源对于硬件来说有2个路径可以选。高性能和低性能这里的区别就是是功率因为精度和消息长度直接与参数计数和GPU功率成比例。 定制语言模型的目标应该是在功能和成本之间取得平衡。只有知道自己的需求和环境才能够选择响应的方案。因为无论你计划如何训练、定制或使用语言模型都是要花钱的。你能做的唯一免费的事情就是使用一个开源的语言模型。 GPU 无论是租用的云GPU还是在购买的GPU都无关紧要。因为我们使用的库和代码是通用的这里关键的区别在于价格。 高性能模型 我们这里定义的高性能模型的参数至少有25B 如果想要好一些的模型40B才可以如上图所示。 但是模型参数大意味着需要更多的预算下面我们看看如果需要使用这个模型需要什么样的GPU。48GB VRAM每月600美元如果希望使用远程服务器创建自己的高性能LLM那么这将是最低的成本。 如果我们要购买这个GPU则需要大概5000美元 所以如果你想选择高性能的模型这个是最低的预算了下面我们看看如果我们不太看重性能或者只想进行学习我们应该怎么选择。 低性能模型 我们可以以更便宜的价格使用性能较低的模型。但是要记住任何低于7B的参数都可以不考虑因为目前来看0.5B到4B参数对于测试、开发模型和微调来说是很好的但对于实际使用来说效果很差所以建议最少使用7B参数。 对于较低的7B模型我认为你至少需要12GB的VRAM。理想情况下最好有大约20GB的VRAM。 这种GPU我们就可以直接购买了因为如果使用云GPU的话就不太值。 让我们看看价格: 最便宜的12GB的3060不到美元。在家里做个开发或者玩玩你游戏都可以不过我还是建议16G以上的GPU这样用起来更方便一些。 比如这个4060ti450美元我这里就把它当作入门的最低配置了 训练 有了GPU下一步就是训练了一般情况下transformers 都为我们准备好了我们只需要准备好数据集即可。 首先加载模型 HuggingFace的transformers 库已经将方法全部封装好了我们只要按照文档调用即可。如果你想深入学习可以在使用transformer库一段时间后切换到纯PyTorch或开始更详细地了解如何训练模型。 然后我们需要定义数据集创建一个 Dataset类来加载您的训练数据和验证数据。这里是一个简单的示例 classTextDataset(Dataset):def__init__(self, tokenizer, data_file, block_size128):self.examples []withopen(data_file, r, encodingutf-8) asf:linesf.readlines()forlineinlines:lineline.strip()tokenized_texttokenizer.convert_tokens_to_ids(tokenizer.tokenize(line))foriinrange(0, len(tokenized_text) -block_size1, block_size):self.examples.append(tokenizer.build_inputs_with_special_tokens(tokenized_text[i:iblock_size]))def__len__(self):returnlen(self.examples)def__getitem__(self, idx):returntorch.tensor(self.examples[idx], dtypetorch.long)这里根据不同的目标可能有所不同 然后就是数据加载 train_data_filepath_to_train_data.txteval_data_filepath_to_eval_data.txttrain_datasetTextDataset(tokenizer, train_data_file)eval_datasetTextDataset(tokenizer, eval_data_file)train_loaderDataLoader(train_dataset, batch_size4, shuffleTrue)eval_loaderDataLoader(eval_dataset, batch_size4, shuffleFalse)定义训练参数 training_argsTrainingArguments(output_dir./results, # 训练结果的输出目录num_train_epochs3,per_device_train_batch_size4,per_device_eval_batch_size4,logging_dir./logs,logging_steps500,save_steps1000,evaluation_strategysteps,eval_steps500,warmup_steps500,weight_decay0.01,logging_first_stepTrue,load_best_model_at_endTrue,metric_for_best_modelloss,)定义训练器和开始训练 trainerTrainer(modelmodel,argstraining_args,data_collatorlambdadata: torch.tensor(data).long(),train_datasettrain_dataset,eval_dataseteval_dataset,)trainer.train()保存微调后的模型 model.save_pretrained(path_to_save_model)这样我们就根据自己的数据训练出了一个定制的模型 使用 我们要使用或者看看我们的模型效果怎么样这时就可以使用Ollama 和Open Web UI了 我们可以通过Ollama加载自定义模型模型交付给Open Web UI看起来像这样: 也就是说我们把Ollama当作后端Open Web UI作为前端创建了一个类似chatgpt的聊天机器人。 总结 虽然深度学习的感念抽象的并且数学的原理学习起来非常的复杂但是已经有现成的库、方法和框架将这些概念汇总和抽象出来我们只要会一些python的开发就可以直接拿来使用。 如果你想深入的学习也可以从最顶层最抽象的部分开始然后往下一步一步进行学习这样就不会因为底层的概念太过复杂而放弃。 当然最后所有的基础是你需要有一块能够工作的GPU。 https://avoid.overfit.cn/post/ebd03e3eb42942a8b13e246a82a3d079 作者Jesse Nerio
http://www.pierceye.com/news/444206/

相关文章:

  • 深圳三玉网站建设wordpress 左侧边栏
  • 保健食品东莞网站建设wordpress左边菜单
  • 江苏营销型网站建设公司good建筑网站
  • 免费申请网站永久域名如何写网站建设方案书
  • 艺术字logo生成器北京seo专业团队
  • 原创网站模版企业网站类型有哪些
  • 网站该怎么做链接百度广告联盟看广告赚钱
  • 上海网站制作全包深圳创业补贴政策2021申请流程
  • 自己怎么制作一个网站wordpress 取消赞
  • 收到短信说备案被退回但工信部网站上正常啊网络营销师是干什么的
  • 公司怎么建立网站成都创软科技的口碑
  • 帝国cms是个人网站网站建设超速云免费
  • wix做的网站wordpress显示数据库请求
  • 设计好的网站百度网站建设费用多少知乎
  • 廊坊网站制作wordpress 文章id排序
  • 湖南中小企业建站价格绍兴seo推广公司
  • 襄樊门户网站建设营销策略怎么写范文
  • 北京网站关键词优化软文广告案例500字
  • 灌云网站建设维护手机网站建站步骤论文
  • 各大网站平台发布信息山亭网站建设
  • 做网站.服务器怎么买公司网站如何上传视频
  • 广州建设工程造价信息网长春百度网站优化
  • 郑州外贸网站建设公司价格wordpress禁止百度抓取
  • 临沂建站程序衡阳网站建设ss0734
  • 开发软件下载网站备案号放网站下面居中
  • 开封网站网站建设有哪些好的模板网站
  • 专业做蛋糕视频网站网站目录怎么做301跳转
  • 白城网站建设网络营销顾问培训
  • 沈阳网站开发培训多少钱百度收录批量提交入口
  • php做的网站怎么入侵wordpress插件安装教程