当前位置: 首页 > news >正文

网站建设优化保定成都seo培训学校

网站建设优化保定,成都seo培训学校,南宁市优化网站,企业为什么要建设自己的网站前言 Whisper 是由 OpenAI 开发的一种先进语音识别系统。它采用深度学习技术#xff0c;能够高效、准确地将语音转换为文本。Whisper 支持多种语言和口音#xff0c;并且在处理背景噪音和语音变异方面表现出色。其广泛应用于语音助手、翻译服务、字幕生成等领域#xff0c;为…前言 Whisper 是由 OpenAI 开发的一种先进语音识别系统。它采用深度学习技术能够高效、准确地将语音转换为文本。Whisper 支持多种语言和口音并且在处理背景噪音和语音变异方面表现出色。其广泛应用于语音助手、翻译服务、字幕生成等领域为用户提供了更流畅的语音交互体验。作为一个开源项目Whisper 鼓励开发者和研究人员进一步优化和创新。 作者将解码过程整理成 简单的python代码进行讲解 核心思想 whisper解码核心是 基于自回归解码的token游戏 换句话说他的参数读取是通过传入token id的形式即采用大语言模型的prompt范式whisper的解码器一定程度上也是个大语言模型虽然语音训练样本token数远不及纯文本token数 图中除了识别结果的框框大多数都是prompt工程, 常用的token id 如图 自回归解码 详细解释放在代码中啦 def main():解码器须构建Deocder的prompt序列为【SOT语种任务】, 本文中是 model.sot_sequence其中SOT50258语种50332,50309,50333,50335,50273...任务transcribe 转写 50359 translate 翻译 50358加载whisper模型encoder_onnx_file ./small-encoder.int8.onnxdecoder_onnx_file ./small-decoder.int8.onnxtokenizer_file ./small-tokens.txtmodel OnnxModel(encoder_onnx_file, decoder_onnx_file)token_table load_tokenizer(tokenizer_file) # token id to char 提取MEL特征wav_file output.wavmel compute_features(wav_file)计算encoder的K/V编码 # 交叉注意力 encoder:K/V, with decoder:Qn_layer_cross_k, n_layer_cross_v model.run_encoder(mel)# 自注意力 decoder:K/V, with decoder:Qn_layer_self_k_cache, n_layer_self_v_cache model.get_self_cache()检测语种lang model.detect_language(n_layer_cross_k, n_layer_cross_v)model.sot_sequence[1] lang任务选择# task model.translatetask model.transcribemodel.sot_sequence[2] task根据prompt进行首次解码tokens torch.tensor([model.sot_sequence], dtypetorch.int64)offset torch.zeros(1, dtypetorch.int64)logits, n_layer_self_k_cache, n_layer_self_v_cache model.run_decoder(tokenstokens,n_layer_self_k_cachen_layer_self_k_cache,n_layer_self_v_cachen_layer_self_v_cache,n_layer_cross_kn_layer_cross_k,n_layer_cross_vn_layer_cross_v,offsetoffset,)offset len(model.sot_sequence)logits logits[0, -1] # token 声学后验model.suppress_tokens(logits, is_initialTrue) # 无效token后验抑制自回归解码max_token_id logits.argmax(dim-1) # 选择后验中最大输出的token【贪心解码】results []sentence {start:0,end:0,text:b} sentences []for i in range(model.n_text_ctx):# 打印token属性if max_token_id.item() model.sot:print(iter:%8s docode token id:%8s [sot]%(i,max_token_id.item()))elif max_token_id.item() model.eot:print(iter:%8s docode token id:%8s [eot]%(i,max_token_id.item()))elif max_token_id.item() model.timestamp_begin:print(iter:%8s docode token id:%8s [boundary]%(i,max_token_id.item()))else:print(iter:%8s docode token id:%8s [char]%(i,max_token_id.item()))# eot 结束if max_token_id.item() model.eot:print(Finish !!)break# 检测到时间戳if max_token_id.item()model.timestamp_begin:timestamp ((max_token_id.item()-model.timestamp_begin)*model.time_precision)# 遇到结束符if sentence[text]:sentence[end] timestampsentence[text] sentence[text].decode().strip()print(sentence)sentences.append(sentence)sentence {start:0,end:0,text:b}# 遇到开始符else:sentence[start] timestampelse:decode_token base64.b64decode(token_table[max_token_id.item()])sentence[text] decode_tokenresults.append(max_token_id.item())tokens torch.tensor([[results[-1]]])# deocder 单步解码logits, n_layer_self_k_cache, n_layer_self_v_cache model.run_decoder(tokenstokens,n_layer_self_k_cachen_layer_self_k_cache,n_layer_self_v_cachen_layer_self_v_cache,n_layer_cross_kn_layer_cross_k,n_layer_cross_vn_layer_cross_v,offsetoffset,)offset 1logits logits[0, -1]model.suppress_tokens(logits, is_initialFalse)max_token_id logits.argmax(dim-1) # 贪心搜索没错连时间戳也是token形式~下面是运行结果感受一下。我们在边界处对句子进行保存 以上就是whisper解码的基本原理感兴趣的同学关注走一波
http://www.pierceye.com/news/468208/

相关文章:

  • 电子商务网站建设与管理试卷6平面设计接单兼职
  • 建设手机网站大概要多少钱云南建投二公司官网
  • 公司如何建设网站首页网页设计与网站开发试题答案
  • 中企动力合作网站网站app下载平台怎么做
  • 网站开发专业成功人士重庆邮电大学官网网站
  • 官方网站后台图片下载怎么做网站开发与支付宝端口连接
  • 浏览器怎么打开网站服务器下载在线音乐网站开发摘要
  • 建网站拿到广告吉林整站优化
  • 怎么建站网站清远佛冈住房和城乡建设局网站
  • 领导高度重视门户网站建设广州引流推广公司
  • 公司网站建设吧个好wordpress增加搜索
  • 温州网站推广排名哪家购物网站建设好
  • 宿迁做网站公司哪家好中国建设监理协会化工监理协会网站
  • 网站建设广州天河常州企业自助建站系统
  • 厦门网站建设u贷款在线申请
  • 做肮脏交义的网站南宁住房和城乡建设局网站
  • 办网站需要什么my23777免费域名查询
  • 销售网站开发步骤网站域名到期了怎么办
  • 怎么做注册账号的网站网页打不开视频播放不了是什么问题
  • 江阴市住房和城乡建设局网站免费网页游戏poki
  • 个人网站设计网站建设的基本特点
  • 泉州专业做网站网站被k 原因
  • 18款禁用网站app直播建设部资质网站
  • 免费完整版的网站模板商丘行业网站建设开发公司
  • 网站与微网站区别推广通
  • 京东网站建设的意义wordpress美图
  • 佛山市外贸网站建设公司营销型网站建设 兼职
  • 四川省城乡与建设厅网站中国十大it培训机构排名
  • 国家高新技术企业查询网站汕头整站优化
  • asp网站生成静态在线网站软件免费下载