当前位置: 首页 > news >正文

江阳建设集团网站浙江东阳市网站建设公司

江阳建设集团网站,浙江东阳市网站建设公司,浙江诚峰建设工程有限公司网站,南宁网站建设免费推广语音识别教程#xff1a;Whisper 一、前言 最近看国外教学视频的需求#xff0c;有些不是很适应#xff0c;找了找AI字幕效果也不是很好#xff0c;遂打算基于Whisper和GPT做一个AI字幕给自己。 二、具体步骤 1、安装FFmpeg Windows: 进入 https://github.com/BtbN/FF…语音识别教程Whisper 一、前言 最近看国外教学视频的需求有些不是很适应找了找AI字幕效果也不是很好遂打算基于Whisper和GPT做一个AI字幕给自己。 二、具体步骤 1、安装FFmpeg Windows: 进入 https://github.com/BtbN/FFmpeg-Builds/releases点击 windows版本的FFMPEG对应的图标进入下载界面点击 download 下载按钮。 解压下载好的zip文件到指定目录(放到你喜欢的位置) 将解压后的文件目录中 bin 目录包含 ffmpeg.exe 添加进 path 环境变量中 DOS 命令行输入 ffmpeg -version, 出现以下界面说明安装完成 2、安装Whisper模型 运行以下程序会自动安装Whisper-small的模型并识别音频audio.mp3 输出识别到的文本。如果没有科学上网的手段请手动下载 import whisper model whisper.load_model(small) result model.transcribe(audio.mp3) print(result[text])运行结果如下 三、其他 实时录制音频并转录 import pyaudio import wave import numpy as np from pydub import AudioSegment from audioHandle import addAudio_volume,calculate_volume from faster_whisper import WhisperModelmodel_size large-v3# Run on GPU with FP16 model WhisperModel(model_size, devicecuda, compute_typefloat16)def GetIndex():p pyaudio.PyAudio()# 要找查的设备名称中的关键字target 立体声混音for i in range(p.get_device_count()):devInfo p.get_device_info_by_index(i)# if devInfo[hostApi] 0:if devInfo[name].find(target) 0 and devInfo[hostApi] 0:print(devInfo)print(devInfo[index])return devInfo[index]return -1 # 配置 FORMAT pyaudio.paInt16 # 数据格式 CHANNELS 1 # 声道数 RATE 16000 # 采样率 CHUNK 1024 # 数据块大小 RECORD_SECONDS 5 # 录制时长 WAVE_OUTPUT_FILENAME output3.wav # 输出文件 DEVICE_INDEX GetIndex() # 设备索引请根据您的系统声音设备进行替换 if DEVICE_INDEX-1:print(请打开立体声混音) audio pyaudio.PyAudio()# 开始录制 stream audio.open(formatFORMAT, channelsCHANNELS,rateRATE, inputTrue,frames_per_bufferCHUNK, input_device_indexDEVICE_INDEX) data stream.read(CHUNK) print(recording...)frames []moreDatas[] maxcount3 count0 while True:# 初始化一个空的缓冲区datas []for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):data stream.read(CHUNK)audio_data np.frombuffer(data, dtypenp.int16)datas.append(data)# 计算音频的平均绝对值volume np.mean(np.abs(audio_data))# 将音量级别打印出来print(音量级别:, volume)moreDatas.append(datas)if len(moreDatas)maxcount:moreDatas.pop(0)newDatas[i for j in moreDatas for i in j]buffersbfor buffer in newDatas:buffersbufferprint(开始识别)buffersnp.frombuffer(buffers, dtypenp.int16)# a np.ndarray(buffernp.array(datas), dtypenp.int16, shape(CHUNK,))segments, info model.transcribe(np.array(buffers), languageen)textfor segment in segments:print([%.2fs - %.2fs] %s % (segment.start, segment.end, segment.text))textsegment.textprint(text) print(finished recording)# 停止录制 stream.stop_stream() stream.close() audio.terminate()# 保存录音 wf wave.open(WAVE_OUTPUT_FILENAME, wb) wf.setnchannels(CHANNELS) wf.setsampwidth(audio.get_sample_size(FORMAT)) wf.setframerate(RATE) wf.writeframes(b.join(frames)) wf.close()#addAudio_volume(WAVE_OUTPUT_FILENAME)
http://www.pierceye.com/news/564847/

相关文章:

  • 梅州建站公司阳性几天就不传染人了
  • 网站建设的简历高端网站设计上海网站建设上海
  • 南京专业网站制作宁波妇科医院私立哪家医院好
  • 西安市建设局官方网站做词云的网站
  • 网站开发人员岗位要求马洪旭 做的网站大学
  • 凡科做网站是否安全网站效果代码
  • 腾讯云做网站干什么用公司的网站建设规划书
  • 网页设计如何设置背景北京建站优化
  • 哈尔滨企业建站模板做emu对网站有什么要求
  • 网站说服力 营销...企业微信自建应用怎么开发
  • 做网站的宽度为多少做义工的网站
  • 现在怎么做网站东莞家居网站建设
  • 制作公司网站的流程代运营公司网站
  • 山东网站策划怎么做58同城黄页推广
  • 如何用手机做钓鱼网站贵阳建设厅网站
  • 网站建设工作自查报告网站建设的心得体会
  • 网站开发项目设计文档产品seo基础优化
  • 建筑工程招聘网站哪个好wordpress ssr
  • 制作一个网站平台做php网站需要什么软件开发
  • 长沙seo网站管理淮北论坛招聘最新消息兼职
  • .net网站源码下载珠海网站建设珠海
  • 网站被降权严重吗企业营销型网站的内容
  • 网站抓取qq号码原理社交电商平台排行榜
  • 贵阳做网站哪家公司好dw如何在网站做弹窗
  • 怎样做网站底部导航网站建设软件sh
  • 小白学网站建设与设计书如何制作app软件下载
  • 个人网站模板源码一般vs做的网站的总体框架
  • 服务器做网站流程wordpress分站
  • 电子商务平台网站建造莒南做网站
  • 网站文章好几天不收录注册送38元的游戏网站