网站app程序制作企业,中国食品加工网,wordpress 阅读小说,wordpress 音乐插件前言
本文将介绍一个准确率非常高的语音识别框架#xff0c;那就是FunASR#xff0c;这个框架的模型训练数据超过几万个小时#xff0c;经过测试#xff0c;准确率非常高。本文将介绍如何启动WebSocket服务和Android调用这个服务来实时识别#xff0c;一边说话一边出结果…前言
本文将介绍一个准确率非常高的语音识别框架那就是FunASR这个框架的模型训练数据超过几万个小时经过测试准确率非常高。本文将介绍如何启动WebSocket服务和Android调用这个服务来实时识别一边说话一边出结果。
安装环境
安装Pytorch。
# 安装CPU版本的Pytorch
conda install pytorch torchvision torchaudio cpuonly -c pytorch
# 安装GPU版本的Pytorch
conda install pytorch torchvision torchaudio pytorch-cuda11.8 -c pytorch -c nvidia
使用conda安装ffmpeg等一些库。
conda install ffmpeg
conda install -c conda-forge pynini安装其他依赖库。
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple启动服务
执行server.py程序启动上传音频文件识别服务。
python server.pyPython不支持多并发的如果要使用多并发服务需要在Linux系统上面执行websocket目录的Docker应用。
Android应用
使用Android Studio打开源码中的AndroidClient目录这是一个Android应用源码打开之后首先就要修改WebSocket地址ASR_HOST将它修改为你上面使用的服务器IP地址点击运行安装到Android手机上。
应用效果图 扫码入知识星球搜索【FunASR语音识别WebSocket服务】获取源码