移动网站怎么做优化,上海礼品定制网站,网站域名查询ip,图库素材网站模板7月4日凌晨#xff0c;法国知名开源AI研究实验室Kyutai在官网发布了#xff0c;具备看、听、说多模态大模型——Moshi。
Moshi功能与OpenAI在5月14日展示的最新模型GPT-4o差不多#xff0c;可以听取人的语音提问后进行实时推理回答内容。但GPT-4o的语音模式要在秋天才能全面…7月4日凌晨法国知名开源AI研究实验室Kyutai在官网发布了具备看、听、说多模态大模型——Moshi。
Moshi功能与OpenAI在5月14日展示的最新模型GPT-4o差不多可以听取人的语音提问后进行实时推理回答内容。但GPT-4o的语音模式要在秋天才能全面开放使用而Moshi已经提供使用了。
「AIGC开放社区」已经亲自测试Moshi不锁区填写一个邮箱地址就能直接使用无需任何等待。值得一提的是Moshi是支持手机移动端使用的只不过对普通话支持较差最好使用英语提问。
此外Kyutai可能很快就会开源Moshi公布代码、模型权重和论文。
免费体验地址https://moshi.chat/?queue_idtalktomoshi Moshi的使用流程非常简单1登录https://moshi.chat/?queue_idtalktomoshi
2填写一个邮箱地址然后点击join。如果是手机登录系统会提示使用你的麦克风因为这个产品对语音是一个硬性要求。如果你是PC端使用也必须有麦克风不然没法使用。 「AIGC开放社区」的真实使用过程
3开始语音输入你想提问的内容就行了。 下面这个是官方展示的案例根据多轮语音连续对话主要让Moshi用法语来一首关于巴黎的诗接着用窃窃私语的方式描述一个神秘故事。
Moshi完成的很出色其拟人化语气是一大特点机器味很少这一点和GPT-4o有点像。 这个是模拟星际战舰指挥官与航程的故事主要询问了一些到达目标航程周围环境等内容。由于听译的可能理解的不太全~~ 「AIGC开放社区」也体验了一下主要问了Moshi几个简单问题第一个法国巴黎有哪些著名景点Moshi埃菲尔铁塔。
接着问卢浮宫博物馆有哪些著名的展览物品Moshi世界名画蒙娜丽莎的微笑。
又问了巴黎有哪些标志性建筑Mosh凯旋门这是一个拥有悠久历史的建筑。 由于Moshi的论文还没有发布「AIGC开放社区」就说一说自己的亲身使用体验吧。
1响应速度超级快本次测试使用的是国区线路而Moshi的demo服务器在欧洲和美国但当你用语音提问完问题后几乎0延迟就能马上响应你的提问。Moshi官方给出的理论延迟是160毫秒。 2不支持中文普通话这一点还是能理解的毕竟Moshi面向的国外用户群体主流语言还是英语同时也支持法语。
3回答内容有限Moshi虽然是语音输出内容但详细程度比ChatGPT那种纯文本差好多回答的内容只能是轮廓大概相信以后产品会迭代更多。
4使用方便快捷几乎没有繁琐的注册流程你只需要提交一个邮箱即可马上就能帮助你非常方便。
5Moshi听和说的能力有了看的能力还没展示出来这个功能估计以后也会添加吧这样整个输出模式将更加完善。
6这类产品对家教、教育行业是起到颠覆性作用例如让家教老师帮你反复讲解一道高数题估计两遍人就比较恼了而AI可以帮你循环讲解无数次这对于教育帮助是巨大的。
7期待国产类似的GPT-4o、Moshi产品出现最好再支持一些闽南话、粤语、四川话、东北话等有特色的地方语言就像汽车导航那样一定会非常有意思。
对于Moshi的发布网友们还是相当兴奋的在我们苦等GPT-4o的语音模式时Moshi横空出现期待他们更好的表现。 在推理延迟方面Moshi似乎比GPT-4o更好。这一点从实际操作来看确实是很快的。 刚试了一下Moshi的产品其高效的推理响应以及低延迟令人印象深刻这就是我一直期待的产品。 继续称赞Moshi的低推理延迟。如果使用功能更高级的模型即便推理时间长一些也没问题。确实现在Moshi的回答内容还是太宽泛了。 已经有人急的不行开始要源代码了你们可是开放AI研究实验室啊~ 本文素材来源Moshi官网如有侵权请联系删除