门户网站建设兴田德润,ui设计做兼职的网站有哪些,公主岭网站建设规划,微信app下载安装2024最新版接下来会每周集中体验一些通用或者垂直的AI落地应用#xff0c;主要以一些全球或者国外国内排行较前的产品为研究对象#xff0c;「AI 产品榜#xff1a; aicpb.com」以专题的方式在博客进行分享。 本节主要介绍和体验AI音乐生成应用产品Suno AI#xff0c;Suno来自目前最…接下来会每周集中体验一些通用或者垂直的AI落地应用主要以一些全球或者国外国内排行较前的产品为研究对象「AI 产品榜 aicpb.com」以专题的方式在博客进行分享。 本节主要介绍和体验AI音乐生成应用产品Suno AISuno来自目前最强的文字转音频TTS开源模型 Bark。 产品链接https://app.suno.ai/
一、产品介绍
Suno印地语中意为「倾听」。 与多数 AI 音乐应用不同的是它专注于创作全新旋律和人声而不是模仿已有的知名艺术家声音或歌曲风格。首席执行官兼联合创始人 Mikey Shulman 表示尽管以特定艺术家风格创作新歌很酷、很有趣但长期来看这种体验不会给消费者带来持久的乐趣。
他们的理念是让更多人收获创作音乐的乐趣同时也更加重视人声音乐。Mikey Shulman 表示「大多数人不会演奏乐器也不了解复杂的软件到目前为止这一直是创作优美音乐的障碍。声乐也是其中一个非常重要的组成部分也是「Suno」的与众不同之处。」
二、功能简介 创建自己的音乐 Suno 的使用方式非常简单直接用自然语言描述想要生成的音乐可以是想要的主题、音乐风格或大概的情绪氛围比如「一个关于祭奠过去的自己的歌曲风格偏灵魂和民谣」。然后Suno 会生成两首旋律和歌词各不相同的曲子。讲真蛮好听 我制作的「我的旅程」https://app.suno.ai/song/ce2c8d96-0d2a-4c04-b88b-2b6ba2153a93 编辑已经创建的音乐 也可以在 Suno 生成的作品基础上进行进一步地编辑比如修改歌词和音乐风格或者生成一首完整的曲目。目前用户还可以自己编写并上传歌词选择想要的风格如「情感乡村民谣」来生成相应歌曲。 浏览别人的作品
排行第一的作品https://app.suno.ai/song/5357415b-a202-4798-af1b-3bea6e8939bd
三、技术模型
Suno开发了两个深度学习模型 Bark和Chirp。Bark 表示狗叫的声音Chirp是鸟儿嘁嘁喳喳的声音。主要区别在于它们的用途和功能。这些模型利用了人声、旋律、节奏作为训练数据。
Suno Bark是一个基于Transformer的文本到音频的模型。它可以生成高度逼真的多语言语音以及其他音频。此外该模型还可以产生非语言交流如笑、叹气和哭泣。Bark是一个开源模型Github地址为https://github.com/suno-ai/bark。
Chirp是Suno AI的最新音乐模型。它使用先进的AI技术生成真实和高质量的音频内容如语音、音乐及音效。
总的来说Bark主要用于生成语音和其他音频而Chirp则专注于音乐生成。
四、盈利模式
用户在官网登录后即成为免费版本用户每天可以使用 5 次提示可生成 10 首歌曲。Suno 的盈利模式为会员订阅每月支付 8 美元可生成 500 首歌曲每月支付 24 美元的用户可生成 2000 首歌曲同时还提供年度订阅折扣。
Suno目前提供免费计划及多种付费订阅计划。
免费计划
所有用户在加入Suno的Discord时都将自动订阅免费计划。免费计划现在每天包括50个积分5次Chirps。
专业计划Pro
专业计划每月费用为$8。专业计划用户享有每月2,500个积分。 付费订阅用户Pro或Premier在订阅期间生成的歌曲归其所有。对于免费用户Suno保留对生成的歌曲的所有权但允许其用于非商业目的。
五、产品剖析
跟 AI 生成文本和图像相比使用 AI 生成可用的音乐要困难得多。音乐的复杂性远超语言它包含了丰富的情感和细微的表达。AI 需要学会如何在保持音乐连贯性的同时捕捉和复制这些微妙的情感变化。系统需要处理更多元素从语音到个别音符、排列和流程。
AI 生成音乐的难点包括 复杂性音乐具有多层次的结构和丰富的情感表达这要求模型能习得复杂的音乐理论并能够理解并模拟人类情感。 数据量和质量高质量的音乐数据集对于训练有效的 AI 音乐生成模型至关重要。然而获取大量、多样化且高质量的音乐数据集来训练和解读音乐风格及情绪描述仍然非常困难。 长期连贯性音乐中的某些模式可能跨越很长的时间跨度这对于模型来说是一个挑战因为它们需要记住并利用这些信息来生成连贯的音乐。 风格和情感的表达捕捉和复制特定风格或情感的音乐是非常复杂的这需要模型能够理解和模拟音乐的情感维度。 评估和反馈评估生成的音乐质量是一个主观过程缺乏客观的度量标准。此外模型可能需要反馈来改进但在音乐领域这种反馈机制不如图像或文本生成领域成熟。 版权和伦理问题AI 生成的音乐可能涉及到版权问题尤其是在模仿特定艺术家或作品风格时。此外还需要考虑 AI 在艺术创作中的角色和伦理责任。
尽管存在这些挑战AI 音乐生成技术仍在不断发展研究人员正在探索新的方法来克服这些问题以创造出更加丰富和多样的音乐作品。
六、相关竞品 2023年1月微软宣布与Suno的合作在微软的AI聊天机器人Copilot中以插件的方式集成Suno。
现在Copilot用户可以通过微软聊天机器人直接访问Suno例如直接在文本框中输入“Create a pop song about adventures on Mars”。
除了Suno之外其他大型科技公司也在测试生成式AI音乐工具如Meta的开源音频工具AudioCraft该工具也可以根据文本提示生成歌曲以及谷歌的YouTube工具该工具可以根据哼唱的歌曲或文本提示生成原创音乐曲目。
此外还有许多其他承诺提供类似工具的AI音乐初创公司进入市场如Soundful、Magenta、Beatbox可以生成节奏和器乐曲目、Soundraw、Loudly、Boomy、Beatoven.ai等。
七、关于AI音乐生成
从B端和C端来看音乐生成类产品的应用场景十分广泛。TTS文本到语音技术大幅降低了电影、电视、游戏和广告等领域的音频制作成本。电影和游戏制作公司需要大量的背景音乐和音效AI可以根据特定场景批量生产相应的音频而广告公司也可以利用这一技术创建独特的广告音乐以增强广告效果。
在消费者市场领域随着音乐创作门槛的显著降低人们有望通过音乐进行自我表达使音乐成为互联网交流的一种独立内容形式。
目前互联网的内容主要由文字、图片和视频构成对应的热门社交产品分别是以文字为主的推特、微博以图文为主的Instagram、小红书以视频为主的抖音Tiktok。根据内容创作的不同出发点可分为记录事实和艺术创作分别侧重熟人社交和陌生人社交。
Instagram 最初通过提供好看的滤镜来美化照片聚焦记录现实并让现实更美一点最初获得摄影师的欢迎与推广。之前在 Gen-Z 群体中广泛流行的 Snapchat 故事将拍照从一种 艺术 形式变成了一种低门槛的交流方式全球月活用户达到 7.5 亿。在图文领域与 Instagram、Snapchat 对应的产品是图片社交分享网站 Pinterest不同于熟人社交的网络关系链而更偏兴趣社交场景。
相比于图文和视频音乐真的适合自我表达吗人们往往把音乐当成一种属于音乐爱好者的小众表达方式而忽略了声音作为最古老的交流媒介所承载的社会文化意义。但仔细想想自石器时代以来乐器演奏和集体合唱就是社会和组织中创造叙事最核心的部分比如国歌、校歌、队歌、新闻联播的前奏和我们在 KTV 里必点的那首属于青春的歌。
音乐在人类之间创造了一种共同的语言和文化是个体与组织层面最社会化的自我表达形式之一。然而目前还没有出现以音乐作为独立内容载体的产品主要原因可能来自音乐创作的复杂性和相应情感表达的模糊性。
音乐创作包含歌词和音频两部分依赖复杂的乐理和器乐知识。同时音乐作为时间戳上的连贯性内容创作需要「所见即所得」的及时反馈。当我们开始演奏一种声音时就会形成一个反馈回路feedback loop当节拍或音调不合适我们会立刻感知到而如果形成正确的反馈回路我们则会顺畅地进入「心流」状态。然而目前的多数音乐制作工具都不支持这种流动状态让音乐创作变得非常困难。
生成式 AI 技术能够实现内容创作的连贯性与反馈及时性。
另一方面音乐真的可以实现不同情感的表达吗「声无哀乐」是魏晋时期著名的音乐家、文学家嵇康的观点他认为声音本身没有哀乐之分是人的情感赋予了声音哀乐。声音本质上作为一种波动现象本身是中性的。人在听到特定音乐或声音时产生的情绪反应是大脑处理声音信息的过程中的生理反应。特定的声音频率、节奏和音调可以刺激我们的大脑和神经系统使我们感到兴奋、轻松、紧张或悲伤。
比如大脑会在听到快节奏音乐时产生兴奋反应在听到小调音乐时产生悲伤反应。这种自动化的情绪反应并非完全是我们赋予声音的过程而是人的生理反应。因此对不同音乐进行情感表达也依赖大量的标注数据。
SunoAI 目前生成的歌曲已经具备了较高的专业度和可拆解性用户可以对曲风和情感进行描述和调整。通过音乐实现跨文化的自我表达或许就在不远的未来。
七、参考资料
第一款现象级音乐生成产品 Suno以后的爆款歌曲可能要被 AI 承包了从Suno.ai谈内容创作「协同人类」而非取代人类将是未来AI的核心定位看到有一个新朋友只做了一个MV可以观摩一下。全AI生成动漫风视频《CELANOSS》
《CELANOSS》 -脚本ChatGPT -分镜Midjourney -视频Runway/Pika/Pixverse -音乐Suno -剪辑CapCut