分享
AI 音乐 | 3.2 资讯
输入“/”快速插入内容
AI 音乐 | 3.2 资讯
飞书用户6750
2024年3月2日修改
15%
作者:叮当不是机器猫 |分享AI音乐动态,探索AI与音乐的无限可能!
公众号:智音Brook
2024-03-02 21:40
广东
原文:
https://mp.weixin.qq.com/s/q1TqyzJao8Z2YJYVK2s_VQ
85%
目录
Voice-Swap 推出 Stem-Swap,可重塑混音曲目的人声
SALMONN:语音音频语言音乐开放神经网络
LAIVE:AI 生成器乐曲目、歌词和人声一体
Combobulator:用AI合成技术重塑音乐创作界限
Vocs AI:您的免费人工智能语音生成器和转换器
Voice-Swap 推出 Stem-Swap,可重塑混音曲目的人声
链接:
https://www.voice-swap.ai/
Voice-Swap 推出了 Stem-Swap 工具,允许用户从完全混音的曲目中轻松快速地更改人声。这个基于浏览器的工具可以将歌曲分成四部分,隔离人声,并将其转换为其他歌手的声音。用户可以从授权歌手名单中选择新声音,并下载完整混音或各个音轨。这一功能预计将开启前所未有的创意和合作新途径。
SALMONN:语音音频语言音乐开放神经网络
论文:
https://arxiv.org/abs/2310.13289
演示:
https://huggingface.co/spaces/fffiloni/SALMONN-7B-gradio
SALMONN 是一种集成了语音和音频编码器的多模态大型语言模型(LLM),旨在理解和处理包括语音、音频事件和音乐在内的一般音频输入。该模型通过双编码器结构,结合语音识别、自动语音翻译、音频信息基础的问题回答、情感识别、说话人验证和音乐及音频描述等任务进行训练,以提高在这些领域的性能。
SALMONN 利用了大量公开可用的数据集进行训练,包括 LibriSpeech、GigaSpeech、WavCaps、AudioCaps 和 Clotho 等,这些数据集覆盖了语音识别和音频描述等多种任务。
SALMONN 在一系列语音和音频基准任务上进行了评估,包括自动语音识别、音频描述、情感识别和音乐描述等。实验结果显示,SALMONN 能够在这些任务上达到竞争性的性能,并在未训练的任务上展现出通用听力能力。
结果表明,SALMONN 成功地将语音、音频事件和音乐的理解能力整合到一个单一的模型中,展现了向具备通用听力能力的人工智能迈进的一步。此外,通过激活调整阶段,SALMONN 能够缓解任务过拟合问题,并激活跨模态的突现能力,如基于音频的故事讲述和语音音频共同推理等能力。
LAIVE:AI 生成器乐曲目、歌词和人声一体