【KJKX科技快讯】8月2日消息,据悉,meta在今天宣布开源了一款名为AudioCraft的生成式AI工具,该工具为音乐家和声音设计师提供了一种全新的灵感来源,帮助他们以创新的方式迭代自己的作品。该工具包含三个核心组件:MusicGen、AudioGen和EnCodec(改进版)。

在这三个核心组件中,MusicGen是其中之一,它是基于谷歌2017年推出的Transformer模型的AI语言模型。MusicGen能够将文本和已有的旋律转化为完整的音乐作品,从而帮助音乐创作者们更轻松地进行音乐生成。

另外一个核心组件是AudioGen,它通过使用公共音效进行训练,能够生成音频或扩展现有音频,甚至可以产生各种环境音效,如狗叫、汽车鸣笛、木地板上的脚步声等。这为声音设计师提供了更多可能性,让他们能够创造出更加丰富多样的音频效果。

最后一个核心组件是EnCodec(改进版),它是基于神经网络的音频压缩解码器。EnCodec的独特之处在于,它可以生成更高质量的音乐并减少人工痕迹,还能对音频文件进行无损压缩。这使得音乐的生成和处理过程更加高效和便捷。

据KJKX科技快讯了解,这些开源的AI工具不仅为相关研究人员和从业人员提供了训练模型的机会,还能长期稳定地生成高质量音频,为创作者们带来了更广阔的创作空间。meta的AudioCraft系列模型为音乐和声音设计领域注入了新的活力,助力人们以创新的方式表达自己的创作理念。

文章采集于互联网