5 月 18 日,Stability AI 在 Hugging Face 上正式开源了颠覆性的全新音频自编码器 SAME(Semantically-Aligned Music Autoencoder),并同步发布了技术论文。该模型专门针对立体声音乐及通用音频流设计,在大幅削减计算成本的同时,确立了生成式音频基础设施的新标杆。
核心技术突破与亮点
•
双倍于行业标准的极致压缩: SAME 实现了惊人的 4096 倍时间压缩率,直接达到了目前主流神经音频编解码器(Codec)标准的两倍。这为生成式 AI 带来了极高的数据传输与处理效率。