Использует стабильные диффузионные модели для создания музыки
Стабильная диффузия-это модель ИИ с открытым исходным кодом, которая может генерировать изображения из текста. Riffusion настроил модель, чтобы сделать ее способной создавать изображения, называемые спектрограммами, а затем превратить их в аудиоклипы. Спектрограммы – это как картинки, которые показывают, как звучат разные частоты в разное время. Они также сделали интерактивное веб -приложение, поэтому любой может набрать подсказку для генерации аудиоклипа, а затем приложение проведет плавный переход между различными подсказками или разными семенами одинаковой подсказки.