Stable Diffusion 是一种 AI 模型,可让您输入文本以生成图像。频谱图直观地表示声音。 Seth Forsgren 和 Hayk Martiros 将两者结合起来用于 Riffusion,它允许您输入文本,模型生成一个频谱图,然后转换为音频。
在此处阅读有关该过程的更多信息。
原文: https://flowingdata.com/2022/12/16/stable-diffusion-spectrogram/
翻译英文优质信息和名人推特
Stable Diffusion 是一种 AI 模型,可让您输入文本以生成图像。频谱图直观地表示声音。 Seth Forsgren 和 Hayk Martiros 将两者结合起来用于 Riffusion,它允许您输入文本,模型生成一个频谱图,然后转换为音频。
在此处阅读有关该过程的更多信息。
原文: https://flowingdata.com/2022/12/16/stable-diffusion-spectrogram/