Думали ли Вы когда-нибудь над тем, как здорово было бы работать со звуком в графическом редакторе?
— Вот скрипка. Где мой healing-brush, сейчас замажем, чтоб никто даже не заметил.
— А вот вокал, видиш «пьяные» полосочки? Давай сюда свой eraser — сделаем фонограмму.
Примерно так можно описать процесс редактирования сонограммы в Photoshop'e.
Photosounder — софт, который позволяет проанализировать звуковой фрагмент, построить на его основе «полотно» зависимостей частот-времени-громкостей. Более того, это «полотно» можно экспортировать как изображение, отредактировать, и импортировать обратно в программу, где изменения в изображении будут преобразованы в звук. Звучит фантастически?
Теория. Как это работает?
Для анализа и построения сонограммы применяется алгоритм FFT (БПФ — Быстрое Преобразование Фурье). В результате работы FFT-алгоритма звук раскладывается на все составляющие его частоты. Информация по каждой частоте в каждый отрезок времени анализируется и в результате строится изображение, где по оси X откладывается время, по оси Y — частоты, а громкость на пересечении координат выражается яркостью пикселя. Вот так это выглядит на практике:
0)680х784
Программа позволяет экспортировать сонограмму в виде BMP-изображения, а также импортировать изображение сонограммы обратно. При помощи любимого графического редактора мы можем внести любые изменения в сонограмму, в результате чего изменится и частотное наполнение будущего звука.
Что нам это даёт?
При определённом уровне сноровки и усердия можно делать отличные фонограммы без потери качества оригинала. Так же можно использовать эффекты графического редактора для получения совершенно нового звучания. Но что ещё более интересно, при помощи этой технологии можно замедлять любой звук в любое число раз без потери качества и без наличия эффекта гранулирования (который применяется почти во всех алгоритмах тайм-стретчинга). Некоторые примеры на
оффсайте
.