Глава 2. Математические модели феномена
Рассмотрим наиболее интересные модели разделения сигнала. Некоторые из них являются обобщением над разделением звука и могут быть применены к любым сигналам, что может понадобиться в еще больших сферах.
2.1. Computational auditory scene analysis (CASA)
Вычислительная модель анализа слуховой сцены старается максимально точно следовать биологическим принципам слуха человека. Поэтому в такой модели используют 2 микрофона с характеристиками близкими к человеческому уху. Цель этого подхода на структурном уровне получить такие сигналы, которые и обрабатывает человеческий мозг. Исследованиями в этой области занимается психоакустика и исследует то, как именно человеческий мозг реагирует на разные сигналы.
2.2. Формирование луча направленности: Beamforming
Этот метод начинал развиваться еще в 70-е годы, когда появилась необходимость обрабатывать массивы сигналов, поступающих с распределенных в пространстве сенсоров. Этот подход находил своё применение в радиолокации, телекоммуникации, детекторах сейсмической активности.
Используя различия между полученными сигналами, т.е. временные характеристики, величину искажения, и сведения о точном расположении сенсоров, система может устанавливать направления и координаты источников сигнала, вычитать шумы из общего сигнала, тем самым оставляя только полезную информацию. Важной особенностью данного подхода является возможность выделять, акцентировать внимание, на определенном источнике сигнала, что и применялось в радиолокации.
Beamforming предполагает наличие четких данных о форме расположения сенсоров, расстоянии между ними и о том как они расставлены в пространстве. Оптимальное расположение сенсоров требует дополнительного изучения и для лучшего распознавания требуется сенсоров больше чем источников сигнала, что накладывает большие ограничения на использование этого подхода.
2.3. Слепое разделение сигналов: Blind source separation (BSS)
Слепое разделение сигнала, в отличие от CASA и Beamforming, использует статистические данные, а не информацию о топологии сенсорной установки в пространстве или об особенностях микрофона. Слепое разделение может идентифицировать звук только анализируя статистические данные входного сигнала.
По определению при использовании BSS мы не имеем никаких априорных статистических сведений об источнике сигнала и о природе процесса смешивания сигналов. Поэтому необходимо делать некоторые предположения о характере сигнала. Тем не менее эти гипотезы остаются достаточно общими и поэтому этот подход можно использовать не только для разделения звука, но и в принципе любых сигналов.
BSS можно считать наиболее перспективным подходом, так как он не ставит строгих требований к оборудованию, как другие методы. Тем не менее интересно было бы построить систему, объединяющую идеи этих подходов, получив высокую стабильность и качество разделения звукового сигнала. Если от CASA взять точные сенсоры, а от Beamforming получить дополнительные априорные сведения, то в итоге можно сделать разделение сигналов действительно точным. Эту гипотезу хотелось бы проверить в дальнейшем.