Академия

Исследования спектра прореженных выборочных ковариационных матриц поможет в восстановлении потерянных данных

Исследования спектра прореженных выборочных ковариационных матриц поможет в восстановлении потерянных данных

Рубрика Исследования

Главный научный сотрудник лаборатории математики и телекоммуникаций Физико-математического института ФИЦ Коми НЦ УрО РАН, доктор физико-математических наук Александр Тихомиров и старший научный сотрудник той же лаборатории кандидат физико-математических наук Дмитрий Тимушев исследовали спектр прореженных выборочных ковариационных матриц и получили результаты при почти оптимальных ограничениях.

О совместной работе рассказал Дмитрий Тимушев:

– Благодаря значительному увеличению вычислительных мощностей и объемов памяти компьютеров в последние десятилетия собраны и непрерывно пополняются огромные массивы информации (big data). Особенно это касается таких активно развивающихся направлений, как биоинформатика, исследования климата, экономика, анализ социальных сетей.

Отличительная особенность этих новых данных – значительное превышение количества исследуемых признаков некоторого процесса над числом самих наблюдений (так называемое «проклятие размерности»), поэтому использовать разработанные ранее статистические методы невозможно. Один из инструментов, позволяющих преодолеть возникшие трудности, – теория случайных матриц.

Помимо «проклятия размерности» в части приложений данные имеют еще одну особенность: они оказываются существенно прореженными. Для моделирования подобных процессов эффективно рассмотрение случайных матриц большой размерности – прореженных (когда достаточно большое количество элементов матрицы зануляется) и/или структурированных (когда матрицы имеют некоторую блочную структуру).

Таким образом, например, удается исследовать задачи, связанные с анализом социальных сетей (задача выделения сообществ), обработкой сигналов (задача восстановления разреженного сигнала).
Мы изучаем поведение спектра прореженных выборочных ковариационных матриц при росте их размерности. При некоторых предположениях о распределении элементов матрицы и вероятности прореживания получены количественные и качественные оценки сходимости спектральной эмпирической функции распределения прореженной выборочной ковариационной матрицы к функции распределения Марченко-Пастура (сам факт такой сходимости принято называть законом Марченко-Пастура), найдены оценки наименьшего и наибольшего собственных чисел матрицы.

Наши результаты могут быть востребованы в задачах восстановления потерянных данных, тестирования, машинного обучения, биоинформатики.

Подготовила ведущий специалист по связям
с общественностью
ФИЦ Коми НЦ УрО РАН
Надежда Бушенева.
Источник: УрО РАН.

Новости Российской академии наук в Telegram →