Разработан новый метод повышения точности прогнозов временных рядов
Разработан новый метод повышения точности прогнозов временных рядов
Исследователи факультета вычислительной математики и кибернетики Московского государственного университета им. М.В. Ломоносова и Федерального исследовательского центра «Информатика и управление» Российской академии наук (ФИЦ ИУ РАН) разработали новый метод повышения точности прогнозов временных рядов, объединяя вероятностные модели и алгоритмы машинного обучения.
Метод уже доказал свою эффективность, улучшив показатели точности прогнозов до 45,7 %. Результаты работы опубликованы в журнале AI.
Прогнозирование временных рядов играет ключевую роль во многих областях, включая управление энергоресурсами и телекоммуникационным трафиком, анализ климата, медицину и финансы. Они зачастую характеризуются зашумлённостью данных и ограниченностью обучающих наборов. Это создаёт трудности для традиционных моделей, которые могут переобучаться или давать низкую точность прогнозов в прикладных задачах. Новая методика, разработанная учёными ФИЦ ИУ РАН и факультета ВМК МГУ, базируется на совместном использовании вероятностных моделей и алгоритмов машинного обучения для повышения обобщающих способностей моделей искусственного интеллекта с целью выявления нетривиальных закономерностей в данных. Подход ориентирован на повышение качества прогнозирования даже для датасетов небольшого объёма.
Предложенный подход развивает принципы вероятностно-информированного машинного обучения — а именно, используются смешанные компоненты связности для генерации новой информации для моделей машинного обучения. Дополнительные признаки формируются с использованием специального алгоритма объединения параметров при обработке временного ряда в режиме скользящего окна. Это позволяет учитывать нелинейные взаимосвязи и стохастические факторы, влияющие на данные. Кроме того, в данном исследовании впервые продемонстрирована эффективность использования смешанных компонент связности как для методов машинного обучения, так и для глубоких нейронных сетей, в частности, представляющих собой ансамбли из рекуррентных сетей LSTM и трансформеров.
Экспериментальное тестирование методики основывалось на двух, существенно различающихся по физической природе, датасетах. Первый представляет собой данные теплообмена между океаном и атмосферой, например, в районах Гольфстрима и Лабрадорского моря. Эти данные характеризуются сложной пространственно-временной динамикой. Вероятностно-информированные модели, разработанные учёными, способствовали существенному уменьшению значений метрик. Так, среднеквадратичная ошибка была снижена на 27,7 %, а средняя абсолютная процентная ошибка — на 45,7 %. Второй набор содержал открытые данные о показателях температуры масла в электрических трансформаторах. Здесь также удалось продемонстрировать существенные улучшения, добившись уменьшения среднеквадратичной ошибки на 10 % по сравнению с традиционными методами прогнозирования, в том числе удалось превзойти результаты трансформерной модели Reformer.
«Применение вероятностного информирования в машинном обучении открывает новые горизонты для анализа временных рядов. Даже в условиях ограниченных или зашумлённых данных мы можем добиваться значительных улучшений в точности прогнозов. Это особенно важно для задач, где ошибка прогноза может повлечь серьёзные последствия, будь то энергетика, климат или медицинские исследования», — пояснил доцент кафедры математической статистики факультета ВМК МГУ Андрей Горшенин.
В дальнейшем исследователи планируют уделить особое внимание расширению классов используемых архитектур и методов их вероятностного информирования с помощью разнообразных математических моделей с целью получения высокоточных прогнозов в различных областях науки и промышленности.
Источник: МГУ.