«Масс-спектрометрический нос» для анализа образцов чая
«Масс-спектрометрический нос» для анализа образцов чая
В лаборатории инструментальных методов и органических реагентов Института геохимии и аналитической химии им. В.И. Вернадского РАН совместно с Институтом общей физики им. А.М. Прохорова РАН разрабатывается новый метод анализа органических и биологических образцов — «масс-спектрометрический нос». Метод изучен для решения задачи экспресс-классификации различных товарных наименований чая.
Чай, как один из самых популярных напитков в мире, представлен широким разнообразием видов и сортов, что часто создаёт сложности для однозначной идентификации и проверки качества продукции. Стандартные подходы к идентификации чая предполагают длительный и трудоёмкий анализ, включающий в себя процедуры пробоподготовки и хроматографического разделения. Разработанный способ позволяет проводить прямой анализ образцов по их «запаху» — составу выделяемых чаем органических соединений. Результаты опубликованы в журнале «Масс-спектрометрия».
Образец чая помещают в пробирку, выделяемые пробой летучие органические вещества поступают в зону ионизации, там они ионизируются и детектируются масс-спектрометром. Для ионизации используется разработанный авторами метод, основанный на использовании лазерно-индуцированной плазмы (метод APLPI). Воздействие плазмы на молекулы воздуха приводит к образованию высокой концентрации первичных ионов и возбуждённых молекул, которые затем обеспечивают мягкую ионизацию органических соединений, принадлежащих к различным химическим классам.
Как и «биологический нос», «масс-спектрометрический нос» детектирует большое количество сигналов, большая часть которых не содержит информацию, позволяющую классифицировать различные образцы, особенно образцы близкие по химическому составу. В живых организмах выделение полезной информации обеспечивается работой мозга, а для «масс-спектрометрического носа» такую задачу можно решать путём использования методов машинного обучения. Вначале на предварительно охарактеризованном массиве данных математическую модель «обучают» выделять признаки, отвечающие за различие между группами. В дальнейшем «обученная» модель позволяет классифицировать неохарактеризованные образцы.
В работе исследованы три метода машинного обучения, отличающихся между собой способом выявления различий между группами — это логистическая регрессия, нейронная сеть вида многослойный перцептрон и метод оперных векторов. Показано, что наиболее эффективным методом классификации образцов чая является логистическая регрессия в сочетании с кросс-валидацией и устранением признаков, не несущих важной информации. Такой подход позволил с точностью, близкой к ста процентам, классифицировать образцы чая по товарному наименованию.
Разработанный способ отличается высокой производительностью, не требует пробоподготовки и может быть востребован для решения задач быстрого выявления фальсификата или просто некачественного чая. Предложенный в работе подход может также использоваться для анализа и классификации других объектов биологического происхождения.
Источник: ГЕОХИ РАН.