Повышение узнаваемости с помощью Sensor Fusion

Головоломка: Учитывая следующую последовательность «ABCDFGHJ», предскажите следующий символ. Нахлынули воспоминания о тестах на пригодность в колледже? Возможно, вступительный экзамен в MENSA? Это может помочь, если вам скажут, что символы представляют собой буквы в последовательности из английского алфавита.

Было бы разумнее, если бы я сказал вам, что недавно пролил диетическую газировку на клавиатуру, и третий ряд клавиш больше не работает. Итак, ваша догадка — «К»? Ну, на самом деле, следующая буква в последовательности — «Л». К-ключ был загажен горчицей некоторое время назад. Принимая во внимание, что у меня есть дурная привычка перекусывать за компьютером, важно отметить, насколько дополнительная релевантная информация может быть чрезвычайно ценной для процессов подведения итогов и прогнозирования.

«Чем больше, тем лучше» определенно было главным боевым кличем сообщества специалистов по сбору данных за последние два десятилетия. Внедрение персонального компьютера в лабораторию облегчило сбор неисчислимых терабайт данных, которые ранее собирались лишь горсткой техников, одетых в защитные очки в черной оправе и лабораторные халаты. Появление магнитных и оптических носителей информации привело к тому, что буфер обмена оказался в клубе хлыстов, а технические специалисты перешли от задачи записи данных к управлению данными и их анализу. Индивидуальные лабораторные ноутбуки вытесняются сетевыми лабораторными информационными системами (LIMS), которые извлекают выгоду из достижений информационных технологий (ИТ) в оборудовании и программном обеспечении, разработанном для систем планирования ресурсов предприятия (ERP).

Обработка больших объемов данных не является новым требованием и является предметом изучения статистиков на протяжении сотен лет. В то время как химический анализ только начинал появляться из-под покрова алхимии, правители поддерживали базы данных субъектов, чтобы взимать правильную сумму налогов и управлять защитой своих владений. Примерно в начале прошлого века Уильям С. Госсет, статистик, работавший в пивоваренной компании Guinness в Ирландии, разработал таблицу вероятностных распределений, используемую для сравнения среднего значения небольшого числа измерений со средним значением и стандартным отклонением гораздо большая коллекция. Со временем пивоваренная компания собрала внушительный архив значений анализа, подтверждающих качество их продукта, и таблицы Госсетта определяли, отличаются ли текущие партии от лучших за прошлые периоды, допуская при этом случайные колебания погрешности измерения. Понимая академическую значимость своих разработок, Госсет стремился публиковаться в открытой литературе. Однако его работодатель потребовал, чтобы он публиковался под псевдонимом «Студент». Критерии «Стьюдента-t» все еще используются сегодня, чтобы определить, отличается ли образец от известного стандарта, отличаются ли два образца друг от друга или различаются ли два метода отбора проб. Эти тесты могут использоваться для контроля качества, для доказательства невиновности обвиняемого преступника или для подтверждения альтернативного метода анализа.

Множество методов инструментального анализа, доступных в настоящее время для обеспечения качества и контроля качества, могут использоваться для различения приемлемого и неприемлемого продукта, к сожалению, часто постфактум. Что необходимо, так это способность включать эти многочисленные измерения в процессы, которые их породили, и направлять производство к оптимальному продукту, а не оценивать выходной результат «годен/не годен». Подобно прогрессу курса исчисления, задача сбора и анализа данных развивается от дифференциации к интеграции.

Поначалу может показаться тривиальным интегрирование дополнительных значений, полученных от различных датчиков и приборов. Просто включите эти новые значения вместе с другими и создайте обновленное среднее значение. Сложность заключается в том, что разные датчики могут иметь разное разрешение и точность. Чаще всего они выдают данные с разной скоростью и в уникальных форматах, а значения могут быть избыточными или даже противоречить другим датчикам. Процесс интеграции этих различных значений в достоверную оценку реальности, имеющую более высокое качество и надежность, чем те, которые обеспечиваются отдельными значениями, известен как слияние данных или датчиков. Люди объединяют измерения своих органов зрения, слуха, обоняния, вкуса и осязания, чтобы обеспечить осведомленность о своей текущей среде. На более высоком уровне обработка изображений и речи обеспечивает каналы связи с чрезвычайно высокой пропускной способностью. Sensor fusion стремится имитировать эти способности на машинном уровне, чтобы наши фабрики и инструменты лучше «осведомлялись» о своей производительности.

В 1960 году Рудольф Э. Калман опубликовал один из наиболее широко используемых алгоритмов объединения датчиков, известный сегодня как фильтр Калмана. Он использует набор математических уравнений для моделирования текущего состояния параметров стохастической системы с точки зрения их текущих значений и стандартных отклонений. Алгоритм предсказывает будущие значения параметров состояния, используя экстраполяцию модели, и предсказания сравниваются с фактическими дополнительными измерениями. Взвешенные по соответствующей известной точности и прецизионности датчиков, прогнозируемые значения параметров модели корректируются, чтобы отражать фактически измеренные значения состояния. Таким образом, фильтр Калмана итеративно прогнозирует параметры своей модели и корректирует их, используя последние доступные (но зашумленные) показания датчика, чтобы достичь оптимальной оценки фактических значений. Как было первоначально предложено, фильтр Калмана использует линейные модели для предсказания поведения линейных систем. Однако расширенный фильтр Калмана (EKF) был разработан для работы с нелинейными системами.

В дополнение к прогнозированию и корректировке значений модели по дискретным значениям времени фильтр Калмана можно использовать для включения данных от нескольких датчиков, полученных в любом отдельном состоянии во времени. По мере того, как в модель фильтра Калмана передаются дополнительные значения, его оценка текущего состояния оптимизируется на основе всех доступных данных датчиков, что очень похоже на входные данные наших пяти органов чувств. Индустрия робототехники широко использовала фильтр Калмана в своих приложениях слияния датчиков для беспилотных боевых летательных аппаратов (UCAV). Объединение показаний датчиков скорости, акселерометров, датчиков давления и транспондеров глобальной системы позиционирования (GPS) позволяет БПЛА летать автономно, в то время как пилот с дистанционным управлением концентрируется на навигации и задачах.

Исследования по разработке дополнительных алгоритмов объединения датчиков очень активны и обычно используют инструменты сообщества оптимизации. Нечеткая логика, нейронные сети, генетические алгоритмы и градиентный поиск находят применение в слиянии датчиков. Производители изучают возможность применения этого метода для интеллектуального управления технологическими процессами (IPC); способность динамически регулировать параметры управления, необходимые для производства бездефектного продукта или работы машины с почти оптимальной эффективностью. Оборонная промышленность разрабатывает его для многоспектральной визуализации полей сражений, а медицинская промышленность стремится объединить изображения, полученные с помощью рентгенографии, МРТ и ультразвуковой диагностики, для более точной диагностики.

Исследователи также работают над «виртуальными датчиками», которые позволяют интерполировать значение в любом пространственном положении X-Y-Z путем объединения данных, полученных от сети распределенных датчиков. Например, команда мобильных роботов, исследующих дно океана, поверхность далекой планеты или играющих в футбол в лаборатории, может сообщать своим товарищам по команде свои индивидуальные взгляды на окружающую среду. Каждый робот может объединять виды, полученные с разных позиций и под разными углами, чтобы создать изображение того, что находится за препятствием, которое в настоящее время закрывает его собственный обзор. Все эти достижения стали практическими благодаря развитию сенсорных технологий, сетей распределения данных, вычислительной мощности и исследований алгоритмов за последние два десятилетия. Точно так же, как персональный компьютер создал совершенно новую экономику в середине 1980-х годов, технологии данных, информации и знаний готовы создать еще больше.

Первоначально этот материал был опубликован как редакционная статья в журнале Scientific Computing and Instrumentation 20:10, сентябрь 2003 г., стр. 16–17.

Уильям Л. Уивер — адъюнкт-профессор кафедры интегрированных наук, бизнеса и технологий Университета Ла Саль в Филадельфии, штат Пенсильвания, США. Он имеет B.S. Получил двойную степень по химии и физике и получил докторскую степень. в аналитической химии с опытом в сверхбыстрой лазерной спектроскопии. Он преподает, пишет и рассказывает о применении системного мышления для разработки новых продуктов и инноваций.