Искусственный интеллект активно применяется на футбольном поле. Технологии анализируют отдельные действия игроков, определяют положения «вне игры» (SOAT) и помогают VAR, чтобы решения арбитров были справедливыми.
До недавнего времени такие решения были доступны только на крупных соревнованиях, так как для каждого стадиона требуются 10–12 идеально синхронизированных камер, следящих за ходом матча. Швейцарская высшая техническая школа Цюриха и FIFA изучают, как сделать ИИ-системы доступными как можно большему количеству игроков в футбол по всему миру.
Основная идея — упростить систему, сведя количество камер к одной. Например, использовать камеру для трансляции игры. Полноценно это станет возможным еще через несколько лет, но швейцарские эксперты серьезно продвинулись в этом направлении.
Исследователи оцифровали почти 50 минут видеозаписей различных матчей, сыгранных на чемпионате мира 2022 года. При этом учитывались дополнительные данные, включая размеры конкретных игровых полей. Эксперты создали набор данных, содержащий более 2,5 миллиона трехмерных изображений игроков.
Эти данные необходимы для того, что в машинном обучении называется оценкой позы. В данном случае речь идет о монокулярной оценке: компьютер использует изображения с одной камеры, чтобы определить, где находятся люди или объекты в пространстве, как они движутся и куда направляются. Таким образом, он анализирует позу и траекторию каждого игрока без информации о глубине, которую могла бы предоставить 3D-камера или несколько камер.
У этого метода есть и минус — он подходит для прогнозирования поз отдельных игроков. Компьютеру сложно отслеживать несколько человек, особенно на больших расстояниях. Кроме того, при работе с одной камерой возникают помехи от игроков, размытости и проблемы с калибровкой камеры.
Для решения этой проблемы эксперты сначала откалибровали и сравнили видео с разных камер, установленных на стадионе, чтобы избежать искажений информации. Затем поверх изображений были наложены цифровые опорные линии. При идеальной калибровке эти линии идеально совпадают с реальными, а цифровая модель SMPL может использовать данные статичных камер для оценки поз и траекторий игроков.
Полученные данные передаются откалиброванной подвижной вещательной камере. Если цифровые и реальные данные наложены правильно, то можно в цифровом виде в трех измерениях отобразить точное положение, траекторию и позу отдельных игроков на поле, по сути, с помощью только одной камеры.
Авторы исследования поделились своим банком «поз» с другими исследователями. Последние смогут обучить свои системы и разработать алгоритмы, чтобы в будущем можно было проводить точный анализ с помощью одной подвижной камеры. С этой целью ФИФА запустила конкурс инноваций, в котором уже принимают участие более 150 исследователей со всего мира, сообщает Tech Explore.