Технически решение опирается на доработанную схему Forward‑Backward. В нестабильной среде стандартный алгоритм усредняет возможные сценарии и допускает ошибки. Чтобы избежать этого, ученые дополнили базовую архитектуру двумя модификациями. В результате модель точнее соотносит характеристики окружения с подходящими решениями и переносит опыт на ситуации, отсутствовавшие в обучающей выборке.
Решение особенно актуально для физического ИИ, так как модели обучают в симуляциях, а используют в реальном мире. Помимо ускорения адаптации, подход улучшает взаимодействие роботов с другими агентами и людьми, а также снижает потребность в дообучении. Следующий этап — интеграция метода в робототехнические платформы и испытания в промышленной среде.