";123 Array
(
    [NAME] => А если совместить с GPT? Большие языковые модели в антропоморфных роботах
    [~NAME] => А если совместить с GPT? Большие языковые модели в антропоморфных роботах
    [TAGS] => искусственный интеллект, андроидные, прогнозы, социокультурный аспект
    [~TAGS] => искусственный интеллект, андроидные, прогнозы, социокультурный аспект
    [PREVIEW_TEXT] => 

В мире началась гонка человекоподобной робототехники, многие компании уже предлагают уникальные продукты. Однако разум роботов — это отдельная масштабная задача, и не всем по карману разработка своих мощных ИИ. А что, если брать готовые решения на основе больших языковых моделей?

[~PREVIEW_TEXT] =>

В мире началась гонка человекоподобной робототехники, многие компании уже предлагают уникальные продукты. Однако разум роботов — это отдельная масштабная задача, и не всем по карману разработка своих мощных ИИ. А что, если брать готовые решения на основе больших языковых моделей?

[PREVIEW_PICTURE] => Array ( [ID] => 946 [TIMESTAMP_X] => 27.03.2024 13:25:02 [MODULE_ID] => iblock [HEIGHT] => 512 [WIDTH] => 1024 [FILE_SIZE] => 71021 [CONTENT_TYPE] => image/jpeg [SUBDIR] => iblock/ed4/xqlp37uzl3j2buz3kl711mbffdikkn00 [FILE_NAME] => IMG_2862.jpg [ORIGINAL_NAME] => IMG_2862.jpg [DESCRIPTION] => [HANDLER_ID] => [EXTERNAL_ID] => 61d0fe627da3ae85d069163d8762be31 [VERSION_ORIGINAL_ID] => [META] => [SRC] => /upload/iblock/ed4/xqlp37uzl3j2buz3kl711mbffdikkn00/IMG_2862.jpg [UNSAFE_SRC] => /upload/iblock/ed4/xqlp37uzl3j2buz3kl711mbffdikkn00/IMG_2862.jpg [SAFE_SRC] => /upload/iblock/ed4/xqlp37uzl3j2buz3kl711mbffdikkn00/IMG_2862.jpg [ALT] => А если совместить с GPT? Большие языковые модели в антропоморфных роботах [TITLE] => А если совместить с GPT? Большие языковые модели в антропоморфных роботах ) [~PREVIEW_PICTURE] => 946 [DETAIL_TEXT] =>

К примеру, робот Ameca, разработанный компанией Engineered Arts в 2021 году, применяет модель GPT-3 от OpenAI. Благодаря используемым языковым моделям Ameca распознает человеческую речь и генерирует ответы, что позволяет роботу взаимодействовать с людьми более естественно. Кроме того, робот может реалистично передавать различные эмоции, которые испытывают люди: удивление, недовольство, отвращение, восторг и др.

Разработчики двигаются дальше, обучая Ameca разным языкам. Они тестировали сразу две модели — GPT-3 и GPT-4, но последняя замедлила скорость реакции и ухудшила реалистичность. Для разговора и перевода на другой язык робот Ameca использовал языковую модель GPT-3, а для распознавания речи и генерации голоса — модель DeepL. Компания не раз выкладывала видео, где робот достаточно складно отвечает на вопросы людей. Например, однажды у Ameca спросили, не собираются ли роботы захватывать мир, на что устройство ответило: «Некоторые говорят, что мы — угроза. Некоторые думают, что мы возьмем верх и человечеству придет конец, но мы просто хотим помочь».

GPT-4 пригодилась для другого робота — японского Alter3. Разработчики также отметили естественность общения устройства с этой языковой моделью. Alter3 может копировать действия людей, например, селфи, бросание мяча, поедание попкорна и игру на воображаемой гитаре.

Разработка OpenAI также была использована Boston Dynamics, которая создала с помощью этой языковой модели робособаку-экскурсовода. В основе работы этого устройства лежат фундаментальные модели — крупные системы искусственного интеллекта, обученные на огромных объемах данных. Эти модели, обладающие миллионами параметров, способны к «эмерджентному поведению», что позволяет им адаптироваться под разные ситуации.

Spot использует GPT-4, наборы данных Visual Question Answering (VQA) и программу распознавания речи Whisper от OpenAI для реалистичного общения с человеком. Инженеры Boston Dynamics разработали специальные скрипты для руководства действиями Spot. Они позволяют роботу не только описывать объекты, но и демонстрировать определенную «личность» во время экскурсий.

Многие компании-производители антропоморфных роботов используют собственные наработки в области AI и языковых моделей, а также могут интегрировать сторонние разработки, включая общедоступные языковые модели. Информация о точных технологиях, используемых в каждом случае, часто не раскрывается в полном объеме. Рассмотрим еще несколько примеров того, как работают «мозги» антропоморфных роботов.

Помимо Spot, у Boston Dynamics есть еще одна известная разработка — гуманоидный робот Atlas. Он может работать на открытом воздухе и в помещениях, отлично балансирует и маневрирует среди препятствий. Все это происходит благодаря стереовидению, датчикам расстояния и другим сенсорам, которые позволяют Atlas ориентироваться в пространстве. Управление роботом происходит на двух уровнях: с помощью поведенческого контроллера, который выдает команды, и с помощью низкоуровневого контроллера, генерирующего команды для суставов. Это особенно важно для передвижения с предметами в руках, так как работа с такими объектами требует от робота сложных вычислений, чтобы корректировать его баланс и координацию движений.

Boston Dynamics также активно работает над улучшением системы восприятия и программного обеспечения Atlas, включая разработку симулятора для планирования движений и тестирования новых функций. В частности, улучшение зрительных способностей робота и его способности адаптироваться к меняющейся среде являются ключевыми областями для будущего развития.

Антропоморфный робот Digit, разработанный компанией Agility Robotics, демонстрирует впечатляющую способность понимать и выполнять команды, заданные на естественном языке. Это стало возможным благодаря интеграции больших языковых моделей в систему управления роботом.

Примером возможностей Digit является недавняя демонстрация его навыков, а именно — перемещения красного ящика на высокую башню после команды «возьми ящик цвета светового меча Дарта Вейдера и перемести его на самую высокую башню в первом ряду». Процесс, хотя и медленный, был выполнен с удивительной точностью и вниманием к деталям.

Разработчики из Agility Robotics объясняют, что интеграция больших языковых моделей в робота позволяет ему понимать сложные естественные языковые команды и адаптироваться к разнообразным рабочим задачам без дополнительного программирования.

Optimus, выпускаемый компанией Tesla, предназначен для помощи человеку в повседневной жизни и выполнения бытовых задач. Отличительной особенностью подхода Tesla в разработке Optimus является интеграция технологий искусственного интеллекта и машинного зрения, разработанных для автопилота электромобилей компании. Это дает роботу преимущество в адаптации к сложным и меняющимся условиям окружающей среды.

Таким образом, интеграция больших языковых моделей в роботов открывает новые горизонты для развития автономных систем. Способность роботов понимать сложные команды и адаптироваться к меняющимся условиям может значительно улучшить их эффективность и функциональность в реальных условиях.

Из приведенных примеров можно сделать вывод о том, что компании-производители робототехники начали интегрировать в свои разработки уже готовые большие языковые модели. Это связано с рядом причин, важнейшая из которых — экономия времени и ресурсов.

Разработка собственной языковой модели с нуля требует значительных временных и финансовых затрат. Использование готовых моделей позволяет компаниям сосредоточить свои ресурсы на других аспектах разработки роботов, таких как физическое проектирование, моторика и сенсорные системы.

Кроме того, готовые языковые модели часто поддерживаются и обновляются их разработчиками, что обеспечивает их актуальность и улучшение функциональности со временем. Это избавляет робототехнические компании от необходимости самостоятельно заниматься постоянным обновлением.

По мере развития больших языковых моделей мы можем ожидать, что роботы станут еще более адаптивными в общении с людьми, способными вести естественные и глубокие диалоги, учитывая контекст и индивидуальные особенности человека. Это будет способствовать широкому принятию роботов в качестве помощников в домашних условиях, в образовании, медицине и сфере обслуживания.

Также ожидается, что языковые модели будут взаимодействовать с системами распознавания эмоций, что позволит роботам лучше понимать и реагировать на эмоциональное состояние человека. Это может помочь в терапии, уходе за пожилыми и в качестве компаньонов для одиноких людей.

В целом прогнозируется, что большие языковые модели будут играть ключевую роль в эволюции антропоморфных роботов, существенно расширяя их возможности и спектр применения.

[~DETAIL_TEXT] =>

К примеру, робот Ameca, разработанный компанией Engineered Arts в 2021 году, применяет модель GPT-3 от OpenAI. Благодаря используемым языковым моделям Ameca распознает человеческую речь и генерирует ответы, что позволяет роботу взаимодействовать с людьми более естественно. Кроме того, робот может реалистично передавать различные эмоции, которые испытывают люди: удивление, недовольство, отвращение, восторг и др.

Разработчики двигаются дальше, обучая Ameca разным языкам. Они тестировали сразу две модели — GPT-3 и GPT-4, но последняя замедлила скорость реакции и ухудшила реалистичность. Для разговора и перевода на другой язык робот Ameca использовал языковую модель GPT-3, а для распознавания речи и генерации голоса — модель DeepL. Компания не раз выкладывала видео, где робот достаточно складно отвечает на вопросы людей. Например, однажды у Ameca спросили, не собираются ли роботы захватывать мир, на что устройство ответило: «Некоторые говорят, что мы — угроза. Некоторые думают, что мы возьмем верх и человечеству придет конец, но мы просто хотим помочь».

GPT-4 пригодилась для другого робота — японского Alter3. Разработчики также отметили естественность общения устройства с этой языковой моделью. Alter3 может копировать действия людей, например, селфи, бросание мяча, поедание попкорна и игру на воображаемой гитаре.

Разработка OpenAI также была использована Boston Dynamics, которая создала с помощью этой языковой модели робособаку-экскурсовода. В основе работы этого устройства лежат фундаментальные модели — крупные системы искусственного интеллекта, обученные на огромных объемах данных. Эти модели, обладающие миллионами параметров, способны к «эмерджентному поведению», что позволяет им адаптироваться под разные ситуации.

Spot использует GPT-4, наборы данных Visual Question Answering (VQA) и программу распознавания речи Whisper от OpenAI для реалистичного общения с человеком. Инженеры Boston Dynamics разработали специальные скрипты для руководства действиями Spot. Они позволяют роботу не только описывать объекты, но и демонстрировать определенную «личность» во время экскурсий.

Многие компании-производители антропоморфных роботов используют собственные наработки в области AI и языковых моделей, а также могут интегрировать сторонние разработки, включая общедоступные языковые модели. Информация о точных технологиях, используемых в каждом случае, часто не раскрывается в полном объеме. Рассмотрим еще несколько примеров того, как работают «мозги» антропоморфных роботов.

Помимо Spot, у Boston Dynamics есть еще одна известная разработка — гуманоидный робот Atlas. Он может работать на открытом воздухе и в помещениях, отлично балансирует и маневрирует среди препятствий. Все это происходит благодаря стереовидению, датчикам расстояния и другим сенсорам, которые позволяют Atlas ориентироваться в пространстве. Управление роботом происходит на двух уровнях: с помощью поведенческого контроллера, который выдает команды, и с помощью низкоуровневого контроллера, генерирующего команды для суставов. Это особенно важно для передвижения с предметами в руках, так как работа с такими объектами требует от робота сложных вычислений, чтобы корректировать его баланс и координацию движений.

Boston Dynamics также активно работает над улучшением системы восприятия и программного обеспечения Atlas, включая разработку симулятора для планирования движений и тестирования новых функций. В частности, улучшение зрительных способностей робота и его способности адаптироваться к меняющейся среде являются ключевыми областями для будущего развития.

Антропоморфный робот Digit, разработанный компанией Agility Robotics, демонстрирует впечатляющую способность понимать и выполнять команды, заданные на естественном языке. Это стало возможным благодаря интеграции больших языковых моделей в систему управления роботом.

Примером возможностей Digit является недавняя демонстрация его навыков, а именно — перемещения красного ящика на высокую башню после команды «возьми ящик цвета светового меча Дарта Вейдера и перемести его на самую высокую башню в первом ряду». Процесс, хотя и медленный, был выполнен с удивительной точностью и вниманием к деталям.

Разработчики из Agility Robotics объясняют, что интеграция больших языковых моделей в робота позволяет ему понимать сложные естественные языковые команды и адаптироваться к разнообразным рабочим задачам без дополнительного программирования.

Optimus, выпускаемый компанией Tesla, предназначен для помощи человеку в повседневной жизни и выполнения бытовых задач. Отличительной особенностью подхода Tesla в разработке Optimus является интеграция технологий искусственного интеллекта и машинного зрения, разработанных для автопилота электромобилей компании. Это дает роботу преимущество в адаптации к сложным и меняющимся условиям окружающей среды.

Таким образом, интеграция больших языковых моделей в роботов открывает новые горизонты для развития автономных систем. Способность роботов понимать сложные команды и адаптироваться к меняющимся условиям может значительно улучшить их эффективность и функциональность в реальных условиях.

Из приведенных примеров можно сделать вывод о том, что компании-производители робототехники начали интегрировать в свои разработки уже готовые большие языковые модели. Это связано с рядом причин, важнейшая из которых — экономия времени и ресурсов.

Разработка собственной языковой модели с нуля требует значительных временных и финансовых затрат. Использование готовых моделей позволяет компаниям сосредоточить свои ресурсы на других аспектах разработки роботов, таких как физическое проектирование, моторика и сенсорные системы.

Кроме того, готовые языковые модели часто поддерживаются и обновляются их разработчиками, что обеспечивает их актуальность и улучшение функциональности со временем. Это избавляет робототехнические компании от необходимости самостоятельно заниматься постоянным обновлением.

По мере развития больших языковых моделей мы можем ожидать, что роботы станут еще более адаптивными в общении с людьми, способными вести естественные и глубокие диалоги, учитывая контекст и индивидуальные особенности человека. Это будет способствовать широкому принятию роботов в качестве помощников в домашних условиях, в образовании, медицине и сфере обслуживания.

Также ожидается, что языковые модели будут взаимодействовать с системами распознавания эмоций, что позволит роботам лучше понимать и реагировать на эмоциональное состояние человека. Это может помочь в терапии, уходе за пожилыми и в качестве компаньонов для одиноких людей.

В целом прогнозируется, что большие языковые модели будут играть ключевую роль в эволюции антропоморфных роботов, существенно расширяя их возможности и спектр применения.

[DETAIL_PICTURE] => Array ( [ID] => 947 [TIMESTAMP_X] => 27.03.2024 13:25:02 [MODULE_ID] => iblock [HEIGHT] => 768 [WIDTH] => 1536 [FILE_SIZE] => 189108 [CONTENT_TYPE] => image/jpeg [SUBDIR] => iblock/549/feg5r5cfz6ux0s6wdxd1r6uj5qrzp1ac [FILE_NAME] => IMG_2862.jpg [ORIGINAL_NAME] => IMG_2862.jpg [DESCRIPTION] => [HANDLER_ID] => [EXTERNAL_ID] => 8e48637d5f37a4901e2c79c782dd53bf [VERSION_ORIGINAL_ID] => [META] => [SRC] => /upload/iblock/549/feg5r5cfz6ux0s6wdxd1r6uj5qrzp1ac/IMG_2862.jpg [UNSAFE_SRC] => /upload/iblock/549/feg5r5cfz6ux0s6wdxd1r6uj5qrzp1ac/IMG_2862.jpg [SAFE_SRC] => /upload/iblock/549/feg5r5cfz6ux0s6wdxd1r6uj5qrzp1ac/IMG_2862.jpg [ALT] => А если совместить с GPT? Большие языковые модели в антропоморфных роботах [TITLE] => А если совместить с GPT? Большие языковые модели в антропоморфных роботах ) [~DETAIL_PICTURE] => 947 [DATE_ACTIVE_FROM] => 29.02.2024 [~DATE_ACTIVE_FROM] => 29.02.2024 [ID] => 413 [~ID] => 413 [IBLOCK_ID] => 1 [~IBLOCK_ID] => 1 [IBLOCK_SECTION_ID] => 9 [~IBLOCK_SECTION_ID] => 9 [DETAIL_TEXT_TYPE] => html [~DETAIL_TEXT_TYPE] => html [PREVIEW_TEXT_TYPE] => html [~PREVIEW_TEXT_TYPE] => html [TIMESTAMP_X] => 27.03.2024 13:25:02 [~TIMESTAMP_X] => 27.03.2024 13:25:02 [ACTIVE_FROM_X] => 2024-02-29 00:00:00 [~ACTIVE_FROM_X] => 2024-02-29 00:00:00 [ACTIVE_FROM] => 29.02.2024 [~ACTIVE_FROM] => 29.02.2024 [LIST_PAGE_URL] => / [~LIST_PAGE_URL] => / [DETAIL_PAGE_URL] => /it-ai/a-esli-sovmestit-s-gpt-bolshie-yazykovye-modeli-v-antropomorfnykh-robotakh/ [~DETAIL_PAGE_URL] => /it-ai/a-esli-sovmestit-s-gpt-bolshie-yazykovye-modeli-v-antropomorfnykh-robotakh/ [LANG_DIR] => / [~LANG_DIR] => / [CODE] => a-esli-sovmestit-s-gpt-bolshie-yazykovye-modeli-v-antropomorfnykh-robotakh [~CODE] => a-esli-sovmestit-s-gpt-bolshie-yazykovye-modeli-v-antropomorfnykh-robotakh [EXTERNAL_ID] => 413 [~EXTERNAL_ID] => 413 [IBLOCK_TYPE_ID] => news [~IBLOCK_TYPE_ID] => news [IBLOCK_CODE] => news_s1 [~IBLOCK_CODE] => news_s1 [IBLOCK_EXTERNAL_ID] => furniture_news_s1 [~IBLOCK_EXTERNAL_ID] => furniture_news_s1 [LID] => s1 [~LID] => s1 [NAV_RESULT] => [NAV_CACHED_DATA] => [DISPLAY_ACTIVE_FROM] => 29.02.2024 [IPROPERTY_VALUES] => Array ( [SECTION_META_TITLE] => А если совместить с GPT? Большие языковые модели в антропоморфных роботах [ELEMENT_META_TITLE] => А если совместить с GPT? Большие языковые модели в антропоморфных роботах ) [FIELDS] => Array ( [NAME] => А если совместить с GPT? Большие языковые модели в антропоморфных роботах [TAGS] => искусственный интеллект, андроидные, прогнозы, социокультурный аспект [PREVIEW_TEXT] =>

В мире началась гонка человекоподобной робототехники, многие компании уже предлагают уникальные продукты. Однако разум роботов — это отдельная масштабная задача, и не всем по карману разработка своих мощных ИИ. А что, если брать готовые решения на основе больших языковых моделей?

[PREVIEW_PICTURE] => Array ( [ID] => 946 [TIMESTAMP_X] => 27.03.2024 13:25:02 [MODULE_ID] => iblock [HEIGHT] => 512 [WIDTH] => 1024 [FILE_SIZE] => 71021 [CONTENT_TYPE] => image/jpeg [SUBDIR] => iblock/ed4/xqlp37uzl3j2buz3kl711mbffdikkn00 [FILE_NAME] => IMG_2862.jpg [ORIGINAL_NAME] => IMG_2862.jpg [DESCRIPTION] => [HANDLER_ID] => [EXTERNAL_ID] => 61d0fe627da3ae85d069163d8762be31 [VERSION_ORIGINAL_ID] => [META] => [SRC] => /upload/iblock/ed4/xqlp37uzl3j2buz3kl711mbffdikkn00/IMG_2862.jpg [UNSAFE_SRC] => /upload/iblock/ed4/xqlp37uzl3j2buz3kl711mbffdikkn00/IMG_2862.jpg [SAFE_SRC] => /upload/iblock/ed4/xqlp37uzl3j2buz3kl711mbffdikkn00/IMG_2862.jpg [ALT] => А если совместить с GPT? Большие языковые модели в антропоморфных роботах [TITLE] => А если совместить с GPT? Большие языковые модели в антропоморфных роботах ) [DETAIL_TEXT] =>

К примеру, робот Ameca, разработанный компанией Engineered Arts в 2021 году, применяет модель GPT-3 от OpenAI. Благодаря используемым языковым моделям Ameca распознает человеческую речь и генерирует ответы, что позволяет роботу взаимодействовать с людьми более естественно. Кроме того, робот может реалистично передавать различные эмоции, которые испытывают люди: удивление, недовольство, отвращение, восторг и др.

Разработчики двигаются дальше, обучая Ameca разным языкам. Они тестировали сразу две модели — GPT-3 и GPT-4, но последняя замедлила скорость реакции и ухудшила реалистичность. Для разговора и перевода на другой язык робот Ameca использовал языковую модель GPT-3, а для распознавания речи и генерации голоса — модель DeepL. Компания не раз выкладывала видео, где робот достаточно складно отвечает на вопросы людей. Например, однажды у Ameca спросили, не собираются ли роботы захватывать мир, на что устройство ответило: «Некоторые говорят, что мы — угроза. Некоторые думают, что мы возьмем верх и человечеству придет конец, но мы просто хотим помочь».

GPT-4 пригодилась для другого робота — японского Alter3. Разработчики также отметили естественность общения устройства с этой языковой моделью. Alter3 может копировать действия людей, например, селфи, бросание мяча, поедание попкорна и игру на воображаемой гитаре.

Разработка OpenAI также была использована Boston Dynamics, которая создала с помощью этой языковой модели робособаку-экскурсовода. В основе работы этого устройства лежат фундаментальные модели — крупные системы искусственного интеллекта, обученные на огромных объемах данных. Эти модели, обладающие миллионами параметров, способны к «эмерджентному поведению», что позволяет им адаптироваться под разные ситуации.

Spot использует GPT-4, наборы данных Visual Question Answering (VQA) и программу распознавания речи Whisper от OpenAI для реалистичного общения с человеком. Инженеры Boston Dynamics разработали специальные скрипты для руководства действиями Spot. Они позволяют роботу не только описывать объекты, но и демонстрировать определенную «личность» во время экскурсий.

Многие компании-производители антропоморфных роботов используют собственные наработки в области AI и языковых моделей, а также могут интегрировать сторонние разработки, включая общедоступные языковые модели. Информация о точных технологиях, используемых в каждом случае, часто не раскрывается в полном объеме. Рассмотрим еще несколько примеров того, как работают «мозги» антропоморфных роботов.

Помимо Spot, у Boston Dynamics есть еще одна известная разработка — гуманоидный робот Atlas. Он может работать на открытом воздухе и в помещениях, отлично балансирует и маневрирует среди препятствий. Все это происходит благодаря стереовидению, датчикам расстояния и другим сенсорам, которые позволяют Atlas ориентироваться в пространстве. Управление роботом происходит на двух уровнях: с помощью поведенческого контроллера, который выдает команды, и с помощью низкоуровневого контроллера, генерирующего команды для суставов. Это особенно важно для передвижения с предметами в руках, так как работа с такими объектами требует от робота сложных вычислений, чтобы корректировать его баланс и координацию движений.

Boston Dynamics также активно работает над улучшением системы восприятия и программного обеспечения Atlas, включая разработку симулятора для планирования движений и тестирования новых функций. В частности, улучшение зрительных способностей робота и его способности адаптироваться к меняющейся среде являются ключевыми областями для будущего развития.

Антропоморфный робот Digit, разработанный компанией Agility Robotics, демонстрирует впечатляющую способность понимать и выполнять команды, заданные на естественном языке. Это стало возможным благодаря интеграции больших языковых моделей в систему управления роботом.

Примером возможностей Digit является недавняя демонстрация его навыков, а именно — перемещения красного ящика на высокую башню после команды «возьми ящик цвета светового меча Дарта Вейдера и перемести его на самую высокую башню в первом ряду». Процесс, хотя и медленный, был выполнен с удивительной точностью и вниманием к деталям.

Разработчики из Agility Robotics объясняют, что интеграция больших языковых моделей в робота позволяет ему понимать сложные естественные языковые команды и адаптироваться к разнообразным рабочим задачам без дополнительного программирования.

Optimus, выпускаемый компанией Tesla, предназначен для помощи человеку в повседневной жизни и выполнения бытовых задач. Отличительной особенностью подхода Tesla в разработке Optimus является интеграция технологий искусственного интеллекта и машинного зрения, разработанных для автопилота электромобилей компании. Это дает роботу преимущество в адаптации к сложным и меняющимся условиям окружающей среды.

Таким образом, интеграция больших языковых моделей в роботов открывает новые горизонты для развития автономных систем. Способность роботов понимать сложные команды и адаптироваться к меняющимся условиям может значительно улучшить их эффективность и функциональность в реальных условиях.

Из приведенных примеров можно сделать вывод о том, что компании-производители робототехники начали интегрировать в свои разработки уже готовые большие языковые модели. Это связано с рядом причин, важнейшая из которых — экономия времени и ресурсов.

Разработка собственной языковой модели с нуля требует значительных временных и финансовых затрат. Использование готовых моделей позволяет компаниям сосредоточить свои ресурсы на других аспектах разработки роботов, таких как физическое проектирование, моторика и сенсорные системы.

Кроме того, готовые языковые модели часто поддерживаются и обновляются их разработчиками, что обеспечивает их актуальность и улучшение функциональности со временем. Это избавляет робототехнические компании от необходимости самостоятельно заниматься постоянным обновлением.

По мере развития больших языковых моделей мы можем ожидать, что роботы станут еще более адаптивными в общении с людьми, способными вести естественные и глубокие диалоги, учитывая контекст и индивидуальные особенности человека. Это будет способствовать широкому принятию роботов в качестве помощников в домашних условиях, в образовании, медицине и сфере обслуживания.

Также ожидается, что языковые модели будут взаимодействовать с системами распознавания эмоций, что позволит роботам лучше понимать и реагировать на эмоциональное состояние человека. Это может помочь в терапии, уходе за пожилыми и в качестве компаньонов для одиноких людей.

В целом прогнозируется, что большие языковые модели будут играть ключевую роль в эволюции антропоморфных роботов, существенно расширяя их возможности и спектр применения.

[DETAIL_PICTURE] => Array ( [ID] => 947 [TIMESTAMP_X] => 27.03.2024 13:25:02 [MODULE_ID] => iblock [HEIGHT] => 768 [WIDTH] => 1536 [FILE_SIZE] => 189108 [CONTENT_TYPE] => image/jpeg [SUBDIR] => iblock/549/feg5r5cfz6ux0s6wdxd1r6uj5qrzp1ac [FILE_NAME] => IMG_2862.jpg [ORIGINAL_NAME] => IMG_2862.jpg [DESCRIPTION] => [HANDLER_ID] => [EXTERNAL_ID] => 8e48637d5f37a4901e2c79c782dd53bf [VERSION_ORIGINAL_ID] => [META] => [SRC] => /upload/iblock/549/feg5r5cfz6ux0s6wdxd1r6uj5qrzp1ac/IMG_2862.jpg [UNSAFE_SRC] => /upload/iblock/549/feg5r5cfz6ux0s6wdxd1r6uj5qrzp1ac/IMG_2862.jpg [SAFE_SRC] => /upload/iblock/549/feg5r5cfz6ux0s6wdxd1r6uj5qrzp1ac/IMG_2862.jpg [ALT] => А если совместить с GPT? Большие языковые модели в антропоморфных роботах [TITLE] => А если совместить с GPT? Большие языковые модели в антропоморфных роботах ) [DATE_ACTIVE_FROM] => 29.02.2024 ) [PROPERTIES] => Array ( [AUTHOR] => Array ( [ID] => 9 [TIMESTAMP_X] => 2024-04-16 13:42:26 [IBLOCK_ID] => 1 [NAME] => Автор статьи [ACTIVE] => Y [SORT] => 500 [CODE] => AUTHOR [DEFAULT_VALUE] => [PROPERTY_TYPE] => S [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => L [MULTIPLE] => N [XML_ID] => [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => N [SEARCHABLE] => N [FILTRABLE] => N [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => [USER_TYPE_SETTINGS] => a:0:{} [HINT] => [PROPERTY_VALUE_ID] => 1500 [VALUE] => Екатерина Александрова [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [~VALUE] => Екатерина Александрова [~DESCRIPTION] => [~NAME] => Автор статьи [~DEFAULT_VALUE] => ) [AU_PHOTO] => Array ( [ID] => 10 [TIMESTAMP_X] => 2024-04-16 13:42:26 [IBLOCK_ID] => 1 [NAME] => Автор фото [ACTIVE] => Y [SORT] => 500 [CODE] => AU_PHOTO [DEFAULT_VALUE] => [PROPERTY_TYPE] => S [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => L [MULTIPLE] => N [XML_ID] => [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => N [SEARCHABLE] => N [FILTRABLE] => N [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => [USER_TYPE_SETTINGS] => a:0:{} [HINT] => [PROPERTY_VALUE_ID] => 1501 [VALUE] => Midjourney [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [~VALUE] => Midjourney [~DESCRIPTION] => [~NAME] => Автор фото [~DEFAULT_VALUE] => ) [IMG_MAIN] => Array ( [ID] => 11 [TIMESTAMP_X] => 2024-04-16 13:42:26 [IBLOCK_ID] => 1 [NAME] => Картинка для Главной [ACTIVE] => Y [SORT] => 500 [CODE] => IMG_MAIN [DEFAULT_VALUE] => [PROPERTY_TYPE] => F [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => L [MULTIPLE] => N [XML_ID] => [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => N [SEARCHABLE] => N [FILTRABLE] => N [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => [USER_TYPE_SETTINGS] => a:0:{} [HINT] => [PROPERTY_VALUE_ID] => [VALUE] => [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [~VALUE] => [~DESCRIPTION] => [~NAME] => Картинка для Главной [~DEFAULT_VALUE] => ) [MAIN_THEME] => Array ( [ID] => 12 [TIMESTAMP_X] => 2024-04-16 13:42:26 [IBLOCK_ID] => 1 [NAME] => Главная тема [ACTIVE] => Y [SORT] => 500 [CODE] => MAIN_THEME [DEFAULT_VALUE] => [PROPERTY_TYPE] => L [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => L [MULTIPLE] => N [XML_ID] => [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => N [SEARCHABLE] => N [FILTRABLE] => N [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => [USER_TYPE_SETTINGS] => a:0:{} [HINT] => [PROPERTY_VALUE_ID] => [VALUE] => [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [VALUE_ENUM_ID] => [~VALUE] => [~DESCRIPTION] => [~NAME] => Главная тема [~DEFAULT_VALUE] => ) [MAIN_SECT] => Array ( [ID] => 13 [TIMESTAMP_X] => 2024-04-16 13:42:26 [IBLOCK_ID] => 1 [NAME] => В своём разделе [ACTIVE] => Y [SORT] => 500 [CODE] => MAIN_SECT [DEFAULT_VALUE] => [PROPERTY_TYPE] => L [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => L [MULTIPLE] => N [XML_ID] => [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => N [SEARCHABLE] => N [FILTRABLE] => N [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => [USER_TYPE_SETTINGS] => a:0:{} [HINT] => [PROPERTY_VALUE_ID] => [VALUE] => [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [VALUE_ENUM_ID] => [~VALUE] => [~DESCRIPTION] => [~NAME] => В своём разделе [~DEFAULT_VALUE] => ) [VIDEO_YOU] => Array ( [ID] => 14 [TIMESTAMP_X] => 2024-04-16 13:42:26 [IBLOCK_ID] => 1 [NAME] => Видео youtobe [ACTIVE] => Y [SORT] => 500 [CODE] => VIDEO_YOU [DEFAULT_VALUE] => [PROPERTY_TYPE] => S [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => L [MULTIPLE] => N [XML_ID] => [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => N [SEARCHABLE] => N [FILTRABLE] => N [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => [USER_TYPE_SETTINGS] => a:0:{} [HINT] => [PROPERTY_VALUE_ID] => [VALUE] => [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [~VALUE] => [~DESCRIPTION] => [~NAME] => Видео youtobe [~DEFAULT_VALUE] => ) ) [DISPLAY_PROPERTIES] => Array ( [AUTHOR] => Array ( [ID] => 9 [TIMESTAMP_X] => 2024-04-16 13:42:26 [IBLOCK_ID] => 1 [NAME] => Автор статьи [ACTIVE] => Y [SORT] => 500 [CODE] => AUTHOR [DEFAULT_VALUE] => [PROPERTY_TYPE] => S [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => L [MULTIPLE] => N [XML_ID] => [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => N [SEARCHABLE] => N [FILTRABLE] => N [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => [USER_TYPE_SETTINGS] => a:0:{} [HINT] => [PROPERTY_VALUE_ID] => 1500 [VALUE] => Екатерина Александрова [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [~VALUE] => Екатерина Александрова [~DESCRIPTION] => [~NAME] => Автор статьи [~DEFAULT_VALUE] => [DISPLAY_VALUE] => Екатерина Александрова ) [AU_PHOTO] => Array ( [ID] => 10 [TIMESTAMP_X] => 2024-04-16 13:42:26 [IBLOCK_ID] => 1 [NAME] => Автор фото [ACTIVE] => Y [SORT] => 500 [CODE] => AU_PHOTO [DEFAULT_VALUE] => [PROPERTY_TYPE] => S [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => L [MULTIPLE] => N [XML_ID] => [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => N [SEARCHABLE] => N [FILTRABLE] => N [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => [USER_TYPE_SETTINGS] => a:0:{} [HINT] => [PROPERTY_VALUE_ID] => 1501 [VALUE] => Midjourney [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [~VALUE] => Midjourney [~DESCRIPTION] => [~NAME] => Автор фото [~DEFAULT_VALUE] => [DISPLAY_VALUE] => Midjourney ) ) [IBLOCK] => Array ( [ID] => 1 [~ID] => 1 [TIMESTAMP_X] => 16.04.2024 13:42:26 [~TIMESTAMP_X] => 16.04.2024 13:42:26 [IBLOCK_TYPE_ID] => news [~IBLOCK_TYPE_ID] => news [LID] => s1 [~LID] => s1 [CODE] => news_s1 [~CODE] => news_s1 [API_CODE] => [~API_CODE] => [REST_ON] => N [~REST_ON] => N [NAME] => Статьи [~NAME] => Статьи [ACTIVE] => Y [~ACTIVE] => Y [SORT] => 500 [~SORT] => 500 [LIST_PAGE_URL] => [~LIST_PAGE_URL] => [DETAIL_PAGE_URL] => #SITE_DIR#/#SECTION_CODE#/#ELEMENT_CODE#/ [~DETAIL_PAGE_URL] => #SITE_DIR#/#SECTION_CODE#/#ELEMENT_CODE#/ [SECTION_PAGE_URL] => #SITE_DIR#/#SECTION_CODE# [~SECTION_PAGE_URL] => #SITE_DIR#/#SECTION_CODE# [CANONICAL_PAGE_URL] => [~CANONICAL_PAGE_URL] => [PICTURE] => [~PICTURE] => [DESCRIPTION] => [~DESCRIPTION] => [DESCRIPTION_TYPE] => text [~DESCRIPTION_TYPE] => text [RSS_TTL] => 24 [~RSS_TTL] => 24 [RSS_ACTIVE] => Y [~RSS_ACTIVE] => Y [RSS_FILE_ACTIVE] => N [~RSS_FILE_ACTIVE] => N [RSS_FILE_LIMIT] => [~RSS_FILE_LIMIT] => [RSS_FILE_DAYS] => [~RSS_FILE_DAYS] => [RSS_YANDEX_ACTIVE] => N [~RSS_YANDEX_ACTIVE] => N [XML_ID] => furniture_news_s1 [~XML_ID] => furniture_news_s1 [TMP_ID] => 6cfbdd5e02a2f38f8bf51afa68b2792c [~TMP_ID] => 6cfbdd5e02a2f38f8bf51afa68b2792c [INDEX_ELEMENT] => Y [~INDEX_ELEMENT] => Y [INDEX_SECTION] => Y [~INDEX_SECTION] => Y [WORKFLOW] => N [~WORKFLOW] => N [BIZPROC] => N [~BIZPROC] => N [SECTION_CHOOSER] => L [~SECTION_CHOOSER] => L [LIST_MODE] => [~LIST_MODE] => [RIGHTS_MODE] => S [~RIGHTS_MODE] => S [SECTION_PROPERTY] => N [~SECTION_PROPERTY] => N [PROPERTY_INDEX] => N [~PROPERTY_INDEX] => N [VERSION] => 1 [~VERSION] => 1 [LAST_CONV_ELEMENT] => 0 [~LAST_CONV_ELEMENT] => 0 [SOCNET_GROUP_ID] => [~SOCNET_GROUP_ID] => [EDIT_FILE_BEFORE] => [~EDIT_FILE_BEFORE] => [EDIT_FILE_AFTER] => [~EDIT_FILE_AFTER] => [SECTIONS_NAME] => Разделы [~SECTIONS_NAME] => Разделы [SECTION_NAME] => Раздел [~SECTION_NAME] => Раздел [ELEMENTS_NAME] => Статьи [~ELEMENTS_NAME] => Статьи [ELEMENT_NAME] => Статья [~ELEMENT_NAME] => Статья [EXTERNAL_ID] => furniture_news_s1 [~EXTERNAL_ID] => furniture_news_s1 [LANG_DIR] => / [~LANG_DIR] => / [SERVER_NAME] => roboticsworld.ru [~SERVER_NAME] => roboticsworld.ru ) [SECTION] => Array ( [PATH] => Array ( [0] => Array ( [ID] => 9 [~ID] => 9 [CODE] => it-ai [~CODE] => it-ai [XML_ID] => [~XML_ID] => [EXTERNAL_ID] => [~EXTERNAL_ID] => [IBLOCK_ID] => 1 [~IBLOCK_ID] => 1 [IBLOCK_SECTION_ID] => [~IBLOCK_SECTION_ID] => [SORT] => 300 [~SORT] => 300 [NAME] => IT/AI [~NAME] => IT/AI [ACTIVE] => Y [~ACTIVE] => Y [DEPTH_LEVEL] => 1 [~DEPTH_LEVEL] => 1 [SECTION_PAGE_URL] => /it-ai [~SECTION_PAGE_URL] => /it-ai [IBLOCK_TYPE_ID] => news [~IBLOCK_TYPE_ID] => news [IBLOCK_CODE] => news_s1 [~IBLOCK_CODE] => news_s1 [IBLOCK_EXTERNAL_ID] => furniture_news_s1 [~IBLOCK_EXTERNAL_ID] => furniture_news_s1 [GLOBAL_ACTIVE] => Y [~GLOBAL_ACTIVE] => Y [IPROPERTY_VALUES] => Array ( [SECTION_META_TITLE] => IT/AI [ELEMENT_META_TITLE] => IT/AI ) ) ) ) [SECTION_URL] => /it-ai [META_TAGS] => Array ( [TITLE] => А если совместить с GPT? Большие языковые модели в антропоморфных роботах [BROWSER_TITLE] => А если совместить с GPT? Большие языковые модели в антропоморфных роботах [KEYWORDS] => [DESCRIPTION] => ) )

А если совместить с GPT? Большие языковые модели в антропоморфных роботах

В мире началась гонка человекоподобной робототехники, многие компании уже предлагают уникальные продукты. Однако разум роботов — это отдельная масштабная задача, и не всем по карману разработка своих мощных ИИ. А что, если брать готовые решения на основе больших языковых моделей?

К примеру, робот Ameca, разработанный компанией Engineered Arts в 2021 году, применяет модель GPT-3 от OpenAI. Благодаря используемым языковым моделям Ameca распознает человеческую речь и генерирует ответы, что позволяет роботу взаимодействовать с людьми более естественно. Кроме того, робот может реалистично передавать различные эмоции, которые испытывают люди: удивление, недовольство, отвращение, восторг и др.

Разработчики двигаются дальше, обучая Ameca разным языкам. Они тестировали сразу две модели — GPT-3 и GPT-4, но последняя замедлила скорость реакции и ухудшила реалистичность. Для разговора и перевода на другой язык робот Ameca использовал языковую модель GPT-3, а для распознавания речи и генерации голоса — модель DeepL. Компания не раз выкладывала видео, где робот достаточно складно отвечает на вопросы людей. Например, однажды у Ameca спросили, не собираются ли роботы захватывать мир, на что устройство ответило: «Некоторые говорят, что мы — угроза. Некоторые думают, что мы возьмем верх и человечеству придет конец, но мы просто хотим помочь».

GPT-4 пригодилась для другого робота — японского Alter3. Разработчики также отметили естественность общения устройства с этой языковой моделью. Alter3 может копировать действия людей, например, селфи, бросание мяча, поедание попкорна и игру на воображаемой гитаре.

Разработка OpenAI также была использована Boston Dynamics, которая создала с помощью этой языковой модели робособаку-экскурсовода. В основе работы этого устройства лежат фундаментальные модели — крупные системы искусственного интеллекта, обученные на огромных объемах данных. Эти модели, обладающие миллионами параметров, способны к «эмерджентному поведению», что позволяет им адаптироваться под разные ситуации.

Spot использует GPT-4, наборы данных Visual Question Answering (VQA) и программу распознавания речи Whisper от OpenAI для реалистичного общения с человеком. Инженеры Boston Dynamics разработали специальные скрипты для руководства действиями Spot. Они позволяют роботу не только описывать объекты, но и демонстрировать определенную «личность» во время экскурсий.

Многие компании-производители антропоморфных роботов используют собственные наработки в области AI и языковых моделей, а также могут интегрировать сторонние разработки, включая общедоступные языковые модели. Информация о точных технологиях, используемых в каждом случае, часто не раскрывается в полном объеме. Рассмотрим еще несколько примеров того, как работают «мозги» антропоморфных роботов.

Помимо Spot, у Boston Dynamics есть еще одна известная разработка — гуманоидный робот Atlas. Он может работать на открытом воздухе и в помещениях, отлично балансирует и маневрирует среди препятствий. Все это происходит благодаря стереовидению, датчикам расстояния и другим сенсорам, которые позволяют Atlas ориентироваться в пространстве. Управление роботом происходит на двух уровнях: с помощью поведенческого контроллера, который выдает команды, и с помощью низкоуровневого контроллера, генерирующего команды для суставов. Это особенно важно для передвижения с предметами в руках, так как работа с такими объектами требует от робота сложных вычислений, чтобы корректировать его баланс и координацию движений.

Boston Dynamics также активно работает над улучшением системы восприятия и программного обеспечения Atlas, включая разработку симулятора для планирования движений и тестирования новых функций. В частности, улучшение зрительных способностей робота и его способности адаптироваться к меняющейся среде являются ключевыми областями для будущего развития.

Антропоморфный робот Digit, разработанный компанией Agility Robotics, демонстрирует впечатляющую способность понимать и выполнять команды, заданные на естественном языке. Это стало возможным благодаря интеграции больших языковых моделей в систему управления роботом.

Примером возможностей Digit является недавняя демонстрация его навыков, а именно — перемещения красного ящика на высокую башню после команды «возьми ящик цвета светового меча Дарта Вейдера и перемести его на самую высокую башню в первом ряду». Процесс, хотя и медленный, был выполнен с удивительной точностью и вниманием к деталям.

Разработчики из Agility Robotics объясняют, что интеграция больших языковых моделей в робота позволяет ему понимать сложные естественные языковые команды и адаптироваться к разнообразным рабочим задачам без дополнительного программирования.

Optimus, выпускаемый компанией Tesla, предназначен для помощи человеку в повседневной жизни и выполнения бытовых задач. Отличительной особенностью подхода Tesla в разработке Optimus является интеграция технологий искусственного интеллекта и машинного зрения, разработанных для автопилота электромобилей компании. Это дает роботу преимущество в адаптации к сложным и меняющимся условиям окружающей среды.

Таким образом, интеграция больших языковых моделей в роботов открывает новые горизонты для развития автономных систем. Способность роботов понимать сложные команды и адаптироваться к меняющимся условиям может значительно улучшить их эффективность и функциональность в реальных условиях.

Из приведенных примеров можно сделать вывод о том, что компании-производители робототехники начали интегрировать в свои разработки уже готовые большие языковые модели. Это связано с рядом причин, важнейшая из которых — экономия времени и ресурсов.

Разработка собственной языковой модели с нуля требует значительных временных и финансовых затрат. Использование готовых моделей позволяет компаниям сосредоточить свои ресурсы на других аспектах разработки роботов, таких как физическое проектирование, моторика и сенсорные системы.

Кроме того, готовые языковые модели часто поддерживаются и обновляются их разработчиками, что обеспечивает их актуальность и улучшение функциональности со временем. Это избавляет робототехнические компании от необходимости самостоятельно заниматься постоянным обновлением.

По мере развития больших языковых моделей мы можем ожидать, что роботы станут еще более адаптивными в общении с людьми, способными вести естественные и глубокие диалоги, учитывая контекст и индивидуальные особенности человека. Это будет способствовать широкому принятию роботов в качестве помощников в домашних условиях, в образовании, медицине и сфере обслуживания.

Также ожидается, что языковые модели будут взаимодействовать с системами распознавания эмоций, что позволит роботам лучше понимать и реагировать на эмоциональное состояние человека. Это может помочь в терапии, уходе за пожилыми и в качестве компаньонов для одиноких людей.

В целом прогнозируется, что большие языковые модели будут играть ключевую роль в эволюции антропоморфных роботов, существенно расширяя их возможности и спектр применения.

29.02.2024
Екатерина Александрова
Фото: Midjourney

Мы рекомендуем: