";123 Array
(
    [NAME] => Царь в цифровой голове: Google разработала ИИ для проверки ИИ
    [~NAME] => Царь в цифровой голове: Google разработала ИИ для проверки ИИ
    [TAGS] => искусственный интеллект
    [~TAGS] => искусственный интеллект
    [PREVIEW_TEXT] => 

Большие языковые модели (LLM), самой известной и мощной из которых сегодня является последняя версия ChatGPT, умеют писать научные работы, художественные тексты, решать задачи и отвечать на самые разные вопросы. При этом постоянно встает вопрос о точности результатов — произведения моделей так или иначе требуют ручной проверки на корректность.

[~PREVIEW_TEXT] =>

Большие языковые модели (LLM), самой известной и мощной из которых сегодня является последняя версия ChatGPT, умеют писать научные работы, художественные тексты, решать задачи и отвечать на самые разные вопросы. При этом постоянно встает вопрос о точности результатов — произведения моделей так или иначе требуют ручной проверки на корректность.

[PREVIEW_PICTURE] => Array ( [ID] => 1114 [TIMESTAMP_X] => 27.04.2024 15:07:57 [MODULE_ID] => iblock [HEIGHT] => 680 [WIDTH] => 1024 [FILE_SIZE] => 89258 [CONTENT_TYPE] => image/jpeg [SUBDIR] => iblock/0fe/vwff90jq9zxq27k5nl4ri1o41rs15y9i [FILE_NAME] => kandinskyPROVERKAII.jpg [ORIGINAL_NAME] => kandinskyPROVERKAII.jpg [DESCRIPTION] => [HANDLER_ID] => [EXTERNAL_ID] => 879d814757a90cee0f16b85a84377acc [VERSION_ORIGINAL_ID] => [META] => [SRC] => /upload/iblock/0fe/vwff90jq9zxq27k5nl4ri1o41rs15y9i/kandinskyPROVERKAII.jpg [UNSAFE_SRC] => /upload/iblock/0fe/vwff90jq9zxq27k5nl4ri1o41rs15y9i/kandinskyPROVERKAII.jpg [SAFE_SRC] => /upload/iblock/0fe/vwff90jq9zxq27k5nl4ri1o41rs15y9i/kandinskyPROVERKAII.jpg [ALT] => Царь в цифровой голове: Google разработала ИИ для проверки ИИ [TITLE] => Царь в цифровой голове: Google разработала ИИ для проверки ИИ ) [~PREVIEW_PICTURE] => 1114 [DETAIL_TEXT] =>

Эта потребность, в первую очередь, снижает ценность LLM. Решить проблему призвана модель Search-Augmented Factuality Evaluator (SAFE) — новое ИИ-приложение, разработанное Google DeepMind.

Приложение автоматически проверяет правильность ответов LLM и выявляет неточности. Его работа основана на поиске подтверждающих источников в Google. Модель анализирует утверждения в ответах своих собратьев, а потом буквально «гуглит» их, отбирая ресурсы, подходящие для верификации информации.

Тестируя SAFE, специалисты проверили примерно 16 тысяч фактов, предоставленных такими LLM, как ChatGPT, Gemini, PaLM. Результаты работы модели сравнили с результатами проверки в ручном режиме. SAFE обнаружила 72% неточностей, о которых сообщили люди. При этом в случае разногласий между живыми проверяющими и системой последняя оказывалась права в 76% случаев.

Команда DeepMind опубликовала код SAFE в GitHub, предоставив всем желающим возможность использовать систему для повышения точности и надежности ответов LLM-моделей, сообщает SecurityLab.

Ранее «Мир робототехники» писал, что в ближайшее время широкой аудитории станет доступна линейка нейросетей YandexGPT 3 от «Яндекс». Первую языковую модель — YandexGPT 3 Pro — уже можно опробовать по API на Yandex Cloud. Разработчики обещают, что скоро моделей третьего поколения, предназначенных для решения разных задач, станет больше. [~DETAIL_TEXT] =>

Эта потребность, в первую очередь, снижает ценность LLM. Решить проблему призвана модель Search-Augmented Factuality Evaluator (SAFE) — новое ИИ-приложение, разработанное Google DeepMind.

Приложение автоматически проверяет правильность ответов LLM и выявляет неточности. Его работа основана на поиске подтверждающих источников в Google. Модель анализирует утверждения в ответах своих собратьев, а потом буквально «гуглит» их, отбирая ресурсы, подходящие для верификации информации.

Тестируя SAFE, специалисты проверили примерно 16 тысяч фактов, предоставленных такими LLM, как ChatGPT, Gemini, PaLM. Результаты работы модели сравнили с результатами проверки в ручном режиме. SAFE обнаружила 72% неточностей, о которых сообщили люди. При этом в случае разногласий между живыми проверяющими и системой последняя оказывалась права в 76% случаев.

Команда DeepMind опубликовала код SAFE в GitHub, предоставив всем желающим возможность использовать систему для повышения точности и надежности ответов LLM-моделей, сообщает SecurityLab.

Ранее «Мир робототехники» писал, что в ближайшее время широкой аудитории станет доступна линейка нейросетей YandexGPT 3 от «Яндекс». Первую языковую модель — YandexGPT 3 Pro — уже можно опробовать по API на Yandex Cloud. Разработчики обещают, что скоро моделей третьего поколения, предназначенных для решения разных задач, станет больше. [DETAIL_PICTURE] => Array ( [ID] => 1115 [TIMESTAMP_X] => 27.04.2024 15:07:57 [MODULE_ID] => iblock [HEIGHT] => 1063 [WIDTH] => 1600 [FILE_SIZE] => 84954 [CONTENT_TYPE] => image/jpeg [SUBDIR] => iblock/46b/jg35jzwvhzzny0ybru4fexwx3iret8wr [FILE_NAME] => kandinskyPROVERKAII.jpg [ORIGINAL_NAME] => kandinskyPROVERKAII.jpg [DESCRIPTION] => [HANDLER_ID] => [EXTERNAL_ID] => 821928aae9ce97f41bfed738449052b5 [VERSION_ORIGINAL_ID] => [META] => [SRC] => /upload/iblock/46b/jg35jzwvhzzny0ybru4fexwx3iret8wr/kandinskyPROVERKAII.jpg [UNSAFE_SRC] => /upload/iblock/46b/jg35jzwvhzzny0ybru4fexwx3iret8wr/kandinskyPROVERKAII.jpg [SAFE_SRC] => /upload/iblock/46b/jg35jzwvhzzny0ybru4fexwx3iret8wr/kandinskyPROVERKAII.jpg [ALT] => Царь в цифровой голове: Google разработала ИИ для проверки ИИ [TITLE] => Царь в цифровой голове: Google разработала ИИ для проверки ИИ ) [~DETAIL_PICTURE] => 1115 [DATE_ACTIVE_FROM] => 02.04.2024 16:58:55 [~DATE_ACTIVE_FROM] => 02.04.2024 16:58:55 [ID] => 481 [~ID] => 481 [IBLOCK_ID] => 1 [~IBLOCK_ID] => 1 [IBLOCK_SECTION_ID] => 9 [~IBLOCK_SECTION_ID] => 9 [DETAIL_TEXT_TYPE] => html [~DETAIL_TEXT_TYPE] => html [PREVIEW_TEXT_TYPE] => html [~PREVIEW_TEXT_TYPE] => html [TIMESTAMP_X] => 27.04.2024 15:07:57 [~TIMESTAMP_X] => 27.04.2024 15:07:57 [ACTIVE_FROM_X] => 2024-04-02 16:58:55 [~ACTIVE_FROM_X] => 2024-04-02 16:58:55 [ACTIVE_FROM] => 02.04.2024 16:58:55 [~ACTIVE_FROM] => 02.04.2024 16:58:55 [LIST_PAGE_URL] => / [~LIST_PAGE_URL] => / [DETAIL_PAGE_URL] => /it-ai/tsar-v-tsifrovoy-golove-google-razrabotala-ii-dlya-proverki-ii/ [~DETAIL_PAGE_URL] => /it-ai/tsar-v-tsifrovoy-golove-google-razrabotala-ii-dlya-proverki-ii/ [LANG_DIR] => / [~LANG_DIR] => / [CODE] => tsar-v-tsifrovoy-golove-google-razrabotala-ii-dlya-proverki-ii [~CODE] => tsar-v-tsifrovoy-golove-google-razrabotala-ii-dlya-proverki-ii [EXTERNAL_ID] => 481 [~EXTERNAL_ID] => 481 [IBLOCK_TYPE_ID] => news [~IBLOCK_TYPE_ID] => news [IBLOCK_CODE] => news_s1 [~IBLOCK_CODE] => news_s1 [IBLOCK_EXTERNAL_ID] => furniture_news_s1 [~IBLOCK_EXTERNAL_ID] => furniture_news_s1 [LID] => s1 [~LID] => s1 [NAV_RESULT] => [NAV_CACHED_DATA] => [DISPLAY_ACTIVE_FROM] => 02.04.2024 [IPROPERTY_VALUES] => Array ( [SECTION_META_TITLE] => Царь в цифровой голове: Google разработала ИИ для проверки ИИ [ELEMENT_META_TITLE] => Царь в цифровой голове: Google разработала ИИ для проверки ИИ ) [FIELDS] => Array ( [NAME] => Царь в цифровой голове: Google разработала ИИ для проверки ИИ [TAGS] => искусственный интеллект [PREVIEW_TEXT] =>

Большие языковые модели (LLM), самой известной и мощной из которых сегодня является последняя версия ChatGPT, умеют писать научные работы, художественные тексты, решать задачи и отвечать на самые разные вопросы. При этом постоянно встает вопрос о точности результатов — произведения моделей так или иначе требуют ручной проверки на корректность.

[PREVIEW_PICTURE] => Array ( [ID] => 1114 [TIMESTAMP_X] => 27.04.2024 15:07:57 [MODULE_ID] => iblock [HEIGHT] => 680 [WIDTH] => 1024 [FILE_SIZE] => 89258 [CONTENT_TYPE] => image/jpeg [SUBDIR] => iblock/0fe/vwff90jq9zxq27k5nl4ri1o41rs15y9i [FILE_NAME] => kandinskyPROVERKAII.jpg [ORIGINAL_NAME] => kandinskyPROVERKAII.jpg [DESCRIPTION] => [HANDLER_ID] => [EXTERNAL_ID] => 879d814757a90cee0f16b85a84377acc [VERSION_ORIGINAL_ID] => [META] => [SRC] => /upload/iblock/0fe/vwff90jq9zxq27k5nl4ri1o41rs15y9i/kandinskyPROVERKAII.jpg [UNSAFE_SRC] => /upload/iblock/0fe/vwff90jq9zxq27k5nl4ri1o41rs15y9i/kandinskyPROVERKAII.jpg [SAFE_SRC] => /upload/iblock/0fe/vwff90jq9zxq27k5nl4ri1o41rs15y9i/kandinskyPROVERKAII.jpg [ALT] => Царь в цифровой голове: Google разработала ИИ для проверки ИИ [TITLE] => Царь в цифровой голове: Google разработала ИИ для проверки ИИ ) [DETAIL_TEXT] =>

Эта потребность, в первую очередь, снижает ценность LLM. Решить проблему призвана модель Search-Augmented Factuality Evaluator (SAFE) — новое ИИ-приложение, разработанное Google DeepMind.

Приложение автоматически проверяет правильность ответов LLM и выявляет неточности. Его работа основана на поиске подтверждающих источников в Google. Модель анализирует утверждения в ответах своих собратьев, а потом буквально «гуглит» их, отбирая ресурсы, подходящие для верификации информации.

Тестируя SAFE, специалисты проверили примерно 16 тысяч фактов, предоставленных такими LLM, как ChatGPT, Gemini, PaLM. Результаты работы модели сравнили с результатами проверки в ручном режиме. SAFE обнаружила 72% неточностей, о которых сообщили люди. При этом в случае разногласий между живыми проверяющими и системой последняя оказывалась права в 76% случаев.

Команда DeepMind опубликовала код SAFE в GitHub, предоставив всем желающим возможность использовать систему для повышения точности и надежности ответов LLM-моделей, сообщает SecurityLab.

Ранее «Мир робототехники» писал, что в ближайшее время широкой аудитории станет доступна линейка нейросетей YandexGPT 3 от «Яндекс». Первую языковую модель — YandexGPT 3 Pro — уже можно опробовать по API на Yandex Cloud. Разработчики обещают, что скоро моделей третьего поколения, предназначенных для решения разных задач, станет больше. [DETAIL_PICTURE] => Array ( [ID] => 1115 [TIMESTAMP_X] => 27.04.2024 15:07:57 [MODULE_ID] => iblock [HEIGHT] => 1063 [WIDTH] => 1600 [FILE_SIZE] => 84954 [CONTENT_TYPE] => image/jpeg [SUBDIR] => iblock/46b/jg35jzwvhzzny0ybru4fexwx3iret8wr [FILE_NAME] => kandinskyPROVERKAII.jpg [ORIGINAL_NAME] => kandinskyPROVERKAII.jpg [DESCRIPTION] => [HANDLER_ID] => [EXTERNAL_ID] => 821928aae9ce97f41bfed738449052b5 [VERSION_ORIGINAL_ID] => [META] => [SRC] => /upload/iblock/46b/jg35jzwvhzzny0ybru4fexwx3iret8wr/kandinskyPROVERKAII.jpg [UNSAFE_SRC] => /upload/iblock/46b/jg35jzwvhzzny0ybru4fexwx3iret8wr/kandinskyPROVERKAII.jpg [SAFE_SRC] => /upload/iblock/46b/jg35jzwvhzzny0ybru4fexwx3iret8wr/kandinskyPROVERKAII.jpg [ALT] => Царь в цифровой голове: Google разработала ИИ для проверки ИИ [TITLE] => Царь в цифровой голове: Google разработала ИИ для проверки ИИ ) [DATE_ACTIVE_FROM] => 02.04.2024 16:58:55 ) [PROPERTIES] => Array ( [AUTHOR] => Array ( [ID] => 9 [TIMESTAMP_X] => 2024-04-16 13:42:26 [IBLOCK_ID] => 1 [NAME] => Автор статьи [ACTIVE] => Y [SORT] => 500 [CODE] => AUTHOR [DEFAULT_VALUE] => [PROPERTY_TYPE] => S [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => L [MULTIPLE] => N [XML_ID] => [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => N [SEARCHABLE] => N [FILTRABLE] => N [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => [USER_TYPE_SETTINGS] => a:0:{} [HINT] => [PROPERTY_VALUE_ID] => [VALUE] => [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [~VALUE] => [~DESCRIPTION] => [~NAME] => Автор статьи [~DEFAULT_VALUE] => ) [AU_PHOTO] => Array ( [ID] => 10 [TIMESTAMP_X] => 2024-04-16 13:42:26 [IBLOCK_ID] => 1 [NAME] => Автор фото [ACTIVE] => Y [SORT] => 500 [CODE] => AU_PHOTO [DEFAULT_VALUE] => [PROPERTY_TYPE] => S [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => L [MULTIPLE] => N [XML_ID] => [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => N [SEARCHABLE] => N [FILTRABLE] => N [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => [USER_TYPE_SETTINGS] => a:0:{} [HINT] => [PROPERTY_VALUE_ID] => 2012 [VALUE] => Kandinsky [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [~VALUE] => Kandinsky [~DESCRIPTION] => [~NAME] => Автор фото [~DEFAULT_VALUE] => ) [IMG_MAIN] => Array ( [ID] => 11 [TIMESTAMP_X] => 2024-04-16 13:42:26 [IBLOCK_ID] => 1 [NAME] => Картинка для Главной [ACTIVE] => Y [SORT] => 500 [CODE] => IMG_MAIN [DEFAULT_VALUE] => [PROPERTY_TYPE] => F [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => L [MULTIPLE] => N [XML_ID] => [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => N [SEARCHABLE] => N [FILTRABLE] => N [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => [USER_TYPE_SETTINGS] => a:0:{} [HINT] => [PROPERTY_VALUE_ID] => [VALUE] => [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [~VALUE] => [~DESCRIPTION] => [~NAME] => Картинка для Главной [~DEFAULT_VALUE] => ) [MAIN_THEME] => Array ( [ID] => 12 [TIMESTAMP_X] => 2024-04-16 13:42:26 [IBLOCK_ID] => 1 [NAME] => Главная тема [ACTIVE] => Y [SORT] => 500 [CODE] => MAIN_THEME [DEFAULT_VALUE] => [PROPERTY_TYPE] => L [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => L [MULTIPLE] => N [XML_ID] => [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => N [SEARCHABLE] => N [FILTRABLE] => N [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => [USER_TYPE_SETTINGS] => a:0:{} [HINT] => [PROPERTY_VALUE_ID] => [VALUE] => [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [VALUE_ENUM_ID] => [~VALUE] => [~DESCRIPTION] => [~NAME] => Главная тема [~DEFAULT_VALUE] => ) [MAIN_SECT] => Array ( [ID] => 13 [TIMESTAMP_X] => 2024-04-16 13:42:26 [IBLOCK_ID] => 1 [NAME] => В своём разделе [ACTIVE] => Y [SORT] => 500 [CODE] => MAIN_SECT [DEFAULT_VALUE] => [PROPERTY_TYPE] => L [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => L [MULTIPLE] => N [XML_ID] => [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => N [SEARCHABLE] => N [FILTRABLE] => N [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => [USER_TYPE_SETTINGS] => a:0:{} [HINT] => [PROPERTY_VALUE_ID] => [VALUE] => [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [VALUE_ENUM_ID] => [~VALUE] => [~DESCRIPTION] => [~NAME] => В своём разделе [~DEFAULT_VALUE] => ) [VIDEO_YOU] => Array ( [ID] => 14 [TIMESTAMP_X] => 2024-04-16 13:42:26 [IBLOCK_ID] => 1 [NAME] => Видео youtobe [ACTIVE] => Y [SORT] => 500 [CODE] => VIDEO_YOU [DEFAULT_VALUE] => [PROPERTY_TYPE] => S [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => L [MULTIPLE] => N [XML_ID] => [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => N [SEARCHABLE] => N [FILTRABLE] => N [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => [USER_TYPE_SETTINGS] => a:0:{} [HINT] => [PROPERTY_VALUE_ID] => [VALUE] => [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [~VALUE] => [~DESCRIPTION] => [~NAME] => Видео youtobe [~DEFAULT_VALUE] => ) ) [DISPLAY_PROPERTIES] => Array ( [AU_PHOTO] => Array ( [ID] => 10 [TIMESTAMP_X] => 2024-04-16 13:42:26 [IBLOCK_ID] => 1 [NAME] => Автор фото [ACTIVE] => Y [SORT] => 500 [CODE] => AU_PHOTO [DEFAULT_VALUE] => [PROPERTY_TYPE] => S [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => L [MULTIPLE] => N [XML_ID] => [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => N [SEARCHABLE] => N [FILTRABLE] => N [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => [USER_TYPE_SETTINGS] => a:0:{} [HINT] => [PROPERTY_VALUE_ID] => 2012 [VALUE] => Kandinsky [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [~VALUE] => Kandinsky [~DESCRIPTION] => [~NAME] => Автор фото [~DEFAULT_VALUE] => [DISPLAY_VALUE] => Kandinsky ) ) [IBLOCK] => Array ( [ID] => 1 [~ID] => 1 [TIMESTAMP_X] => 16.04.2024 13:42:26 [~TIMESTAMP_X] => 16.04.2024 13:42:26 [IBLOCK_TYPE_ID] => news [~IBLOCK_TYPE_ID] => news [LID] => s1 [~LID] => s1 [CODE] => news_s1 [~CODE] => news_s1 [API_CODE] => [~API_CODE] => [REST_ON] => N [~REST_ON] => N [NAME] => Статьи [~NAME] => Статьи [ACTIVE] => Y [~ACTIVE] => Y [SORT] => 500 [~SORT] => 500 [LIST_PAGE_URL] => [~LIST_PAGE_URL] => [DETAIL_PAGE_URL] => #SITE_DIR#/#SECTION_CODE#/#ELEMENT_CODE#/ [~DETAIL_PAGE_URL] => #SITE_DIR#/#SECTION_CODE#/#ELEMENT_CODE#/ [SECTION_PAGE_URL] => #SITE_DIR#/#SECTION_CODE# [~SECTION_PAGE_URL] => #SITE_DIR#/#SECTION_CODE# [CANONICAL_PAGE_URL] => [~CANONICAL_PAGE_URL] => [PICTURE] => [~PICTURE] => [DESCRIPTION] => [~DESCRIPTION] => [DESCRIPTION_TYPE] => text [~DESCRIPTION_TYPE] => text [RSS_TTL] => 24 [~RSS_TTL] => 24 [RSS_ACTIVE] => Y [~RSS_ACTIVE] => Y [RSS_FILE_ACTIVE] => N [~RSS_FILE_ACTIVE] => N [RSS_FILE_LIMIT] => [~RSS_FILE_LIMIT] => [RSS_FILE_DAYS] => [~RSS_FILE_DAYS] => [RSS_YANDEX_ACTIVE] => N [~RSS_YANDEX_ACTIVE] => N [XML_ID] => furniture_news_s1 [~XML_ID] => furniture_news_s1 [TMP_ID] => 6cfbdd5e02a2f38f8bf51afa68b2792c [~TMP_ID] => 6cfbdd5e02a2f38f8bf51afa68b2792c [INDEX_ELEMENT] => Y [~INDEX_ELEMENT] => Y [INDEX_SECTION] => Y [~INDEX_SECTION] => Y [WORKFLOW] => N [~WORKFLOW] => N [BIZPROC] => N [~BIZPROC] => N [SECTION_CHOOSER] => L [~SECTION_CHOOSER] => L [LIST_MODE] => [~LIST_MODE] => [RIGHTS_MODE] => S [~RIGHTS_MODE] => S [SECTION_PROPERTY] => N [~SECTION_PROPERTY] => N [PROPERTY_INDEX] => N [~PROPERTY_INDEX] => N [VERSION] => 1 [~VERSION] => 1 [LAST_CONV_ELEMENT] => 0 [~LAST_CONV_ELEMENT] => 0 [SOCNET_GROUP_ID] => [~SOCNET_GROUP_ID] => [EDIT_FILE_BEFORE] => [~EDIT_FILE_BEFORE] => [EDIT_FILE_AFTER] => [~EDIT_FILE_AFTER] => [SECTIONS_NAME] => Разделы [~SECTIONS_NAME] => Разделы [SECTION_NAME] => Раздел [~SECTION_NAME] => Раздел [ELEMENTS_NAME] => Статьи [~ELEMENTS_NAME] => Статьи [ELEMENT_NAME] => Статья [~ELEMENT_NAME] => Статья [EXTERNAL_ID] => furniture_news_s1 [~EXTERNAL_ID] => furniture_news_s1 [LANG_DIR] => / [~LANG_DIR] => / [SERVER_NAME] => roboticsworld.ru [~SERVER_NAME] => roboticsworld.ru ) [SECTION] => Array ( [PATH] => Array ( [0] => Array ( [ID] => 9 [~ID] => 9 [CODE] => it-ai [~CODE] => it-ai [XML_ID] => [~XML_ID] => [EXTERNAL_ID] => [~EXTERNAL_ID] => [IBLOCK_ID] => 1 [~IBLOCK_ID] => 1 [IBLOCK_SECTION_ID] => [~IBLOCK_SECTION_ID] => [SORT] => 300 [~SORT] => 300 [NAME] => IT/AI [~NAME] => IT/AI [ACTIVE] => Y [~ACTIVE] => Y [DEPTH_LEVEL] => 1 [~DEPTH_LEVEL] => 1 [SECTION_PAGE_URL] => /it-ai [~SECTION_PAGE_URL] => /it-ai [IBLOCK_TYPE_ID] => news [~IBLOCK_TYPE_ID] => news [IBLOCK_CODE] => news_s1 [~IBLOCK_CODE] => news_s1 [IBLOCK_EXTERNAL_ID] => furniture_news_s1 [~IBLOCK_EXTERNAL_ID] => furniture_news_s1 [GLOBAL_ACTIVE] => Y [~GLOBAL_ACTIVE] => Y [IPROPERTY_VALUES] => Array ( [SECTION_META_TITLE] => IT/AI [ELEMENT_META_TITLE] => IT/AI ) ) ) ) [SECTION_URL] => /it-ai [META_TAGS] => Array ( [TITLE] => Царь в цифровой голове: Google разработала ИИ для проверки ИИ [BROWSER_TITLE] => Царь в цифровой голове: Google разработала ИИ для проверки ИИ [KEYWORDS] => [DESCRIPTION] => ) )

Царь в цифровой голове: Google разработала ИИ для проверки ИИ

Большие языковые модели (LLM), самой известной и мощной из которых сегодня является последняя версия ChatGPT, умеют писать научные работы, художественные тексты, решать задачи и отвечать на самые разные вопросы. При этом постоянно встает вопрос о точности результатов — произведения моделей так или иначе требуют ручной проверки на корректность.

Эта потребность, в первую очередь, снижает ценность LLM. Решить проблему призвана модель Search-Augmented Factuality Evaluator (SAFE) — новое ИИ-приложение, разработанное Google DeepMind.

Приложение автоматически проверяет правильность ответов LLM и выявляет неточности. Его работа основана на поиске подтверждающих источников в Google. Модель анализирует утверждения в ответах своих собратьев, а потом буквально «гуглит» их, отбирая ресурсы, подходящие для верификации информации.

Тестируя SAFE, специалисты проверили примерно 16 тысяч фактов, предоставленных такими LLM, как ChatGPT, Gemini, PaLM. Результаты работы модели сравнили с результатами проверки в ручном режиме. SAFE обнаружила 72% неточностей, о которых сообщили люди. При этом в случае разногласий между живыми проверяющими и системой последняя оказывалась права в 76% случаев.

Команда DeepMind опубликовала код SAFE в GitHub, предоставив всем желающим возможность использовать систему для повышения точности и надежности ответов LLM-моделей, сообщает SecurityLab.

Ранее «Мир робототехники» писал, что в ближайшее время широкой аудитории станет доступна линейка нейросетей YandexGPT 3 от «Яндекс». Первую языковую модель — YandexGPT 3 Pro — уже можно опробовать по API на Yandex Cloud. Разработчики обещают, что скоро моделей третьего поколения, предназначенных для решения разных задач, станет больше.
02.04.2024
Фото: Kandinsky

Мы рекомендуем: