Midjourney V6 — новое поколение искусственного искусства

Создатели нейросети Midjourney объявили о старте альфа-теста шестой версии системы (V6). По информации разработчиков, новинка будет лучше понимать текстовые подсказки. Кроме того, нейросеть научилась точнее отображать текст и поддерживает опцию деликатной настройки текстур или освещения.

Midjourney v6 — это искусственный интеллект, который для создания изображений использует глубокое обучение. Модель умеет распознавать шаблоны и концепции в огромном наборе данных.

Особенности новой версии:

Увеличенное разрешение изображений — 2048Х2048 пикселей.

Тонкие настройки, позволяющие менять в уже готовых изображениях стиль, цвет или ракурс.

Улучшенная генерация рук.

3D-модели.

Генерация видео.

Улучшенное понимание естественного языка и текстовых подсказок.

Говоря о последней «фишке», разработчики отметили, что пользователям придется буквально заново научится общаться с нейросетью. V6 намного более чувствительна к подсказкам, чем предыдущие версии. Следует прямо говорить, что должна сделать система. Так, например, Midjourney V6 лучше понимает меньшую эмоциональность.

Кроме того, разработчики подчеркивают, что сгенерированные изображения могут иметь неожиданные особенности или аномалии, потому что ИИ не обладает истинным пониманием мира.

Подключение к обновленной нейросети не происходит для всех пользователей по умолчанию — в чате Discord с ботом Midjourney необходимо перейти в режим настроек командой «/settings», после чего в раскрывающемся меню сверху выбрать «V6». В качестве альтернативы можно после каждого описания изображения добавлять параметр «-v 6». 

«Мир робототехники» решил протестировать возможности нейросети и задал ей несколько заданий. Судя по результатам — не самых простых. 

Вот так, например, V6 видит город на берегу небольшой бухты — картина маслом в стиле Анри Марке в красном освещении.


У нейросети получилась настоящая картина маслом, даже мазки переданы. А вот насчет стилизации возникает вопрос — изображение получилось слишком детализированным, в отличие от имажинистских работ Альбера Марке.

Стиль Амадео Модильяни также не дался новой нейросети. Хотя портрет девочки с воздушным шариком, тем не менее, получился очень неплохим.


А вот проверку на реалистичность Midjourney прошла на ура. Естественно, в первую очередь, руки. Хотя цветы тоже получились очень живыми.


И лицо женщины, кстати, вышло на редкость счастливым.


А самое большое разочарование крылось за следующим запросом: «два робота бегут навстречу друг другу через туманное поле в стиле анимации Юрия Норштейна».


Либо нейросеть не знакома с творчеством Юрия Норштейна, либо не совсем правильно поняла мультфильм «Ежик в тумане».

Ранее «Мир робототехники» писал, что американская компания Google представила свою самую передовую технологию преобразования текста в изображение. Новая нейросеть Imagen 2, по словам разработчиков, может генерировать изображения на абсолютно новом уровне реализма, потому что лучше понимает взаимосвязь между словами и образами. 

28.12.2023
Аркадий Гончаров
Фото: Midjourney V6

Мы рекомендуем: