21.1 C
Санкт-Петербург
Среда, 6 июля, 2022

Google представила нейросеть, которая генерирует картинки по описанию

Google анонсировала нейросеть Imagen, которая которая преобразует текст в изображения. Это нейросеть – прямой конкурент DALL-E 2 от OpenAI.

Для распознавания текстового запроса нейросеть использует большие языковые модели, на которых основаны алгоритмы обработки естественной речи.

Система работает в три этапа:

  1. Сначала нейросеть рисует небольшую картинку размером 64х64 px, которая дорабатывается до тех пор, пока она не сможет ее изменить для лучшего соответствия исходному запросу. 
  2. Затем размер изображения увеличивается до 256х256 px, и Imagen дорабатывает детали. 
  3. На третьем этапе то же самое повторяется уже с картинкой финального размера – 1024х1024 px.

Результаты оценки независимыми зрителями показали, что нейросеть Imagen превосходит DALL-E 2 по точности и соответствию запросам.

Напомним, Google тестирует новый дизайн Google News.

Источник


Читать также:  ВКонтакте бесплатно покажет трансляции финалов конференций и финала NBA 2020

Похожие статьи

НОВОЕ НА САЙТЕ