Новости Нейросеть ruDALL-E генерирует изображения по текстовым описаниям

  • Автор темы BOOX
  • Дата начала

BOOX

Стаж на ФС с 2012 года
Команда форума
Служба безопасности
Private Club
Регистрация
23/1/18
Сообщения
28.639
Репутация
11.595
Реакции
61.561
RUB
50
В недрах «Сбера» разработана нейросеть, способная преобразовать русскоязычный текст в довольно качественные изображения. Утверждается, что она подойдёт для создания векторных изображений, рекламных материалов, разработки дизайна и даже стоковых картинок.


Картинки формируются в три этапа: первая нейросеть преобразует текст в изображения, вторая выбирает из предложенных вариантов самые подходящие, а третья масштабирует их без потери качества.

Известно, что разработчики предлагают две системы: ruDALL-E XL с 1,3 млрд параметров и ruDALL-E 12B с 12 млрд, причём ruDALL-E XL бесплатно загружается с GitHub. По данным издания, скоро оба варианта будут «доступны на платформе ML Space в хабе предобученных моделей и датасетов DataHub от SberCloud».

29707c0b254354e00000.jpg


Эксперименты показали, что нейросеть получила от разработчиков довольно специфическое мировоззрение. На представленных изображениях можно увидеть, насколько мрачно ruDALL-E видит нашу реальность. Изображены последовательно: «Марк Цукерберг», «ёжик в тумане», на последней — именно так выглядит «конец света» по версии «Сбера».

4b85ca39fd9adec00000.jpg


Как сообщают разработчики, на обучение нейросети ушло 23 тыс. часов. За это время машинные алгоритмы проанализировали 120 млн комбинаций текста и изображений. По данным «Сбера», в настоящее время это самый крупный вычислительный нейросетевой проект в России и странах СНГ.

fa66037ee7a7aa3a900000.jpg
 
Сверху Снизу