«Сбер» запустил нейросеть ruDALL-E, которая генерирует изображения по тексту
2021-11-03 13:42:22
«Сбер» запустил нейросеть ruDALL-E, способную создавать изображения на основе текстов. На данный момент сервис перегружен, поэтому генерация картинок занимает около 40 минут.
Утверждается, что изображения формируются в три этапа: сначала нейросеть преобразует текстовую информацию в визуальную, затем выбирает самые подходящие образы, а после масштабирует их в высоком качестве.
Используются две системы — ruDALL-E XL с 1,3 млрд параметров (загружается бесплатно с GitHub) и ruDALL-E 12B с 12 млрд. В «Сбер» утверждают, что ruDALL-E стал самым большим нейросетевым вычислительным проектом в России и СНГ.
Мы проверили, как работает нейросеть. На первом фото изображение по запросу «Игромания», на втором — Skyrim, на третьем — Геншин, на четвёртом — Final Fantasy, на пятом — Baldur's Gate, на шестом — Grand Theft Auto, на седьмом — Last of Us, на восьмом — Mortal Kombat.
Больше на Игромании
Подробнее https://www.igromania.ru/news/110427/Sber_zapustil_neyrose...