Представлена первая российская диффузионная модель для генерации изображений по тексту на разных языках

Представлена первая российская диффузионная модель для генерации изображений по тексту на разных языках

На международной конференции по искусственному интеллекту (ИИ) Artificial Intelligence Journey Сбер представил Kandinsky 2.0 - первую российскую мультиязычную диффузионную модель для генерации изображений по текстовому описанию с 2 млрд параметров.

Нейросеть разработали и обучили исследователи Sber AI при партнёрской поддержке ученых из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и SberDevices из 1 млрд пар «текст - изображение». Увидеть, как она рисует, можно на сайте FusionBrain, а также при помощи команды «Запусти художника» на умных устройствах Sber и в мобильном приложении Салют.

FusionBrain.ai - открытый портал для демонстрации моделей, приближающих мир к созданию AGI (Artificial General Intelligence, сильный искусственный интеллект) от Института AIRI, который Сбер решил поддержать, первым выложив свою модель на ресурсе. В будущем на сайте FusionBrain.ai будут доступны как генеративные, так и передовые мультимодальные и мультизадачные модели.
В Kandinsky 2.0 разработчики использовали набирающий популярность диффузионный подход, поскольку модели подобной архитектуры, в отличие от трансформеров, дают хорошие результаты почти во всех задачах генерации мультимедийного контента по текстовому описанию (синтез изображений, видео, 3D и аудио).

Модель способна одинаково быстро и качественно обрабатывать запросы на 101 языке. Среди них как распространённые русский и английский, так и более редкие, например, монгольский. Система поймёт задачу, даже если в одном запросе будут слова на разных языках.
Kandinsky 2.0 отличается от своего предшественника более сочной, глубокой и реалистичной картинкой и расширенными возможностями. На сайте FusionBrain изображения можно генерировать в 20 различных стилях, среди которых ренессанс, классицизм, мультипликация, Новый год и даже хохлома. В модели также реализованы функции inpainting (замена любой части изображения и любого объекта на изображении на сгенерированные нейросетью) и outpainting (возможность дорисовывать готовое изображение и фон вокруг картинки).

Кроме того, в Kandinsky 2.0 пользователи могут оценить, как одинаковые с точки зрения смысла лингвистические конструкции и понятия отличаются в зависимости от языка и культурной окраски. Например, если сформулировать запрос «национальное блюдо» на русском языке, нейросеть чаще всего рисует щи, а на японском это будет мисо суп и суши.

Александр Ведяхин, первый заместитель Председателя Правления Сбербанка:

«Мы продолжаем развивать решения для автоматической генерации изображений по описанию на естественном языке - так называемый креативный ИИ. Kandinsky 2.0, который пришёл на смену первой версии модели, - прорыв в этой сфере. Наша модель позволяет за несколько секунд получить уникальную картинку под конкретную задачу и свободно распространять её без лицензии, что очень актуально для бизнеса. Генеративные модели развиваются очень быстро: ещё четыре года назад даже постановку такой задачи сложно было представить, а сегодня мы имеем работающую модель, которая понимает 101 язык и рисует реалистичные изображения, которые зачастую неотличимы от тех, что создают люди».

Сейчас также читают: 1 млн выплатят родителям тройняшек в Мурманской области

Другие новости за сегодня

НОВОСТИ МУРМАНСКА И
МУРМАНСКОЙ ОБЛАСТИ

19:22Хор мальчиков из Питера выступит в Полярных Зорях

19:05На подъездах к Лопарской, Магнетитам, Снежногорску и Абрам-Мысу появится наружное освещение в 2025 году

18:26Мурманские криминалисты спасли древний артефакт, попавший в руки нацистов

18:03Произведённый на мурманских заводах СПГ может быть более конкурентоспособен по цене, чем СПГ из США — эксперт

17:44Делегация Мурманской области работает на Всероссийском муниципальном форуме «Малая Родина — сила России»

17:40Спортсменка из Мурманска стала победителем финала Кубка России во Владивостоке

17:24Мурманчане могут бесплатно посмотреть космическую драму Роберта Земекиса «Контакт» на большом экране

16:19Мончегорский агроном заплатит 20 тыс. штрафа за хранение конопли

15:24На опасных участках реки Варзуги пробурили лед

15:01Стало известно, какие дороги в Мурманске отремонтируют в 2025 году по нацпроекту

14:47После ликвидации гаджета в окно племянник нанес мурманчанке несколько ударов по голове

13:46Трое взрослых и трое детей пострадали в ДТП на трассе в районе Шонгуя

00:01Хилая рассада окрепнет прямо на глазах: в деревнях ее удобряют только так — результат ошеломляющий

00:004 стильных образа, доказывающих, что 50+ — это время расцвета

23:30Как избавиться от змей на дачном участке: проверенные дедовские способы

23:28Гора еды из 1 банки консервов: спасибо бабушке — научила готовить это «чудо»

23:16Докажите, что не прогуливали математику: решите пример за 15 секунд — только если IQ>115

22:27Выбор модных очков: как подобрать — чтобы подходили к лицу, а не искажали

Все новости