Kandinsky (Kandinsky)
Kandinsky | |
---|---|
Тип | нейронная сеть |
Языки интерфейса | русский |
Первый выпуск | 2022 год |
Kandinsky — проект, сервис и приложение компании «Сбер», с помощью которого пользователи могут генерировать изображения по текстовому описанию с помощью нейросетей.
История
[править | править код]В ноябре 2021 года были выложены в открытый доступ код и параметры модели ruDALL-E XL, содержащей 1,3 млрд параметров, а также создан сервис генерации изображений. В июне 2022 года была представлена улучшенная модель — ruDALL-E XXL с 12 млрд параметров, которую дообучили на 179 млн изображений с текстовыми описаниями. В итоге была получена первая версия сервиса Kandinsky[1].
23 ноября 2022 года на конференции «Путешествие в мир искусственного интеллекта» Сбер представил новую версию нейросети — Kandinsky 2.0. От предыдущей она отличается своей мультиязычностью и диффузным подходом. Вторая версия обучалась на 1 млрд пар «текст-изображение»[2].
В начале апреля 2023 года вышла Kandinsky 2.1. Она была обучена ещё на дополнительных 170 млн пар изображений с текстом. Нейросеть была также усовершенствована за счет новой обученной модели автоэнкодера. Помимо закодированных текстовых описаний, модель использует специальное представление изображения моделью CLIP[3]. На начало июля 2023 года пользователи создали с помощью нейросети более 70 млн изображений. Наиболее популярными запросами были «Россия», «любовь», «аниме», «кот» и «космос»[4].
12 июля 2023 года Сбер выпустил версию нейросети Kandinsky 2.2. Сообщается, что теперь сервис умеет создавать фотореалистичные изображения в улучшенном качестве и изменять соотношение сторон при генерации. Нейросеть дополучили на датасете, содержащем 1,5 млрд пар «текст — изображение»[5]. В течение суток после выхода Kandinsky 2.2 пользователи сгенерировали 1 млн изображений, лидерами по популярности стали темы «коты», «море» и «аниме»[6].
12 октября 2023 года в Kandinsky 2.2 появилась возможность генерировать четырёхсекундные ролики по текстовому описанию[7].
22 ноября 2023 года Сбер представил новую версию нейросети — 3.0 в рамках конференции «AI Journey». Одной из главных особенностей модели является лучшее знание русской культуры[8]. Также на мероприятии прошла презентация первой в России нейросети, предназначенной для генерации видео по текстовому описанию — Kandinsky Video[9].
22 апреля 2024 года пользователям стала доступна усовершенствованная версия сервиса — 3.1, появившаяся в этом же месяце. В ней улучшилось качество генерируемых картинок засчёт дообучения на датасете эстетичных изображений[10].
28 мая 2024 года Сбер открыл бесплатный доступ к обновлённой бета-версии Kandinsky 1.1. Сервис, кроме генерации по текстовому описанию, может также создавать изображение по картинке[11].
Описание
[править | править код]Согласно заявлениям разработчиков, сервис поддерживает более 100 языков, включая русский.
Сервис поддерживает четыре основных режима работы:
- генерация изображения по текстовому описанию
- микширование двух изображений
- микширование изображения и текстового описания дополнения
- стилистическая переработка изображения
Актуальная версия — Kandinsky 3.1.
См. также
[править | править код]Примечания
[править | править код]- ↑ «Сбер» представил Kandinsky — ИИ-модель для генерации изображений по текстовому описанию на русском языке . 3dnews.ru (14 июня 2022). Дата обращения: 11 июля 2023. Архивировано 11 июля 2023 года.
- ↑ Сбер показал нейросеть Kandinsky 2.0 для генерации изображений по текстам . РБК (23 ноября 2022). Дата обращения: 11 июля 2023. Архивировано 11 июля 2023 года.
- ↑ Сбер представил нейросеть Kandinsky 2.1 . Lenta.ru (4 апреля 2023). Дата обращения: 11 июля 2023. Архивировано 11 июля 2023 года.
- ↑ Сбер подсчитал число созданных нейросетью Kandinsky 2.1 изображений . Lenta.ru (4 июля 2023). Дата обращения: 12 июля 2023. Архивировано 12 июля 2023 года.
- ↑ Сбер представил новую версию своей нейросети Kandinsky . Газета.ru (12 июля 2023). Дата обращения: 13 июля 2023. Архивировано 13 июля 2023 года.
- ↑ За сутки пользователи Kandinsky 2.2 от Сбера создали миллион изображений . Lenta.ru. — новость. Дата обращения: 14 июля 2023. Архивировано 14 июля 2023 года.
- ↑ Нейросеть Kandinsky 2.2 научилась создавать анимационные видеоролики . Российская газета (12 октября 2023). Дата обращения: 14 октября 2023. Архивировано 13 октября 2023 года.
- ↑ Сбер представил новую версию нейросети Kandinsky 3.0 . ТАСС (22 ноября 2023). Дата обращения: 30 апреля 2024.
- ↑ [hhttps://hi-tech.mail.ru/news/104247-sber-predstavil-kandinsky-video/ Сбер представил Kandinsky Video — первую в России нейросеть для создания видео] . Hi-tech Mail.ru (22 ноября 2023). Дата обращения: 29 мая 2024.
- ↑ Изобразительная нейросеть Kandinsky 3.1 стала доступна для всех пользователей . 3dnews.ru (22 апреля 2024). Дата обращения: 30 апреля 2024.
- ↑ Сбер открыл доступ к обновленной версии Kandinsky Video . Лента.ру (28 мая 2024). Дата обращения: 1 июня 2024.