Сбер выкатил свою нейроночку под названием Kandinsky 2.1 (@kandinsky21_bot), которая выдает действительно качественные изображения по текстовому описанию. Среди её возможностей — это:
- смешивание нескольких картинок,
- их изменение по текстовому описанию,
- дорисовывание недостающих частей картинки,
- и формирование изображения в режиме бесконечного полотна.
Запросы возможны на 101 языке, включая русский и английский. Также, новая нейронка способна творить в самых разных стилях. Разработкой и обучением нейросети занимались исследователи Sber AI на датасете компании SberDevices.
Стоит отметить, что нейросеть от Сбера была дообучена на отдельно собранном датасете из двух миллионов пар качественных картинок. Этот датасет включал в себя изображения с описаниями в традиционно сложных для нейросетей областях вроде текстов и лиц людей. Всё это позволяет Kandinsky 2.1 генерировать картинки еще более высокого качества и точности.
В целом, Kandinsky 2.1 представляет собой впечатляющий шаг в развитии генеративных моделей и может иметь широкий потенциал применения в различных областях, таких как искусство, дизайн, реклама и многих других.