Qwen VLo: Генерация И Понимание Изображений

1

Представлен Qwen VLo — объединённая мультимодальная модель для понимания и генерации изображений.

2

Модель последовательно создаёт изображение слева направо и сверху вниз с постоянной доработкой деталей.

3

Улучшена семантическая точность: сохранение структуры и стиля объектов при изменении цвета и других параметров.

4

Поддерживается редактирование по свободным инструкциям: смена художественного стиля, реконструкция сцены, добавление элементов, сегментация и детекция.

5

Обеспечена многоязычная поддержка (китайский, английский и др.) для удобного взаимодействия.

6

Поддерживается работа с несколькими входными изображениями и генерация по текстовым запросам, включая плакаты.

7

Реализована генерация изображений с динамическими разрешениями и нестандартными соотношениями сторон.

8

В превью-версии возможны неточности, рассогласованность с инструкциями и нестабильность распознавания.

Qwen VLo: Генерация И Понимание Изображений

Subscribe to Similar Stories

Qwen VLo: Генерация И Понимание Изображений

Subscribe to Similar Stories