Qwen VLo allie compréhension et génération d’images de façon unifiée et progressive.
Il prend en charge l’édition d’images par des instructions ouvertes en langage naturel.
Le modèle supporte plusieurs langues et résolutions dynamiques pour des générations personnalisées.
Il peut réaliser des tâches de perception visuelle (détection, segmentation, détection de contours) sur des images existantes.
Qwen VLo est en aperçu, avec des limites telles que des incohérences et une reconnaissance parfois inexacte.
Get notified when new stories are published for "🇫🇷 Hacker News Français"