Qwen VLo menggabungkan kemampuan pemahaman dan generasi gambar secara multimodal.
Model menghasilkan gambar berkualitas tinggi dengan proses progresif dari kiri ke kanan dan atas ke bawah.
Menyempurnakan konsistensi semantik untuk mengubah atau mengedit konten gambar sesuai instruksi pengguna.
Mendukung instruksi terbuka seperti perubahan gaya, rekonstruksi adegan, dan perbaikan detail.
Memahami perintah dalam berbagai bahasa termasuk Mandarin dan Inggris.
Mampu melakukan tugas persepsi seperti deteksi, segmentasi, dan deteksi tepi melalui instruksi sederhana.
Mendukung masukan gambar ganda dan teks-ke-gambar dengan rasio aspek dinamis.
Menggunakan pelatihan resolusi dinamis untuk menyesuaikan output gambar tanpa batasan format.
Masih dalam tahap pratinjau dengan beberapa keterbatasan seperti ketidakakuratan dan ketidakstabilan.
Get notified when new stories are published for "Berita Peretas 🇮🇩 Bahasa Indonesia"