Qwen VLoは画像理解と生成を統合したプレビューモデルです。
左上から右下への漸進的生成で高品質な画像を生成します。
自然言語のオープンな指示で多様な編集やスタイル変換が可能です。
中国語や英語など多言語の指示に対応します。
任意解像度・アスペクト比の動的生成をサポートします。
テキストから画像生成や複数画像入力にも対応しています。
生成結果を自己解析し、認識や注釈を行う能力も備えています。
プレビュー版のため不安定な点や指示の不整合が残ります。
Get notified when new stories are published for "🇯🇵 Hacker News 日本語"