Immich to popularne otwarte rozwiązanie do zarządzania zdjęciami z funkcjami AI.
Photoprism ma wolniejszy rozwój i problemy z rozpoznawaniem twarzy przy dużych kolekcjach.
Nextcloud z aplikacjami Recognize i Memories oferuje trafne wyniki i integrację przez Docker.
Ente to komercyjne/otwarte narzędzie z szyfrowaniem end-to-end, lokalnym AI i opcją self-hostingu.
Do generowania opisów obrazów warto wykorzystać modele Mistral Small, Gemma3 i Qwen 2.5VL za pomocą Ollama.
Pipeline przetwarzania może korzystać z OpenCV lub mtcnn do detekcji twarzy, Blip do podpisów i SentenceTransformer do chunkowania.
Dane przechowuje się w bazie wektorowej (np. ChromaDB), łącząc metadane EXIF oraz embeddingi twarzy i opisów.
CLIP może służyć do semantycznego indeksowania obrazów bez pełnego modelu językowego.
Rclone ułatwia agregację i deduplikację zdjęć z Google Photos, Apple Photos i innych usług.
Stable Diffusion z dodatkiem rembg sprawdza się w lokalnym usuwaniu tła zdjęć.
Get notified when new stories are published for "🇵🇱 Hacker News Polski"