Βιβλιοθήκη φωτογραφιών με τοπικό AI για το 2025

1

Ο ζητών επιδιώκει ένα αυτοδιαχειριζόμενο σύστημα με τοπική αναγνώριση προσώπων, αυτόματες λεζάντες και αναζήτηση φυσικής γλώσσας.

2

Προτάθηκαν λύσεις ανοικτού κώδικα όπως Immich, Photoprism, Ente, Nextcloud με Recognize και Home Gallery για ολοκληρωμένη αυτο-φιλοξενία.

3

Συστήνεται η χρήση Docker containers για διαχωρισμό εργασιών, π.χ. ξεχωριστό κοντέινερ για αναγνώριση προσώπων.

4

Προτείνεται pipeline με OpenCV ή MTCNN για πρώιμη ανίχνευση προσώπων πριν την επεξεργασία από VLMs όπως Gemma3 ή SmolVLM.

5

Η αποθήκευση embeddings λεζαντών, αναγνωρισμένων προσώπων και EXIF μεταδεδομένων σε vector βάσεις (π.χ. ChromaDB) επιταχύνει την αναζήτηση.

6

Μοντέλα όπως Mistral Small, Qwen 2.5VL και Gemma3 μπορούν να τρέχουν τοπικά μέσω Ollama ή παρόμοιων εργαλείων.

7

Η χρήση S3-συμβατών αποθηκευτικών (MinIO, Backblaze B2) και εργαλείων όπως rclone διευκολύνει τη διαχείριση μεγάλων συλλογών.

8

Κάποια εργαλεία προσφέρουν E2E κρυπτογράφηση και CLI utilities για τοπικό backup και συγχρονισμό.