Ο ζητών επιδιώκει ένα αυτοδιαχειριζόμενο σύστημα με τοπική αναγνώριση προσώπων, αυτόματες λεζάντες και αναζήτηση φυσικής γλώσσας.
Προτάθηκαν λύσεις ανοικτού κώδικα όπως Immich, Photoprism, Ente, Nextcloud με Recognize και Home Gallery για ολοκληρωμένη αυτο-φιλοξενία.
Συστήνεται η χρήση Docker containers για διαχωρισμό εργασιών, π.χ. ξεχωριστό κοντέινερ για αναγνώριση προσώπων.
Προτείνεται pipeline με OpenCV ή MTCNN για πρώιμη ανίχνευση προσώπων πριν την επεξεργασία από VLMs όπως Gemma3 ή SmolVLM.
Η αποθήκευση embeddings λεζαντών, αναγνωρισμένων προσώπων και EXIF μεταδεδομένων σε vector βάσεις (π.χ. ChromaDB) επιταχύνει την αναζήτηση.
Μοντέλα όπως Mistral Small, Qwen 2.5VL και Gemma3 μπορούν να τρέχουν τοπικά μέσω Ollama ή παρόμοιων εργαλείων.
Η χρήση S3-συμβατών αποθηκευτικών (MinIO, Backblaze B2) και εργαλείων όπως rclone διευκολύνει τη διαχείριση μεγάλων συλλογών.
Κάποια εργαλεία προσφέρουν E2E κρυπτογράφηση και CLI utilities για τοπικό backup και συγχρονισμό.
Get notified when new stories are published for "🇬🇷 Hacker News Ελληνικά"