Un filtre de Bloom est une structure de données probabiliste qui vérifie rapidement l’appartenance possible ou définitive d’un élément à un ensemble.
Il repose sur un vecteur de bits où les positions sont définies par plusieurs fonctions de hachage indépendantes.
Les tests de présence se traduisent par un risque de faux positif mais aucun faux négatif.
Le taux de faux positif peut être ajusté en fonction du nombre de bits, d’éléments et de fonctions de hachage.
L’insertion et la vérification d’un élément s’effectuent en O(k) avec k fonctions de hachage.
Le choix optimal du nombre de fonctions de hachage k se fait avec la formule k = (m/n) ln(2).
Les filtres de Bloom sont utilisés pour économiser de la mémoire dans divers systèmes distribués et bases de données.
Get notified when new stories are published for "🇫🇷 Hacker News Français"