Un filtro Bloom es una estructura de datos probabilística que indica si un elemento definitivamente no está o posiblemente está en un conjunto.
Utiliza un vector de bits y múltiples funciones de hash para marcar posiciones con valor 1 al insertar elementos.
La prueba de pertenencia puede producir falsos positivos, pero nunca falsos negativos.
La tasa de falsos positivos se calcula aproximadamente como (1−e^(−kn/m))^k y depende de los parámetros m, n y k.
La complejidad de inserción y consulta es O(k), lo que hace al filtro rápido y eficiente en memoria.
El valor óptimo de funciones de hash k se obtiene con la fórmula (m/n)·ln(2).
Se recomiendan hashes rápidos y no criptográficos como murmur, xxHash o fnv para máximo rendimiento.
Get notified when new stories are published for "🇪🇸 Hacker News Espanyol"