ClickHouse merombak ulang full-text search dengan native inverted index yang terintegrasi ke desain kolom untuk kinerja dan efisiensi ruang lebih baik.
Indeks teks menggunakan kamus kompak berbasis Finite State Transducers (FST) dan daftar posting terkompresi dengan Roaring bitmaps untuk lookup cepat.
API baru memperkenalkan sintaks INDEX yang lebih intuitif serta fungsi searchAny dan searchAll yang menyesuaikan tokenizer indeks.
Tokenizer ‘split’ ditambahkan untuk mengelola teks semi-terstruktur dengan pembatas khusus, sementara tokenizer ngram mendukung pencarian fuzzy.
Peningkatan kompresi PFOR untuk daftar posting dan Zstd untuk FST menurunkan jejak disk hingga 30%+.
Granularitas indeks diubah menjadi 64 untuk keseimbangan optimal antara presisi dan performa.
Bloom filter kini berperan sebagai pre-filter otomatis untuk mengurangi I/O sebelum mengakses FST.
Optimasi baru memungkinkan pencarian hingga 10x lebih cepat dengan melewatkan pembacaan kolom teks dan hanya menggunakan indeks.
Get notified when new stories are published for "Berita Peretas 🇮🇩 Bahasa Indonesia"