Początkowa implementacja z użyciem write/read osiągała jedynie ~3,5 GiB/s.
Zastosowanie vmsplice i splice (zero-copy) zwiększyło przepustowość do ~33 GiB/s.
Użycie 2 MiB huge pages przyspieszyło zamianę adresów na stronice i podniosło wydajność do ~51 GiB/s.
Busy looping zamiast blokowania jądra pozwolił osiągnąć ~62,5 GiB/s kosztem większego zużycia CPU.
Kluczowe koncepcje optimizacji to zero-copy, ring buffer potoku, zarządzanie stronami wirtualnymi oraz redukcja kosztów synchronizacji.
Get notified when new stories are published for "🇵🇱 Hacker News Polski"