From d36c5c806b58e3280286151f18d229ae9aaa3d93 Mon Sep 17 00:00:00 2001 From: Cerdore Date: Tue, 24 Aug 2021 23:52:46 +0800 Subject: [PATCH] =?UTF-8?q?=E4=BF=AE=E5=A4=8D=E5=90=8D=E7=A7=B0=E4=BD=BF?= =?UTF-8?q?=E7=94=A8=E4=B8=8D=E4=B8=80=E8=87=B4=E7=9A=84=E9=97=AE=E9=A2=98?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Signed-off-by: Cerdore --- .../\346\224\257\346\214\201HyperLogLog.md" | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git "a/content/zh/docs/CharacteristicDescription/\346\224\257\346\214\201HyperLogLog.md" "b/content/zh/docs/CharacteristicDescription/\346\224\257\346\214\201HyperLogLog.md" index 41487fe8d..a65ccb99a 100644 --- "a/content/zh/docs/CharacteristicDescription/\346\224\257\346\214\201HyperLogLog.md" +++ "b/content/zh/docs/CharacteristicDescription/\346\224\257\346\214\201HyperLogLog.md" @@ -14,7 +14,7 @@ ## 特性描述 -HLL(HyperLoglog)是统计数据集中唯一值个数的高效近似算法。它有着计算速度快,节省空间的特点,不需要直接存储集合本身,而是存储一种名为HLL的数据结构。每当有新数据加入进行统计时,只需要把数据经过哈希计算并插入到HLL中,最后根据HLL就可以得到结果。 +HLL(HyperLogLog)是统计数据集中唯一值个数的高效近似算法。它有着计算速度快,节省空间的特点,不需要直接存储集合本身,而是存储一种名为HLL的数据结构。每当有新数据加入进行统计时,只需要把数据经过哈希计算并插入到HLL中,最后根据HLL就可以得到结果。 HLL在计算速度和所占存储空间上都占优势。在时间复杂度上,Sort算法需要排序至少O\(nlogn\)的时间,虽说Hash算法和HLL一样扫描一次全表O\(n\)的时间就可以得出结果,但是存储空间上,Sort算法和Hash算法都需要先把原始数据存起来再进行统计,会导致存储空间消耗巨大。而对HLL来说不需要存原始数据,只需要维护HLL数据结构,所以占用空间始终是1280字节常数级别。 -- Gitee