哈夫曼编码的压缩能力确实蛮强,适合搞数据库和大数据的同学。文章一步步讲了怎么用字符频率构建哈夫曼树,再生成唯一的二进制编码,逻辑挺清楚的。你要是搞压缩优化的,这波可以抄。
哈夫曼树的构建思路比较简单:频率越高的字符,编码越短。最终生成的压缩数据,也更省空间,传输快不少。嗯,文章里代码实现也挺实在,适合直接搬到项目里试试。
预权重和并行计算这块是亮点,尤其大数据量时,提速不少。读起来没那么死板,思路清晰,还有优化建议,这点加分。你可以边看边动手写个简单版。
如果你做数据库压缩、数据传输、或者就想搞懂哈夫曼编码怎么回事,真的可以看看这篇。顺手还能看看下面这几篇相关文章,搭配食用更香。