0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Huffman压缩算法概述和详细流程

FPGA开源工作室 来源:FPGA开源工作室 2024-10-21 13:48 次阅读

1 概述

Huffman压缩算法是一种基于字符出现频率的编码算法,通过构建Huffman树,将出现频率高的字符用短编码表示,出现频率低的字符用长编码表示,从而实现对数据的压缩。以下是Huffman压缩算法的详细流程:
统计字符频率:遍历待压缩的数据,统计每个字符出现的频率。
构建优先队列:将每个字符及其频率作为一个结点放入优先队列(或最小堆)中,根据字符频率构建一个按频率大小排序的优先队列。
构建Huffman树:不断地从优先队列中取出频率最小的两个结点,合并为一个新结点,并将新结点重新插入到优先队列中,直到队列只剩下一个结点,即Huffman树的根结点。
生成Huffman编码:通过遍历Huffman树,从根结点到每个叶子结点的路径上的左右分支分别对应编码0和1,根据路径生成每个字符的Huffman编码。
压缩数据:根据生成的Huffman编码,将待压缩数据中的每个字符替换为对应的Huffman编码,得到压缩后的数据。
存储压缩表:将字符与对应的Huffman编码关系存储为压缩表,以便解压缩时使用。
存储压缩数据:将压缩后的数据以二进制形式存储。
在解压缩时,需要根据存储的Huffman编码表和压缩数据,使用相同的Huffman树结构进行解码,将压缩数据解压缩成原始数据,并输出原始数据。
Huffman压缩算法的优势在于可以根据数据的特征自适应地确定编码,使得出现频率高的字符拥有更短的编码,从而实现高效的数据压缩。然而,Huffman算法对于小规模数据压缩效果不佳,适用于处理较大规模的数据压缩。

2 huffman压缩算法过程详细演示

下面将通过一个简单的例子来演示Huffman压缩算法的压缩过程,假设有一个字符串 “ABRACADABRA” 需要进行压缩。

统计字符频率:

A: 5 次
B: 2 次
R: 2 次
C: 1 次
D: 1 次
2) 构建优先队列:
构建一个优先队列,按照字符频率排序:

(C, 1), (D, 1), (B, 2), (R, 2), (A, 5)
3) 构建Huffman树:
不断地从优先队列中取出频率最小的两个结点,合并为一个新节点,并重新插入队列中,直到队列只剩下一个节点,作为Huffman树的根节点。

合并过程:

(C, 1)和(D, 1) -> (CD, 2)
(B, 2)和(R, 2) -> (BR, 4)
((CD, 2) 和 (BR, 4)) -> ((CD)BR, 6)
((A, 5) 和 ((CD)BR, 6)) -> (((CD)BR)A, 11)
最终得到的Huffman树如下:
(((CD)BR)A)
/
(CD)BR A
/
CD BR
/ /
C D B R

生成Huffman编码:
从根节点开始,左分支为0,右分支为1,生成每个字符的Huffman编码:

A: 0
B: 101
R: 100
C: 1100
D: 1101
6) 压缩数据:
将原始数据字符串 “ABRACADABRA” 中的每个字符使用对应的Huffman编码替换,得到压缩后的数据。

原始数据:ABRACADABRA
Huffman编码:010110011001011010001011110
压缩后数据:010110011001011010001011110

在实际压缩过程中,还需要将Huffman编码表(字符与编码的映射关系)一并存储,以便在解压缩时使用。通过上述过程,原始数据被成功压缩,并且根据Huffman编码,高频字符编码较短,低频字符编码较长,实现了数据的有效压缩。

3 c语言Huffman压缩代码示例

以下是一个简单的C语言示例代码,实现了Huffman算法进行数据压缩和解压缩的功能:

#include 
#include 
#include 

#define MAX_TREE_HT 100

// 结点结构体
typedef struct MinHeapNode {
    char data;
    unsigned freq;
    struct MinHeapNode *left, *right;
} MinHeapNode;

// 最小堆结构体
typedef struct MinHeap {
    unsigned size;
    unsigned capacity;
    MinHeapNode **array;
} MinHeap;

// 创建新结点
MinHeapNode* newNode(char data, unsigned freq) {
    MinHeapNode* node = (MinHeapNode*)malloc(sizeof(MinHeapNode));
    node->left = node->right = NULL;
    node->data = data;
    node->freq = freq;
    return node;
}

// 创建最小堆
MinHeap* createMinHeap(unsigned capacity) {
    MinHeap* minHeap = (MinHeap*)malloc(sizeof(MinHeap));
    minHeap->size = 0;
    minHeap->capacity = capacity;
    minHeap->array = (MinHeapNode**)malloc(minHeap->capacity * sizeof(MinHeapNode*));
    return minHeap;
}

// 交换两个结点
void swapMinHeapNodes(MinHeapNode** a, MinHeapNode** b) {
    MinHeapNode* t = *a;
    *a = *b;
    *b = t;
}

// 最小堆调整
void minHeapify(MinHeap* minHeap, int idx) {
    int smallest = idx;
    int left = 2 * idx + 1;
    int right = 2 * idx + 2;

    if (left < minHeap->size && minHeap->array[left]->freq < minHeap->array[smallest]->freq)
        smallest = left;

    if (right < minHeap->size && minHeap->array[right]->freq < minHeap->array[smallest]->freq)
        smallest = right;

    if (smallest != idx) {
        swapMinHeapNodes(&minHeap->array[smallest], &minHeap->array[idx]);
        minHeapify(minHeap, smallest);
    }
}

// 获取最小结点
MinHeapNode* extractMin(MinHeap* minHeap) {
    MinHeapNode* temp = minHeap->array[0];
    minHeap->array[0] = minHeap->array[minHeap->size - 1];
    --minHeap->size;
    minHeapify(minHeap, 0);
    return temp;
}

// 插入结点
void insertMinHeap(MinHeap* minHeap, MinHeapNode* minHeapNode) {
    ++minHeap->size;
    int i = minHeap->size - 1;
    while (i && minHeapNode->freq < minHeap->array[(i - 1) / 2]->freq) {
        minHeap->array[i] = minHeap->array[(i - 1) / 2];
        i = (i - 1) / 2;
    }
    minHeap->array[i] = minHeapNode;
}

// 创建和构建最小堆
MinHeap* buildMinHeap(char data[], int freq[], int size) {
    MinHeap* minHeap = createMinHeap(size);
    for (int i = 0; i < size; ++i)
        minHeap->array[i] = newNode(data[i], freq[i]);
    minHeap->size = size;
    
    for (int i = size / 2 - 1; i >= 0; --i)
        minHeapify(minHeap, i);
    
    return minHeap;
}

// 检查结点是否是叶子结点
int isLeaf(MinHeapNode* root) {
    return !(root->left) && !(root->right);
}

// 构建霍夫曼树
MinHeapNode* buildHuffmanTree(char data[], int freq[], int size) {
    MinHeapNode *left, *right, *top;
    MinHeap* minHeap = buildMinHeap(data, freq, size);

    while (minHeap->size != 1) {
        left = extractMin(minHeap);
        right = extractMin(minHeap);
        top = newNode('$', left->freq + right->freq);
        top->left = left;
        top->right = right;
        insertMinHeap(minHeap, top);
    }

    return extractMin(minHeap);
}

// 打印霍夫曼编码
void printCodes(MinHeapNode* root, int arr[], int top) {
    if (root->left) {
        arr[top] = 0;
        printCodes(root->left, arr, top + 1);
    }

    if (root->right) {
        arr[top] = 1;
        printCodes(root->right, arr, top + 1);
    }

    if (isLeaf(root)) {
        printf("%c: ", root->data);
        for (int i = 0; i < top; ++i)
            printf("%d", arr[i]);
        printf("
");
    }
}

// 压缩数据
void huffmanCompression(char data[]) {
    int freq[256] = {0};
    int n = strlen(data);
    for (int i = 0; i < n; ++i)
        ++freq[data[i]];

    char arr[256];
    int freq2[256];
    int size = 0;
    
    for (int i = 0; i < 256; ++i) {
        if (freq[i] != 0) {
            arr[size] = (char)i;
            freq2[size] = freq[i];
            ++size;
        }
    }

    MinHeapNode* root = buildHuffmanTree(arr, freq2, size);
    int arr2[MAX_TREE_HT], top = 0;
    printCodes(root, arr2, top);
}

int main() {
    char data[] = "hello world";
    huffmanCompression(data);
    
    return 0;
}

这个示例代码演示了使用Huffman算法对输入的数据进行压缩,并打印出各个字符的Huffman编码。huffmanCompression 函数首先统计输入数据中每个字符的出现频率,并构建Huffman树,然后通过递归遍历Huffman树获取每个字符的Huffman编码并打印出来。在 main 函数中,我们对一个简单的字符串进行了压缩,并输出了每个字符的Huffman编码。

需要注意的是,这个示例代码仅演示了Huffman算法的基本压缩原理,实际应用中可能需要对数据内容、编码方式等进行更多处理和优化。

4 C语言Huffman解压缩算法示例

以下是一个简单的C语言示例代码,实现了Huffman算法进行数据解压缩的功能:

#include 
#include 
#include 

// 结点结构体
typedef struct MinHeapNode {
    char data;
    struct MinHeapNode *left, *right;
} MinHeapNode;

// 解压缩数据
void huffmanDecompression(char data[], MinHeapNode* root) {
    int n = strlen(data);
    MinHeapNode* current = root;
    
    for (int i = 0; i < n; ++i) {
        if (data[i] == '0') {
            current = current->left;
        } else {
            current = current->right;
        }

        if (current->left == NULL && current->right == NULL) {
            printf("%c", current->data);
            current = root;
        }
    }
}

int main() {
    // 构造Huffman树
    MinHeapNode *root = (MinHeapNode*)malloc(sizeof(MinHeapNode));
    root->left = root->right = NULL;

    MinHeapNode *A = (MinHeapNode*)malloc(sizeof(MinHeapNode));
    A->data = 'A';
    A->left = A->right = NULL;

    MinHeapNode *B = (MinHeapNode*)malloc(sizeof(MinHeapNode));
    B->data = 'B';
    B->left = B->right = NULL;

    MinHeapNode *C = (MinHeapNode*)malloc(sizeof(MinHeapNode));
    C->data = 'C';
    C->left = C->right = NULL;

    root->left = A;
    root->right = B;
    A->left = C;
    A->right = NULL;
    B->left = B->right = NULL;
    C->left = C->right = NULL;

    // 待解压缩的数据
    char data[] = "00100110001";

    // 解压缩数据
    huffmanDecompression(data, root);
    
    return 0;
}

在这个简单的示例代码中,我们首先构建了一个简单的Huffman树,然后定义了一个待解压缩的数据字符串。huffmanDecompression 函数接受压缩后的数据和Huffman树的根结点作为参数,通过逐位解析压缩后的数据,按照Huffman树逐步走到叶子结点,从而解压缩出原始数据并打印。

在 main 函数中,我们构造了一个简单的Huffman树,并指定了一个简单的待解压缩的数据字符串,然后调用 huffmanDecompression 函数进行解压缩操作。解压缩过程中,输出的字符序列应该是根据Huffman树进行解码后的原始数据。

需要注意的是,这个示例代码中的Huffman树和待解压缩的数据都是固定的,实际应用中可能需要根据具体的压缩数据和Huffman树结构进行相应的解压缩处理。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4585

    浏览量

    92427
  • C语言
    +关注

    关注

    180

    文章

    7587

    浏览量

    135718
  • 函数
    +关注

    关注

    3

    文章

    4273

    浏览量

    62284
  • Huffman
    +关注

    关注

    0

    文章

    4

    浏览量

    6336

原文标题:Huffman算法压缩解压缩(C)

文章出处:【微信号:leezym0317,微信公众号:FPGA开源工作室】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【案例分享】经典的压缩算法Huffman算法

    前两天发布那个rsync算法后,想看看数据压缩算法,知道一个经典的压缩算法Huffman
    发表于 07-17 04:30

    STM32自定义USB设备开发详细流程讲解

    STM32自定义USB设备开发详细流程讲解及全套资料源码下载
    发表于 08-03 09:50

    关于ADPCM压缩算法流程介绍

    关于ADPCM压缩算法流程介绍
    发表于 06-03 06:44

    视频压缩算法的特点和处理流程是怎样的?

    在本文中,我们将着重探讨视频压缩算法的特点和处理流程,我们将对基本的视频压缩算法进行解释,包括静态图像
    发表于 06-08 06:49

    常用数据无损压缩算法分析

    在数据采集和数据传输系统中常运用数据压缩技术,数据压缩通常可分为无损压缩和有损压缩两种。结合常用数据无损压缩
    发表于 12-23 10:17 0次下载

    多晶硅制备详细流程及图解

    多晶硅制备详细流程
    发表于 01-10 16:18 66次下载
    多晶硅制备<b class='flag-5'>详细流程</b>及图解

    基于ADPCM的语音压缩算法研究

    摘 要 ADPCM算法目前已成为很受用的语音压缩算法之一。给出PCM概念。讨论DPCM,DM,ADM与ADPCM的 压缩算法原理以及
    发表于 04-08 11:20 84次下载

    基于0阈值的双位图压缩_双Huffman组合压缩算法_许海英

    基于0阈值的双位图压缩_双Huffman组合压缩算法_许海英
    发表于 03-19 11:31 0次下载

    JPEG图像压缩算法流程详解

    在实际应用中,JPEG图像编码算法使用的大多是离散余弦变换、Huffman编码、顺序编码模式。这样的方式,被人们称为JPEG的基本系统。这里介绍的JPEG编码算法流程,也是针对基本系
    发表于 12-01 09:20 4.1w次阅读
    JPEG图像<b class='flag-5'>压缩</b><b class='flag-5'>算法</b><b class='flag-5'>流程</b>详解

    Huffman霍夫曼压缩编码算法实现分析

    哈夫曼编码Huffman方法于1952年问世,迄今为止仍经久不衰,广泛应用于各种数据压缩技术中,且仍不失为熵编码中的最佳编码方法,deflate等压缩算法也是结合了
    发表于 12-01 09:56 6886次阅读

    PID程序算法详细资料概述免费下载

    本文档的主要内容详细介绍的是PID程序算法详细资料概述免费下载
    发表于 07-24 08:00 36次下载

    压缩感知的理论框架和应用的系统概述和信号重构算法研究

    本文对压缩感知理论的理论框架和应用进行了系统概述。该理论针对稀疏信号,在对信号进行采样的同时完成数据压缩,从而大量节约了计算资源、存储资源和传输资源。它包括信号的稀疏变换、观测矩阵的设计和信号的重构
    发表于 12-18 17:21 8次下载
    <b class='flag-5'>压缩</b>感知的理论框架和应用的系统<b class='flag-5'>概述</b>和信号重构<b class='flag-5'>算法</b>研究

    PE工具安装的详细流程详细说明

    PE工具安装的详细流程详细说明
    发表于 12-10 08:00 29次下载

    BOSHIDA DC电源模块检测稳定性能详细流程

    BOSHIDA DC电源模块检测稳定性能详细流程 DC电源模块是电力电子产品中非常常见和重要的设备。它们被广泛应用于各种公共场所和工业领域,如通信系统、计算机、工业自动化以及医疗设备等。为确保电源
    的头像 发表于 06-30 11:08 554次阅读
    BOSHIDA DC电源模块检测稳定性能<b class='flag-5'>详细流程</b>

    自动售货机MDB协议中文解析(七)MDB-RS232控制纸币器的详细流程和解析

    自动售货机MDB协议中文解析(七)MDB-RS232控制纸币器的详细流程和解析
    的头像 发表于 09-09 10:04 348次阅读