利用C++实现哈夫曼算法

2016-02-19 12:23 2 1 收藏

下面,图老师小编带您去了解一下利用C++实现哈夫曼算法,生活就是不断的发现新事物,get新技能~

【 tulaoshi.com - 编程语言 】

我想每个计算机专业的学生或多或少都接触过哈夫曼编码,数据结构中的老问题了。大体就是给出一些字符,和这些字符的出现频率,让你为这些字符设计一个二进制编码,要求频率最高的字符的编码最短。解决的方法是构造一棵哈夫曼树(二叉树),其基本思路是,每次从这些字符中挑出两个频率最低的,然后构造一个新的结点,使新结点的左右孩子指针分别指向那两个节点。我想这个大家都很清楚了,我就不多说了。主要讲下这次我用C++实现时遇到的问题。首先,我定义了一个哈夫曼树结点:

class hNode
{
 public:
  friend bool operator (hNode n1,hNode n2); //定义了大于符号,供优先队列排列使用
  hNode(string d="",int i=0,hNode* l = NULL,hNode* r =NULL):left(l),right(r),data(d),value(i){}
  hNode* left;
  hNode* right;
  string data; //储存的字符串
  int value; //字符串出现的次数
};

bool operator (hNode n1,hNode n2)
{
 return n1.value n2.value;
}
  因为只是算法课的小作业,所以我也不准备为hNode定义完整的二叉树操作,仅仅只是存放数据的对象,所以只有一个构造函数,并且所有的data member都是公有的。

  这此写这个算法会遇到大麻烦,主要因为是用了std::priority_queue容器。当时考虑到在哈夫曼中要每次挑选两个频率最小(即出现次数最小,我那个hNode里的value是出现的次数),很自然的就想到了std::priority_queue容器,优先队列每次都会弹出队列中权值最高的元素,这个特性无疑是实现哈夫曼算法的最佳选择。然而因为第一次用std::priority_queue容器,结果出了不少问题,好在最后都一一解决,也学到了不少东西。

  初步的设想是这样的,先把所有的hNode对象都压入优先队列中去,然后每次弹出两个,组成一个新的结点,再把新的结点压入队列,重复这一步骤,当队列中只有一个元素时,哈夫曼树也就完成了。像这样:(是错的,可别学)

while(...)
{
 std::priority_queuehNode q;
 .....
 hNode h1 = q.top();
 q.pop();
 hNode h2 = q.top();
 q.pop();
 hNode r;
 r.left = h1;
 r.right = h2;
 r.value = h1.value + h2.value;
 q.push(r);
}
  然而遭遇的第一个问题是,STL的所有容器的的插入都是基于by value语义的,也就是要生成一个对象的副本放在容器中。这样的后果就是hNode的left,right指针都指到不知道什么地方去了。大家可以稍微画几个图试一下,就知道出了什么问题了。考虑一下后,发现如果队列里存放hNode的指针,就不会出现这个问题了,于是改写成:

hNode* makeTree(priority_queuehNode* pq)
{
 hNode* p1 = NULL;
 hNode* p2 = NULL;
 hNode* r = NULL;
 while( !pq.empty())
 {
  p1 = pq.top();
  pq.pop();
  if (pq.empty())
  {
   r = p1;
   return r;
  }
  p2 = pq.top();
  pq.pop();
  r =new hNode;
  r-left = p1;
  r-right = p2;
  r-value = p1-value +p2-value;
  pq.push(r);
 }
 return NULL;
}
  然而马上遭遇了第二个问题。std::priority_queue在判断优先关系的时候,直接比较指针的地址,而不是指针指向的对象的大小关系。而指针不是类,我没办法重写指针的比较操作。程序陷入了困境之中。std::priority_queue默认使用Greater模板来生成一个function object来对元素进行比较,我试图为Greater写一个hNode*的特化版本来改变优先队列对hNode*的比较,然而也没有成功。山重水复疑无路之时,突然想到为什么不直接为优先队列写一个function object来替代Greater不就可以了吗?赶快写下如下代码:

struct phNodeComp
{
 bool operator () (const hNode*& left,const hNode*& right) const
 {
  return left-value right-value;
 }
};
  然后把std::priority_queue的申明变为:

priority_queuehNode*,vectorhNode*,phNodeComp pq;
  终于把这个问题给解决了。看样子仅从书本上获得的知识是不牢靠的,一定要自己实践了才会有真正的认识。

来源:https://www.tulaoshi.com/n/20160219/1600767.html

延伸阅读
将算法独立抽象出来,在C++中算不上新鲜:STL中就封装了不少高效、健壮、灵活的泛型组件及对应的基础算法,工艺之高、适用性之强,非寻常我辈所轻易能及。这里不打算(也暂没有能力打算)以STL这样的工业级要求来谈论算法封装,只因最近尝翻大师名著,阅者水平有限,仅嗅触至皮毛,理智薄弱,感情却蓬勃发展:也欲尝试“封装”的味道。选择了最...
大家可能会想,程序和第三方提供了很多压缩方式,何必自己写压缩代码呢?不错,如GZIP这样的压缩工具很多,可是在某些情况下(如文本内容小且字符不重复),GZIP压缩后会比原始文本还要大。所以在某些特殊情况下用自己的压缩方式可以更优。 大家可能早已忘记了在学校学习的哈夫曼知识,可以先在百度百科了解一下哈夫曼知识:http://baike.baid...
开发定点(fixed-point)算法时,通常需要在设计功能性、数字精度建模、及验证(仿真)速度之间取得一个平衡。现在,一种新的数据类可使此过程简单化,由此得到更简单精确的建模精度、更好的数字求精、及更快的验证周期,而ANSI C/C++正是开发这种数字求精算法的最佳语言。 某此算法天生就适用于操作整数,或那些理想中的实数(如数字滤波器的系数...
程序代码如下: 代码如下: // BubbleSort.cpp : 定义控制台应用程序的入口点。 // #include "stdafx.h" #include cmath #include iostream using namespace std; #define  MAXNUM 20 templatetypename T void Swap(T& a, T& b) {     int t = a;     a = b;     b = t; } templatetypenam...
参数model有一个二维数组data,及阶数matrix // .h文件@class DataModel; @interface Algorithm : NSObject @property (nonatomic,assign) int addScore; // 加分 - (void)caculateTop:(DataModel *)model; // 上滑规则- (void)caculateBottom:(DataModel *)model; // 下滑规则- (void)caculateLeft:(DataModel *)model; // 左滑规则- (void...

经验教程

473

收藏

64
微博分享 QQ分享 QQ空间 手机页面 收藏网站 回到头部