UTF-8与GB2312之间的互换

2016-01-29 12:16 38 1 收藏

UTF-8与GB2312之间的互换,UTF-8与GB2312之间的互换

【 tulaoshi.com - C语言心得技巧 】

UTF-8与GB2312之间的互换

作者:吴康彬

  相信一定有不少的程序开发人员时常会遇到字符编码的问题,而这个问题也是非常让人头痛的。因为这些都是潜在的错误,要找出这些错误也得要有这方面的开发经验才行。特别是在处理xml文档时 ,该问题的出现就更加的频繁了,有一次用java写服务器端程序,用vc写客户端与之交互。交互的协议都是用xml写的。结果在通讯时老是发现数据接受不正确。纳闷!于是用抓取网络数据包工具抓取数据,后来才发现原来是java上xml的头是这样的<?xml version="1.0" encoding="UTF-8"?,而vc上默认的是GB2312。所以一遇到汉字数据就不正确了。去网上找资料,这方面的文章好象特别少,针对像这样的问题,下面我介绍一下我自己写的一个转换程序。当然,程序很简单。如果有画蛇添足的地方,还望各位高手一笑了之。
  如果您对UTF-8、Unicode、GB2312等还是很陌生的话,请查看http://www.linuxforum.net/books/UTF-8-Unicode.html,我这里就不浪费口舌了。下面介绍一下WinAPI的两个函数:WideCharToMultiByte、MultiByteToWideChar。

函数原型:
int WideCharToMultiByte(UINT CodePage, // code pageDWORD dwFlags, // performance and mapping flagsLPCWSTR lpWideCharStr, // wide-character stringint cchWideChar, // number of chars in stringLPSTR lpMultiByteStr, // buffer for new stringint cbMultiByte, // size of bufferLPCSTR lpDefaultChar, // default for unmappable charsLPBOOL lpUsedDefaultChar // set when default char used); //将宽字符转换成多个窄字符int MultiByteToWideChar(UINT CodePage, // code pageDWORD dwFlags, // character-type optionsLPCSTR lpMultiByteStr, // string to mapint cbMultiByte, // number of bytes in stringLPWSTR lpWideCharStr, // wide-character bufferint cchWideChar // size of buffer);//将多个窄字符转换成宽字符      
需要用到的一些函数:
CString CXmlProcess::HexToBin(CString string)//将16进制数转换成2进制{if( string == "0") return "0000";if( string == "1") return "0001";if( string == "2") return "0010";if( string == "3") return "0011";if( string == "4") return "0100";if( string == "5") return "0101";if( string == "6") return "0110";if( string == "7") return "0111";if( string == "8") return "1000";if( string == "9") return "1001";if( string == "a") return "1010";if( string == "b") return "1011";if( string == "c") return "1100";if( string == "d") return "1101";if( string == "e") return "1110";if( string == "f") return "1111";return "";}CString CXmlProcess::BinToHex(CString BinString)//将2进制数转换成16进制{if( BinString == "0000") return "0";if( BinString == "0001") return "1";if( BinString == "0010") return "2";if( BinString == "0011") return "3";if( BinString == "0100") return "4";if( BinString == "0101") return "5";if( BinString == "0110") return "6";if( BinString == "0111") return "7";if( BinString == "1000") return "8";if( BinString == "1001") return "9";if( BinString == "1010") return "a";if( BinString == "1011") return "b";if( BinString == "1100") return "c";if( BinString == "1101") return "d";if( BinString == "1110") return "e";if( BinString == "1111") return "f";return "";}int CXmlProcess::BinToInt(CString string)//2进制字符数据转换成10进制整型{int len =0;int tempInt = 0;int strInt = 0;for(int i =0 ;i < string.GetLength() ;i ++){        tempInt = 1;        strInt = (int)string.GetAt(i)-48;        for(int k =0 ;k < 7-i ; k++)        {tempInt = 2*tempInt;        }        len += tempInt*strInt;}return len;}      
  UTF-8转换成GB2312先把UTF-8转换成Unicode.然后再把Unicode通过函数WideCharToMultiByte转换成GB2312
WCHAR* CXmlProcess::UTF_8ToUnicode(char *ustart)  //把UTF-8转换成Unicode{char char_one;char char_two;char char_three;int Hchar;int Lchar;char uchar[2];WCHAR *unicode;CString string_one;CString string_two;CString string_three;CString combiString;char_one = *ustart;char_two = *(ustart+1);char_three = *(ustart+2);string_one.Format("%x",char_one);string_two.Format("%x",char_two);string_three.Format("%x",char_three);string_three = string_thr
                        

来源:https://www.tulaoshi.com/n/20160129/1485357.html

延伸阅读
标签: Web开发
用XMLHTTP Post Form时的表单乱码有两方面的原因——Post表单数据时中文乱码;服务器Response被XMLHTTP不正确编码引起的乱码。换句话说,本文主要解决两个问题——怎样正确Post中文内容&怎样正确显示得到的中文内容。 Part I Post中文内容 先看看E文的表单是怎么提交的: 代码如下: SCRIPT language="JavaScrip...
 UTF8转换成GB2312 当我们在基于HTTP协议的JSP或Servlet的应用中获取数据或发送请求时,JVM会把输送的数据编码成UTF8格式。如果我们直接从HTTP流中提取中文数据,提取的结果为“????”(可能更多问号),为转换成我们能够理解的中文字符,我们需要把UTF8转换成GB2312,借助ISO-8859-1标准编码能够轻易的实现,下面的代码实现了这一功能: ...
标签: 电脑入门
UTF8编码和GB2312编码是有区别的,在sqlplus中导入UTF8编码的sql脚本就会出现乱码错误,这时就需要将UTF8编码转换成GB2312编码,可是一个个的转换十分麻烦,下面图老师小编就教你如何在Linux下将UTF8编码批量转换成GB2312编码。 背景 本人在使用oracle的sqlplus批量导入UTF8编码的sql脚本时,由于不了解如何设置让sqlplus识别UTF8格式,...
UTF8转换成GB2312 当我们在基于HTTP协议的JSP或Servlet的应用中获取数据或发送请求时,JVM会把输送的数据编码成UTF8格式。如果我们直接从HTTP流中提取中文数据,提取的结果为“????”(可能更多问号),为转换成我们能够理解的中文字符,我们需要把UTF8转换成GB2312,借助ISO-8859-1标准编码能够轻易的实现,下面的代码实现了这一功能: ...
标签: Web开发
代码如下: %@ page contentType="text/html;charset=gb2312 " % 改为: 代码如下: %@ page contentType="text/html;charset=gb2312" % 后就正常了。 问题虽然解决了,但有点不明白为什么多了个空格就会出错,请各位大虾指点迷津。

经验教程

80

收藏

45
微博分享 QQ分享 QQ空间 手机页面 收藏网站 回到头部