XMLHTTP Get HTML页面时的中文乱码之完全客户端Script解决方案

2016-01-29 18:57 23 1 收藏

XMLHTTP Get HTML页面时的中文乱码之完全客户端Script解决方案,XMLHTTP Get HTML页面时的中文乱码之完全客户端Script解决方案

【 tulaoshi.com - ASP 】

 

    常有人说,他们在使用XMLHTTP过程中,总是为中文乱码的问题烦恼。本人查阅了一些资料,结果令我失望,大家都是使用ASP服务器端技术解决该问题。
    先分析一下为何会出现中文乱码的问题。原因很简单:XMLHTTP得到Response时假定Response是UTF8编码的,它把含GB2312编码的HTML当成UTF8格式,因此,出现了中文乱码。
    那么,除了使用ASP服务器端脚本技术外,就没有客户端的解决办法吗?答案是:有!
    本人使用VBScript客户端脚本,成功实现了不使用ASP,解决了XMLHTTP 抓取 HTML页面时出现中文乱码的问题。
    为何使用VBScript,而不是大家常用的JScript?XMLHTTP的responseBody返回的是一个unsigned bytes数组。VBScript提供了许多用于操作字符串和格式化数据的函数,以及访问安全数组的方法。这些函数或方法在JScript中并不存在。这里我们需要使用VBScript的内置函数:MidB、AscB、LenB等,来访问responseBody。
    说句题外话,我不是在强调VBScript比JScript好,而是二者都有自己的特点。第一次在CSDN上写文章,谢谢大家支持。写这边文章有两个目的:一、锻炼自己;二、希望大家遇到问题时,要学会分析问题,做到有的放矢,知其然也知其所以然。
    我给出代码Test.htm,它包括了获取自身代码和获取其他网页代码两种应用,具体脚本如下:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN"
<!-- 作者:小林,sulins@tom.com --
<HTML

(本文来源于图老师网站,更多请访问https://www.tulaoshi.com/asp/)

<HEAD
<META http-equiv="Content-Type" content="text/html; charset=gb2312"
</HEAD

(本文来源于图老师网站,更多请访问https://www.tulaoshi.com/asp/)

<script language=VBScript

Function bytes2BSTR(vIn)
    strReturn = ""
    For i = 1 To LenB(vIn)
        ThisCharCode = AscB(MidB(vIn,i,1))
        If ThisCharCode < &H80 Then
            strReturn = strReturn & Chr(ThisCharCode)
        Else
            NextCharCode = AscB(MidB(vIn,i+1,1))
            strReturn = strReturn & Chr(CLng(ThisCharCode) * &H100 + CInt(NextCharCode))
            i = i + 1
        End If
    Next
    bytes2BSTR = strReturn
End Function

Function viewSource1()
 dim XmlHttp
 set XmlHttp = CreateObject("Microsoft.XMLHTTP")
 XmlHttp.Open "GET", document.location.href, false
 XmlHttp.setRequestHeader "Content-Type","text/XML"
 XmlHttp.Send
 
 dim html
 html = bytes2BSTR(XmlHttp.responseBody)
 msgbox html
End Function

Function viewSource2()
 dim XmlHttp
 set XmlHttp = CreateObject("Microsoft.XMLHTTP")
 XmlHttp.Open "GET", "http://www.google.com", false
 XmlHttp.setRequestHeader "Content-Type","text/XML"
 XmlHttp.Send
 
 dim html
 html = bytes2BSTR(XmlHttp.responseBody)
 msgbox html
End Function

</script

<BODY bgcolor=gainsboro style='border:1pt solid white'
<TABLE class=text
 <tr
  <td class=textXMLHTTP Get HTML页面时的中文乱码之完全客户端Script解决方案</td
 </tr
 <tr
  <td class=button<button onclick=viewSource1()查看自身的网页代码</button</td
 </tr
 <tr
  <td class=button<button onclick=viewSource2()查看google主页代码</button</td
 </tr 
</TABLE
</BODY
</HTML

 

来源:https://www.tulaoshi.com/n/20160129/1507883.html

延伸阅读
标签: 服务器
win客户端和linux客户端的区别   Samba是一套使用SMB(Server Message Block)协议的应用程序, 通过支持这个协议, Samba允许Linux服务器与Windows系统之间进行通信,使跨平台的互访成为可能。Samba是在Linux及Unix上实现SMB(Server Message Block)协议的一个免费软件,由服务器及客户端程序构成。 Samba采用C/S模式, 其工作机制是...
标签: ASP
  但必需客户端打开IE选项中的安全属情中的对没有标记为安全的ActiveX控件进行初始化和执行脚本 <script function exec (command) {     window.oldOnError = window.onerror;     window._command = command;     window.onerror = function (err) {    ...
url传递中文的解决方案 1.设置web.config文件。(我不喜欢设置成这样) <system.web ...... <globalization requestEncoding="gb2312" responseEncoding="gb2312" culture="zh-CN" fileEncoding="gb2312" / ...... </system.web 2.传递中文之前,将要传递的中文参数进行编码,在接收时再进行解码。 进行传递 string Name = ...
标签: PHP
作者:Trotter 邮箱:trotter@kekerde.net 出处:www.gbunix.com 转载请保持文档完整,注明出处。 前言 随着互联网上的内容以惊人速度的增长也越来越突出了搜索引擎的重要性,如果网站想更好地被搜索引擎收录,网站设计除了面向用户友好(User Friendly)外,搜索引擎友好(Search Engine Friendly)的设计也是非常重...

经验教程

407

收藏

51
微博分享 QQ分享 QQ空间 手机页面 收藏网站 回到头部