用Regular Expression来改变HTML代码

2016-01-29 19:45 3 1 收藏

用Regular Expression来改变HTML代码,用Regular Expression来改变HTML代码

【 tulaoshi.com - ASP 】

       我最近在为一个客户开发在线论坛程序,我想把用户发言中的url或e-mail地址用超链接显示出来. 用JavaScript的regular expressions是最容易实现的.
  
  用户在表单里的多行文本框中输入他们的发言内容,然后把消息送到论坛的用户发言区中,然而,在把消息在论坛里显示出来之前,我要调用一个函数来处理消息,对url动些手脚.
  
  我不想在这里讨论如何从数据库里取得一条记录了,这个站点已经说得很透彻了. 我们假设用户的消息文本存放在数据库中,并被赋予了一个叫s_message的变量.
  
  <%
  
  '...start the page and spit out html to the browser
  
  'call the function to convert the message
  Response.Write to_html(s_message)
  
  %>
  
  函数如下:
  
  
  <%
  Function to_html(s_string)
  
  to_html = Replace(s_string, """", """)
  to_html = Replace(to_html, "<", "<")
  to_html = Replace(to_html, ">", ">")
  to_html = Replace(to_html, vbcrlf, "
  ")
  to_html = Replace(to_html, "/<", "<")
  to_html = Replace(to_html, "/>", ">")
  to_html = edit_hrefs(to_html)
  
  End Function
  %>
  
  <script language="javascript1.2" runat=server>
  function edit_hrefs(s_html){
  
  // use regular expressions to look for
  // e_mail addresses and urls
  s_str = new String(s_html);
  
  s_str = s_str.replace(/bhttp://www(.[w+.:/_]+)/gi,
  "http://?¤?$1");
  
  s_str = s_str.replace(/b(http://w+.[w+.:/_]+)/gi,
  "<a href="$1">$1</a>" target=_blank);
  
  s_str = s_str.replace(/b(www.[w+.:/_]+)/gi,
  "<a href="http://$1">$1</a>" target=_blank);
  
  s_str = s_str.replace(/bhttp://?¤?(.[w+.:/_]+)/gi,
  "<a href="http://www$1">http://www$1</a>" target=_blank);
  
  s_str = s_str.replace(/b(w+@[w+.?]*)/gi,
  "<a href="mailto:$1">$1</a>" target=_blank);
  
  
  return s_str;
  
  }
  </script>
  
  上面的代码做了这些事儿:
  
  1. 把引号转换成"这样的html元素. 这不是必需的,但最好这么做.
  
  2. 把小于号转换成html元素<. 这样的话,如果有人在发的消息里用到了小于
  号,html会正确输出. 另外,也防止某些人耍小花招,比如用<b>bold</b>来特定的字以粗体显示.
  
  3. 把大于号转换成>. 原因同上.
  
  4. 把回车换行转换成html换行标签"
  "
  
  5. 这就是我们要动的手脚. 它允许人们在代码里放入简单的html并逃脱代码的转换. 然而,他们得用"/"来避开对"<>"的代码检查. 我想总会有人找出绕过代码转换的办法的,如果他们办到了,用"牛"来形容他们的水平是再恰当不过的了.
  
  6. 最后,调用JavaScript的edit_hrefs的函数.
  
  现在,让我们来看看每行的JavaScript的函数做了些甚麽:
  
  1. 为传递函数的参数创建一个字符串对象.
  
  2. 把所有的http://www.[something]找出来,转换成http:////?¤?.
  [something]. 这是一个临时性的措施,处理所有的www.[something]. 因此
  http://www.pinarello.com/被替换成http://?¤?.pinarello.com/.
  
  3. 转换其余的http://[something],有些网址是不以www开头的. 比如
  http://uk.imdb.com/将被转换为<a
  href="http://uk.imdb.com/">http://uk.imdb.com/</a>
  
  4. 寻找所有

来源:https://www.tulaoshi.com/n/20160129/1510054.html

延伸阅读
原理跟用java生成jsp的servlet差不多。我们可以用printStream来向html文件里输出数据。 先创建一个StringBuilder对象,通过append方法来为其添加html语句。如下面例子所示: 代码如下: StringBuilder sb = new StringBuilder(); Properties fileProperties = getProperties("file"); Properties sqlProperties = getProperties("sql"); P...
标签: Web开发
代码例子如下: % Option Explicit Function stripHTML(strHTML) 'Strips the HTML tags from strHTML Dim objRegExp, strOutput Set objRegExp = New Regexp objRegExp.IgnoreCase = True objRegExp.Global = True objRegExp.Pattern = ".+?" 'Replace all HTML tag matches with the empty string strOutput = objRegExp.Replace...
标签: Web开发
HTML是 HyperText Tarkup Language的缩写,即超文本标记语言,是在WWW上建立超文本文件的语言,它通过标记和属性对一段文本的语言进行描述,它提供超文本连接,可以指向网络中另一台计算机的文件,HTML还支持在文本中镶入图象,声音,动画等不同格式的文件,HTML还具有强大的排版功能,利用HTML可以制作出任意版面的主页。 HTML有什么...
标签: Web开发
    对于文本框,只读状态下和普通状态下,浏览器对其并没有做什么特殊的标记,表面看来,效果是一样的,这样,对用户来说,易用性并不是很高.     当然,我们可以改变只读文本框的背景颜色来加以区分,这个时候就需要程序员自己判断这个文本框是不是只读,然后再引入相应的CSS,无疑加大了工作量.     这...
我心爱的原创调试工具之一,可以放便的测试正则Java表达式的正确性。开放它方便大家。 有人说,经常使用调试工具不是好习惯。应该是将整个模块代码都写完,再开始调试。有利有弊,自己衡量吧。 IFRAME border=0 src="http://j18forever.51.net/java/RegexTest/" frameBorder=no width=800 height=600>/IFRAME

经验教程

935

收藏

25
微博分享 QQ分享 QQ空间 手机页面 收藏网站 回到头部