把Word转为简洁的html的若干种方法

2016-02-19 18:52 190 1 收藏

想要天天向上,就要懂得享受学习。图老师为大家推荐把Word转为简洁的html的若干种方法,精彩的内容需要你们用心的阅读。还在等什么快点来看看吧!

【 tulaoshi.com - Web开发 】

  word可以直接另存为 htm,但即使是 另存为 html 也会有大量的废代码。以前我一般用 dreamweaver 的 clean up html 来处理,先处理 word 特有标签,然后删除一些 font,b,span 等。进一步,在 editplus 里面用正则进行处理,最后得到我想要的干净的html 代码。当然最完美的办法就是拷贝文字出来,自己用文本编辑器书写htm标签,:)

  今天又看到lifehacker这几种word 2 clean htm方法:

  1.使用这个HTML Tidy Library Project开源软件来处理。

  2.微软官方站点也有个Office 2000 HTML Filter 2.0工具,可以用来处理掉word2000转html时出现的多余代码。

(本文来源于图老师网站,更多请访问https://www.tulaoshi.com/webkaifa/)

  3.使用这个Word HTML Cleaner 在线工具来处理。只能处理word2000以下版本。

  4.有人给出了正则表达式(其实,上面的各种软件也都是用正则来解决的)

  删除不需要的标签

(本文来源于图老师网站,更多请访问https://www.tulaoshi.com/webkaifa/)

  [/]?(font|span|xml|[ovwxp]:w+)[^]*?
- replace any matches with the empty string

  删除class,style...等不需要的属性

  ([^]*)(?:class|lang|style|size|face|[ovwxp]:w+)=(?:'[^']*'|""[^""]*""|[^]+)([^]*)
- replace any matches with $1$2

  详细解释在Clean Word HTML using Regular Expressions

来源:https://www.tulaoshi.com/n/20160219/1619301.html

延伸阅读
标签: Web开发
script function toScript(val) {  var value = val.value  value  = value.replace(/\\/gi,"\\\\").replace(/"/gi,"\\\"").replace(/'/gi,"\\\'")  valArr = value.split("\r\n")  value=""  for (i=0; ivalArr.length; i++)  {   value += (i==0) ? "info =" : ""   value += "  \"" + va...
标签: PS教程
最终效果图:   下面是教程: 素材:
辣妹备注:今天收到cqq(就那个用java破解天意后台系统那个老兄)的来信,可惜他编译好的是个class文件. 我对编程一窍不通,搜索了下看怎么编译成exe文件. 于是发现了本文.其实,下面那个老兄回的更精彩. 将Java应用程序本地编译为EXE的几种方法(推荐使用JOVE和JET) 1. 从www.towerj.com获得一个TowerJ编译器,该编译器可以将你的CLAS...
标签: Web开发
getElementById getElementsByName getElementsByTagName 大概介绍 getElementById ,getElementsByName ,getElementsByTagName 后两个是得到集合,byid只是得到单个对象 getElementById 的用法 举个例子: a id="link1" name="link1" href=http://homepage.yesky.com网页陶吧/a 同一页面内的引用方法: ...
标签: 办公软件
朋友们,您每一次打开word文档,都是一层层地打开目录,再点击它吗?有没有试过下面的快捷方法? 方法一:开始文档命令 这个方法相信很多朋友都知道,如果要打开的是最近使用过的文件,点击开始文档菜单,找到它单击打开即可。 方法二:word中的文件菜单 在word中"文...

经验教程

677

收藏

12
微博分享 QQ分享 QQ空间 手机页面 收藏网站 回到头部