word

关注公众号 jb51net

关闭
软件教程 > 办公软件 > word >

如何将Word转换为网页html格式的方法(附代码清理方法)

脚本之家

Word是我们常用的的办公软件,广泛被运用,那么我们怎么把Word转换为网页html格式?

需要软件:

word2003wps 个人建议用wps更方便,word生成的图片容易重复

photoshop dreamweaver(多行)

editplus

第一步:
通过wps将word保存为html格式。

步骤如下:

1、打开word文档,单击菜单栏中的“文件”,找到“另存为” 或“另存为网页”,如图所示。

怎么把Word转换为网页html格式?

2、单击另存为” 或“另存为网页”,弹出"另存为" 窗口, 如图所示。

怎么把Word转换为网页html格式?

3、在"另存为" 窗口的“保存类型”,下拉菜单中找到“网页”。

怎么把Word转换为网页html格式?

4、在“文件名”一栏中可以修改我们想要的文件名,如图我改成了“经验”。

怎么把Word转换为网页html格式?

5、点“保存”,就把一篇word文档保存成网页格式了。我保存在桌面了。

怎么把Word转换为网页html格式?

6、这时候在桌面就可以找到保存的网页,然后用浏览器会打开并显示网页的内容。 

怎么把Word转换为网页html格式?

虽然出来完成了,但如果打开源码查看可以看到很多的比较乱的代码,可以进行二次清理才可以。步骤如下

第二:下载dreameweaver

删除<body>之前的数据,然后 执行 命令 > 清理word生成的html

开始替换无用的html标签
<p style="color:red"> 替换为<p>
<p class="jb51"> 替换为<p>
<span style="sjfljlk"> 替换为空
<font syt...>替换为空

将上面直接替换为<p>

通过正则表达式替换
<p.[^<>]*> 替换为 <p>

<span.[^<>]*>替换为 空 (</span>替换为空)

<font.[^<>]*>替换为 空 (</font>替换为空)

然后 替换 图片路径
<p>&nbsp;</p> 可以替换为空

&nbsp;可以替换为 " " 键盘空一个
当然还有一些别的。

将超链接为空,一般情况下,文字、图片都有超链接。如果比较重要的可以手工加上。

文档中需要保留
<p>、<br />、<img>等常用的一些标签,大家根据需要自行选择。