C#实现Word与TXT文本格式互转的操作代码
作者:咕白m625
在现代办公自动化和数据处理流程中,经常需要在不同的文档格式之间进行转换,将Word文档(.doc, .docx)转换为纯文本(.txt)可以方便地提取文字内容用于数据分析、内容索引或简化分享,本文将分享如何使用Spire.Doc for .NET实现TXT文本文件与Word文档之间的双向转换
引言
在现代办公自动化和数据处理流程中,经常需要在不同的文档格式之间进行转换。将 Word 文档 (.doc, .docx) 转换为纯文本 (.txt) 可以方便地提取文字内容用于数据分析、内容索引或简化分享。反之,将 TXT 文件转换为 Word 格式则能更好地利用 Word 强大的排版和格式化功能。
本文将分享如何使用 Spire.Doc for .NET 实现 TXT 文本文件与 Word 文档之间的双向转换,提供完整 C# 示例代码。
Nuget 安装:Install-Package Spire.Doc
Word 转 TXT:保留结构与内容
Spire.Doc 提供 SaveToFile()
方法,可直接将加载的 Word 文档转换为纯文本,同时保留段落、换行等结构。
using Spire.Doc; namespace ConvertWordToText { internal class Program { static void Main(string[] args) { // 加载Word文件 Document doc = new Document(); doc.LoadFromFile("示例.docx"); // 保存为txt格式 doc.SaveToFile("Word转Txt.txt", FileFormat.Txt); doc.Close(); } } }
优势:
- 自动识别段落、换行
- 中文不乱码(UTF-8 编码)
- 保留原始内容结构,不丢失关键信息
- 输出为纯文本,可直接用于日志、数据库导入
注意:表格、图片、样式等将被忽略,若需保留,需额外处理。
TXT 转 Word:精准重建文档
加载文本文件可用 LoadText
方法,然后再次使用 SaveToFile()
方法将 TXT 内容还原为 Word 文档。
using Spire.Doc; namespace ConvertTextToWord { internal class Program { static void Main(string[] args) { // 加载文本文件 Document doc = new Document(); doc.LoadText("示例.txt"); // 保存为Word (.doc 或 .docx) doc.SaveToFile("Txt转Word.docx", FileFormat.Docx2016); doc.Close(); } } }
亮点:
- 每个换行自动识别为段落
- 保留原始文本结构,适合生成报告、通知等
- 可进一步美化(如设置字体、标题样式)
限制:无法还原原Word中的表格、样式、页眉页脚,属于“文本重建”而非“格式还原”。
结语
在自动化办公中,Word 转 TXT 与 TXT 转 Word 的高效转换是提升效率的关键环节。本文基于 Spire.Doc for .NET 提供了完整、可复用的 C# 实现方案,避免了传统方法 Microsoft.Office.Interop.Word
需依赖 Office 安装、兼容性差等问题。
以上就是C#实现Word与TXT文本格式互转的操作代码的详细内容,更多关于C# Word与TXT格式互转的资料请关注脚本之家其它相关文章!