C#教程

关注公众号 jb51net

关闭
首页 > 软件编程 > C#教程 > C#提取PPT文本

使用C#代码从PPT文件中提取文本的方法示例

作者:2501_93070778

当你将包含大量媒体文件和图片的 PowerPoint 文档发送给他人进行文字校对时,可能会发现由于文件体积较大,传输速度非常慢,本文将介绍如何使用 Spire.Presentation for .NET 在 C# 和 VB.NET 中从 PowerPoint 演示文稿中提取文本,需要的朋友可以参考下

引言

当你将包含大量媒体文件和图片的 PowerPoint 文档发送给他人进行文字校对时,可能会发现由于文件体积较大,传输速度非常慢。在这种情况下,最好先将 PowerPoint 中的文字内容提取到 MS Word 或记事本中,然后只发送文本内容。除此之外,提取出的文字内容还可以用于归档或备份,以便日后参考。本文将介绍如何使用 Spire.Presentation for .NET 在 C# 和 VB.NET 中从 PowerPoint 演示文稿中提取文本。

安装 Spire.Presentation for .NET

首先,你需要在 .NET 项目中添加 Spire.Presentation for .NET 包中包含的 DLL 文件作为引用。这些 DLL 文件可以通过以下链接下载,或通过 NuGet 进行安装。

PM> Install-Package Spire.Presentation

在 C# 和 VB.NET 中从 PowerPoint 演示文稿中提取文本

为了便于共享或传递 PowerPoint 文档中的文字信息,有时需要执行文字提取操作。以下是从所有幻灯片中提取文本并将其保存为 TXT 文件的步骤:

  1. 初始化一个 Presentation 类的实例。
  2. 使用 Presentation.LoadFromFile() 方法加载一个示例 PowerPoint 文档。
  3. 创建一个 StringBuilder 实例。
  4. 遍历文档中的每一张幻灯片,然后遍历每张幻灯片中的所有形状。
  5. 判断形状是否属于 IAutoShape 类型。如果是,则遍历该形状中的所有段落,并通过 TextParagraph.Text 属性获取段落文本。
  6. 使用 StringBuilder.AppendLine() 方法将提取的文本追加到 StringBuilder 实例中。
  7. 创建一个新的 TXT 文件,并使用 File.WriteAllText() 方法将提取的文本写入文件。

使用Spire.Presentation for .NET提取文本的示例代码如下:

using Spire.Presentation;
using System.IO;
using System.Text;
namespace ExtractText
{
    class Program
    {
        static void Main(string[] args)
        {
            //初始化 Presentation 类的实例
            Presentation presentation = new Presentation();
 
            //加载示例 PowerPoint 文档
            presentation.LoadFromFile("Island.pptx");
            //加载示例 PowerPoint 文档
            StringBuilder sb = new StringBuilder();
 
            //遍历文档中的每一张幻灯片
            foreach (ISlide slide in presentation.Slides)
            {
                //遍历每张幻灯片中的每个形状
                foreach (IShape shape in slide.Shapes)
                {
                    //判断形状是否属于 IAutoShape 类型
                    if (shape is IAutoShape)
                    {
                        //遍历每个形状中的所有段落
                        foreach (TextParagraph tp in (shape as IAutoShape).TextFrame.Paragraphs)
                        {
                            //提取文本并保存到 StringBuilder 实例中
                            sb.AppendLine(tp.Text);
                        }
                    }
                }
            }
            //创建一个新的 txt 文件来保存提取的文本
            File.WriteAllText("ExtractText.txt", sb.ToString());
        }
    }
}

到此这篇关于使用C#代码从PPT文件中提取文本的方法示例的文章就介绍到这了,更多相关C#提取PPT文本内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
阅读全文