LEADTOOLS 是一个综合工具包的集合,用于将识别、文档、医疗、成像和多媒体技术整合到桌面、服务器、平板电脑、网络和移动解决方案中,是一项企业级文档自动化解决方案,有捕捉,OCR,OMR,表单识别和处理,PDF,打印捕获,归档,注释和显示功能。利用业界领先的图像处理技术,能够智能识别文件,可以用来识别任何类型的扫描或传真形式的图像。
LEADTOOLS 最新下载(qun:731259648)https://www.evget.com/product/782/download
本教程展示了如何使用System.IO.FileSystemWatcher该类在创建目录中的文件时引发事件,以及如何使用DocumentConverter该类将文件转换并保存为可搜索的 PDF 文件格式。
概述 | |
---|---|
概括 | 本教程介绍如何在 C# .NET Core 控制台应用程序中使用DocumentConverter和System.IO.FileSystemWatcher类将文件转换为可搜索的 PDF。 |
完成时间 | 30分钟 |
视觉工作室项目 | 下载教程项目 (2 KB) |
平台 | C# .NET Core 控制台应用程序 |
集成开发环境 | 视觉工作室 2019、2022 |
开发许可 | 下载 LEADTOOLS |
用另一种语言试试 |
|
所需知识
在使用文件观察器转换文件 - C# .NET Core教程之前,通过查看添加引用和设置许可证教程熟悉创建项目的基本步骤。
创建项目并添加 LEADTOOLS 引用
从添加引用和设置许可证教程中创建的项目副本开始。如果您没有该项目,请按照该教程中的步骤创建它。
所需的参考取决于项目的目的。可以通过 NuGet 包添加引用。
本教程需要以下 NuGet 包:
有关您的应用程序需要哪些 DLL 文件的完整列表,请参阅要包含在您的应用程序中的文件。
设置许可证文件
许可证解锁项目所需的功能。它必须在调用任何工具包函数之前设置。有关详细信息,包括针对不同平台的教程,请参阅设置运行时许可证。
有两种类型的运行时许可证:
笔记
添加 LEADTOOLS NuGet 引用和设置许可证在添加引用和设置许可证教程 中有更详细的介绍。
添加 FileSystemWatcher 和 DocumentConverter 代码
创建项目、添加参考和设置许可证后,就可以开始编码了。
在解决方案资源管理器中,打开Program.cs。将以下语句添加到using顶部的块中Program.cs。
【C#】
using System; using System.IO; using Leadtools; using Leadtools.Document; using Leadtools.Document.Converter; using Leadtools.Document.Writer; using Leadtools.Ocr;
将以下全局变量添加到Program类中。
【C#】
static string OutputDirectory; static DocumentConverter docConverter;
在 Main 方法中添加以下代码以初始化OcrEngine、DocumentConverter和FileSystemWatcher对象。
【C#】
static void Main(string[] args) { if (args.Length != 1) { Console.WriteLine("Usage: Convert-Files-With-a-File-Watcher.exe"); return; }if (!SetLicense()) Console.WriteLine("Error setting license"); else Console.WriteLine("License file set successfully");using (IOcrEngine OcrEngine = OcrEngineManager.CreateEngine(OcrEngineType.LEAD)) { OcrEngine.Startup(null, null, null, @"C:\LEADTOOLS22\Bin\Common\OcrLEADRuntime");docConverter = new DocumentConverter(); docConverter.SetOcrEngineInstance(OcrEngine, false); docConverter.SetDocumentWriterInstance(new DocumentWriter());string watchFolder = args[0];OutputDirectory = Path.Combine(watchFolder, "ConvertedToPDF"); if (!Directory.Exists(OutputDirectory)) Directory.CreateDirectory(OutputDirectory);Console.WriteLine($"Watching folder {watchFolder}..");using (FileSystemWatcher systemWatcher = new FileSystemWatcher()) { systemWatcher.Path = watchFolder; systemWatcher.NotifyFilter = NotifyFilters.LastAccess | NotifyFilters.LastWrite | NotifyFilters.FileName | NotifyFilters.DirectoryName;systemWatcher.Filter = "*.*";systemWatcher.Created += SystemWatcher_Created;systemWatcher.EnableRaisingEvents = true;Console.WriteLine("Press 'q' to quit."); while (Console.Read() != 'q') ; } } }
笔记
因为IOcrEngine接口实现了IDisposable,所以确保它在using声明中以便正确处理。
创建一个名为 的新方法ConvertFile(string input, string output)。此方法将在FileSystemWatcher.Create事件处理程序内部调用。在新方法中添加以下代码,将指定文件目录中的新文件转换为PDF。
【C#】
private static void ConvertFile(string input, string output) { var inputDocument = DocumentFactory.LoadFromFile(input, new LoadDocumentOptions());DocumentConverterJobData jobData = new DocumentConverterJobData() { Document = inputDocument, OutputDocumentFileName = output, DocumentFormat = DocumentFormat.Pdf, };var job = docConverter.Jobs.CreateJob(jobData); docConverter.Jobs.RunJob(job);if (job.Errors.Count > 0) foreach (var converterJobError in job.Errors) Console.WriteLine($"Error During Conversion:{converterJobError.Error.Message}"); else Console.WriteLine($"Converted {input} to PDF. Save location: {output}"); }
创建FileSystemWatcher.Create事件处理程序。将此事件处理程序挂接到Main()方法中,如上所示。将以下代码添加到事件处理程序以收集输入文件路径、创建输出文件路径并调用ConvertFile()上面创建的方法。
【C#】
static void SystemWatcher_Created(object sender, FileSystemEventArgs e) { string file = e.FullPath; string output = Path.Combine(OutputDirectory, Path.ChangeExtension(e.Name, "pdf"));ConvertFile(file, output); }
运行项目
需要在Application arguments中指定要添加 File Watcher 的目录。要添加目录,请选择项目 ->特性,然后导航到“调试”选项卡。
一旦指定了要将文件观察器添加到的目录,按F5或选择Debug -> Start Debugging运行项目。
如果正确执行了这些步骤,则会出现控制台,并且应用程序会侦听添加到指定文件目录的任何新文件。添加文件后,应用程序会抓取该文件并将其转换为可搜索的 PDF。
以上便是 使用 AWS Lambda 转换文档 ,如果您还有其他疑问,欢迎咨询我们或者加入我们官方技术交流群。