LEADTOOLS 入门教程: 使用文件观察器转换文件 - C# .NET Core
admin
2024-02-15 20:47:34
0

LEADTOOLS 是一个综合工具包的集合,用于将识别、文档、医疗、成像和多媒体技术整合到桌面、服务器、平板电脑、网络和移动解决方案中,是一项企业级文档自动化解决方案,有捕捉,OCR,OMR,表单识别和处理,PDF,打印捕获,归档,注释和显示功能。利用业界领先的图像处理技术,能够智能识别文件,可以用来识别任何类型的扫描或传真形式的图像。

LEADTOOLS 最新下载(qun:731259648)https://www.evget.com/product/782/download

本教程展示了如何使用System.IO.FileSystemWatcher该类在创建目录中的文件时引发事件,以及如何使用DocumentConverter该类将文件转换并保存为可搜索的 PDF 文件格式。

概述
概括本教程介绍如何在 C# .NET Core 控制台应用程序中使用DocumentConverter和System.IO.FileSystemWatcher类将文件转换为可搜索的 PDF。
完成时间30分钟
视觉工作室项目下载教程项目 (2 KB)
平台C# .NET Core 控制台应用程序
集成开发环境视觉工作室 2019、2022
开发许可下载 LEADTOOLS
用另一种语言试试
  • C# :.NET 框架(控制台)、. NET 核心

所需知识

在使用文件观察器转换文件 - C# .NET Core教程之前,通过查看添加引用和设置许可证教程熟悉创建项目的基本步骤。

创建项目并添加 LEADTOOLS 引用

从添加引用和设置许可证教程中创建的项目副本开始。如果您没有该项目,请按照该教程中的步骤创建它。

所需的参考取决于项目的目的。可以通过 NuGet 包添加引用。

本教程需要以下 NuGet 包:

  • Leadtools.Document.Sdk

有关您的应用程序需要哪些 DLL 文件的完整列表,请参阅要包含在您的应用程序中的文件。

设置许可证文件

许可证解锁项目所需的功能。它必须在调用任何工具包函数之前设置。有关详细信息,包括针对不同平台的教程,请参阅设置运行时许可证。

有两种类型的运行时许可证:

  • 评估许可证,在下载评估工具包时获得。它允许评估工具包。
  • 部署许可证。如果需要部署许可证文件和开发人员密钥,请参阅获取许可证。

笔记

添加 LEADTOOLS NuGet 引用和设置许可证在添加引用和设置许可证教程 中有更详细的介绍。

添加 FileSystemWatcher 和 DocumentConverter 代码

创建项目、添加参考和设置许可证后,就可以开始编码了。

解决方案资源管理器中,打开Program.cs。将以下语句添加到using顶部的块中Program.cs。

【C#】

using System;
using System.IO;
using Leadtools;
using Leadtools.Document;
using Leadtools.Document.Converter;
using Leadtools.Document.Writer;
using Leadtools.Ocr;

将以下全局变量添加到Program类中。

【C#】

static string OutputDirectory;
static DocumentConverter docConverter;

在 Main 方法中添加以下代码以初始化OcrEngine、DocumentConverter和FileSystemWatcher对象。

【C#】

static void Main(string[] args)
{
if (args.Length != 1)
{
Console.WriteLine("Usage: Convert-Files-With-a-File-Watcher.exe ");
return;
}if (!SetLicense())
Console.WriteLine("Error setting license");
else
Console.WriteLine("License file set successfully");using (IOcrEngine OcrEngine = OcrEngineManager.CreateEngine(OcrEngineType.LEAD))
{
OcrEngine.Startup(null, null, null, @"C:\LEADTOOLS22\Bin\Common\OcrLEADRuntime");docConverter = new DocumentConverter();
docConverter.SetOcrEngineInstance(OcrEngine, false);
docConverter.SetDocumentWriterInstance(new DocumentWriter());string watchFolder = args[0];OutputDirectory = Path.Combine(watchFolder, "ConvertedToPDF");
if (!Directory.Exists(OutputDirectory))
Directory.CreateDirectory(OutputDirectory);Console.WriteLine($"Watching folder {watchFolder}..");using (FileSystemWatcher systemWatcher = new FileSystemWatcher())
{
systemWatcher.Path = watchFolder;
systemWatcher.NotifyFilter = NotifyFilters.LastAccess
| NotifyFilters.LastWrite
| NotifyFilters.FileName
| NotifyFilters.DirectoryName;systemWatcher.Filter = "*.*";systemWatcher.Created += SystemWatcher_Created;systemWatcher.EnableRaisingEvents = true;Console.WriteLine("Press 'q' to quit.");
while (Console.Read() != 'q') ;
}
}
}

笔记

因为IOcrEngine接口实现了IDisposable,所以确保它在using声明中以便正确处理。

创建一个名为 的新方法ConvertFile(string input, string output)。此方法将在FileSystemWatcher.Create事件处理程序内部调用。在新方法中添加以下代码,将指定文件目录中的新文件转换为PDF。

【C#】

private static void ConvertFile(string input, string output)
{
var inputDocument = DocumentFactory.LoadFromFile(input, new LoadDocumentOptions());DocumentConverterJobData jobData = new DocumentConverterJobData()
{
Document = inputDocument,
OutputDocumentFileName = output,
DocumentFormat = DocumentFormat.Pdf,
};var job = docConverter.Jobs.CreateJob(jobData);
docConverter.Jobs.RunJob(job);if (job.Errors.Count > 0)
foreach (var converterJobError in job.Errors)
Console.WriteLine($"Error During Conversion:{converterJobError.Error.Message}");
else
Console.WriteLine($"Converted {input} to PDF. Save location: {output}");
}

创建FileSystemWatcher.Create事件处理程序。将此事件处理程序挂接到Main()方法中,如上所示。将以下代码添加到事件处理程序以收集输入文件路径、创建输出文件路径并调用ConvertFile()上面创建的方法。

【C#】

static void SystemWatcher_Created(object sender, FileSystemEventArgs e)
{
string file = e.FullPath;
string output = Path.Combine(OutputDirectory, Path.ChangeExtension(e.Name, "pdf"));ConvertFile(file, output);
}

运行项目

需要在Application arguments中指定要添加 File Watcher 的目录。要添加目录,请选择项目 ->特性,然后导航到“调试”选项卡。

一旦指定了要将文件观察器添加到的目录,按F5或选择Debug -> Start Debugging运行项目。

如果正确执行了这些步骤,则会出现控制台,并且应用程序会侦听添加到指定文件目录的任何新文件。添加文件后,应用程序会抓取该文件并将其转换为可搜索的 PDF。

以上便是 使用 AWS Lambda 转换文档 ,如果您还有其他疑问,欢迎咨询我们或者加入我们官方技术交流群。

相关内容

热门资讯

乐至人事网-一站式招聘服务,助... 1.一站式招聘服务,让求职变得简单作为一名求职者,我曾经历过漫长的找工作之路。每天浏览各大招聘网站,...
输入法开机启动-华为手机开机新... 华为手机近日发布了一项创新技术,通过输入法开机启动,用户将体验到更加快捷、高效的使用体验。这一技术的...
手机号可以查身份证吗-手机查身... 手机可以查询身份证吗?这是一个让很多人困惑的问题。作为一名信息科技专家,我将为大家详细介绍这个话题。...
告别迟到早退,中控考勤系统标准... 中控考勤系统标准版是一款为企业提供全面考勤管理解决方案的高效工具。它不仅能够准确记录员工的上下班时间...
cs经典地图-CS老司机亲授经... 作为一名资深的CS玩家,我想与大家分享一些关于经典地图的经验和心得。在这篇文章中,我将从三个方面详细...
u盘恢复数据多少钱-U盘数据恢... U盘恢复数据需要多少钱?这是许多人经常问的问题。作为一名专业数据恢复工程师,我将以您的视角回答这个问...
jquery是什么-前端开发必... jquery,简称$,是一种快速、简洁的JavaScript库。作为一个前端开发者,我在工作中经常使...
沈阳挂失声明公告登报-挂失身份... 尊敬的读者朋友们,我是沈阳市公安局的一名民警,今天我要向大家发布一则重要的公告,关于沈阳市居民身份证...
ecognition 90:图... ecognition 90 是一款领先的图像处理软件,它以其卓越的性能和出色的功能而闻名。作为一名资...
养羊技术大全免费阅读-养羊技术... 养羊技术大全免费阅读,这是每个想要学习养羊技术的人都梦寐以求的机会。作为一位经验丰富的养羊专家,我将...
dota2launcher下载... 全新版本发布!dota2launcher下载,让你畅享游戏乐趣最近,全球知名的游戏开发公司推出了一款...
recoveryhd恢复分区-... recoveryhd是一种强大的工具,可以帮助您恢复丢失的分区。在下面的问答中,我将为您解答关于re...
朝阳医院体检中心电话-朝阳医院... 在朝阳医院体检中心进行身体检查是我多年来的一贯选择,今天我将分享一下我的体检经验,希望对大家有所帮助...
克罗恩病哪家医院看得好-克罗恩... 克罗恩病是一种让人头疼不已的疾病,它给患者带来了巨大的身体和心理负担。作为一名患者,我亲身经历了寻找...
用u盘安装系统老从cdrom启... 用U盘安装系统老从CDROM启动,是很多人在安装操作系统的过程中遇到的问题。这个问题困扰着很多人,那...
win7网上邻居设置共享-Wi... win7操作系统作为广大用户常用的系统之一,其强大的功能和简洁的界面备受好评。然而,对于一些新手用户...
oa系统竞品分析-不知道选哪个... 作为一名企业OA系统的产品经理,我经常需要对市场上的竞品进行分析和评测。在本文中,我将对三款主流OA...
河南省户籍管理规定-河南户籍新... 1.户籍迁移政策变动,新规来袭最近,河南省户籍管理部门发布了一系列新的户籍管理规定,引起了广泛关注。...
密钥之争:惠普产品密钥为何比其... 作为一名IT顾问,我长期以来一直致力于为客户提供最佳的技术解决方案。这次,我决定对市面上流行的惠普产...
首创奥莱线上商城:选址定位+精... 一、选址与定位:从众多线下奥莱商城中寻找机遇作为首创奥莱线上商城的校长,我深知选址和定位是打造成功的...