论文阅读:Syntax-Aware Network for Handwritten Mathematical Expression Recognition
创始人
2024-05-30 23:34:50
0

论文阅读:Syntax-Aware Network for Handwritten Mathematical Expression Recognition1

主要观点:

1、提出将语法信息纳入编码器-解码器网络的方法。使用一组语法规则,用于将每个表达式的LaTeX标记序列转换为解析树;用深度神经网络将标记序列预测建模为树遍历过程。

2、该方法可以有效地描述表达式的语法上下文,减小HMER的结构预测误差。和现有的WAP和WAP-TD相比,考虑语法规则

在这里插入图片描述

Figure 1. Comparison of different architectures: (a) An encoder-decoder framework WAP (b) A tree decoder DWAP-TD © Our model Syntax-Aware Network (SAN)

相关工作:

HMER的主要任务:

  • 对同一符号的笔画进行切分;
  • 符号识别;
  • 语法引导下的符号结构关系分析,生成数学表达式;

HMER的难点不在于符号识别,而是符号的语法关系;

序列法:

  • 首先将表达式分段输入数学符号,对每个符号分别进行分类,然后通过结构关系分析识别数学表达式。这些方法采用了分类技术,如HMM,弹性匹配,支持向量机、和树变换。

  • 全局方法应用一种综合策略来学习数学符号及其结构关系分析,同时隐式地分割符号。这些方法将HMER处理为基于符号识别结果的数学表达式分割、符号识别和表达式识别结构的全局优化

深度学习方法:

  • 序列到序列:转换数学表达式图片到标记序列,加注意力机制等;

  • 图到图的方法:探索输入公式的结构关系到标记序列;

  • 树结构方法:尝试使用树结构的解码器,对图片提取的特征进行解码;

算法原理:

基本规则

1)遵循标准的阅读顺序:从左到右,从上到下。

2)利用相邻符号之间的空间关系。对于一对相邻的HME符号,总共有九种可能的关系(左、右、上、下、左下、右下、左上、右上、内)。由于约束1),我们去掉了“左”和“下左”,保留了其余7种关系来处理我们实现中所有的MEs情况。尽管ME可能对应于不同的LaTeX序列,但由于这两个约束,语法规则生成的语法树是相同的。

数学描述

算法由元组表示:
G=(N,Σ,R,S,Γ,C,D),G=(N,\Sigma,R,S,{\Gamma},C,D), G=(N,Σ,R,S,Γ,C,D),
NNN:非终止符,包括起始符SSS和拓展符EEE;

Σ\SigmaΣ:终止符;

RRR:产生式规则;

Γ{\Gamma}Γ:关系;

CCC:编码器;

DDD:解码器;

产生式规则

产生式规则可以表示成:
α→β,α∈N,β∈(Γ∪N∪Σ)∗.\alpha\rightarrow\beta, \\ \alpha\in {N},\beta\in(\Gamma\cup N\cup\Sigma)^{*}. α→β,α∈N,β∈(Γ∪N∪Σ)∗.
asterisk: represents the Kleene star operation2

RRR有两条生成规则:

规则1:SSS可以在后面产生任意的终止符;或者EEE扩展符;或者空字符ϵ\epsilonϵ
S→σS∣E∣ϵ,S\rightarrow\sigma S|E|\epsilon, S→σS∣E∣ϵ,
σ\sigmaσ:σ∈Σ\sigma\in\Sigmaσ∈Σ;

∣|∣:任选的意思;

规则2:EEE为每种类型的关系产生字符串,然后拼接起来;字符串后面可以跟SSS或者空字符串;
E→[((γ1)S∣ϵ),…,((γ7)S∣ϵ)],E\to[((\gamma_1)S|\epsilon),\ldots,((\gamma_7)S|\epsilon)],\quad\text{} E→[((γ1​)S∣ϵ),…,((γ7​)S∣ϵ)],
γi∈Γ\gamma_i\in\Gammaγi​∈Γ:在关系中的第iii种;

表达规则图示

图3示出了具有产生式规则的表达式的可能解析过程。为了直观地理解这些规则,可以把S看成一个表达式,把E看成一个可扩展的结构。假设一个表达式可以包含多个可扩展结构,而每个可扩展结构可以扩展为多个具有空间关系的表达式。此外,产生式规则与以输入图像和父节点的上下文状态为条件的概率相关。具体来说,条件概率定义为:
p(α→β∣c(α),X)=Dα→β(c(α),E(X)),p(\alpha\rightarrow\beta|c(\alpha),X)=D_{\alpha\rightarrow\beta}(c(\alpha),E(X)), p(α→β∣c(α),X)=Dα→β​(c(α),E(X)),
XXX:输入图像;

E(X)E(X)E(X):编码器的输出;

c(α)c(α)c(α)是ααα的上下文状态(将在第3.2节中详细介绍),Dα→β(⋅)Dα→β(·)Dα→β(⋅)是对应于产生式规则的解码器的输出;

在这里插入图片描述

Figure 3. (a) A possible parsing procedure of ∑ina\sum_{i}^{n}a∑in​a and (b) the parse tree. In the figure, the strings refer to non-terminal symbols in blue, terminal symbols in red, relations in yellow, and empty in grey.

基本流程

在这里插入图片描述

如算法1所示,给定SAN参数和输入图像,使用堆栈实现树遍历。具体来说,所实现的栈可以保证训练过程按照语法树的遍历顺序进行。同样,预测过程也是通过逐步堆叠来实现的。编码器获取输入图像并对其进行下采样。然后根据语法规则,确定表达式及其可扩展结构;同时,解码器计算并选择概率最高的产生式规则。因此,生成具有可扩展结构的新表达式,并更新LaTeX序列中图像的解析树。一旦找到解析树,就可以通过预先顺序遍历树来获得识别结果。

符号感知解码器

在这里插入图片描述

Figure 4. Syntax-Aware Decoder: Consisting of GRU-α, GRU-β, and the Syntax-Aware Attention Module

损失函数:
L=Lsymbol+Lrelation+Lsymbolrev+Lreg.\mathcal L=\mathcal L_{symbol}+\mathcal L_{relation}+\mathcal L_{symbol}^{rev}+\mathcal L_{reg}. L=Lsymbol​+Lrelation​+Lsymbolrev​+Lreg​.

实验结论:

评价方法:

表达式识别率(ExpRate)是数学表达式识别中广泛使用的一种识别协议,定义为预测的数学表达式准确匹配标准答案的百分比。ExpRate≤1和≤2表示表达式识别率最多可容忍一个或两个符号级错误。

在公开数据集CROHME上:

在这里插入图片描述

在HME100k上:

在这里插入图片描述

参考:


  1. [2203.01601] Syntax-Aware Network for Handwritten Mathematical Expression Recognition (arxiv.org) ↩︎

  2. Kleene星号_百度百科 (baidu.com) ↩︎

相关内容

热门资讯

安卓系统的经典铃声,唤醒回忆的... 你有没有发现,手机里那些熟悉的铃声,有时候就像老朋友一样,陪伴着我们度过了无数个日日夜夜?今天,就让...
鸿蒙系统还是安卓系统号,系统之... 你有没有想过,手机里的操作系统就像是我们的大脑,它决定了我们手机能做什么,不能做什么。现在,就让我们...
安卓系统装贝达,安卓系统下的贝... 你有没有想过,你的安卓手机装上贝达系统后,会有怎样的奇妙体验呢?想象你的手机瞬间变身,变得流畅无比,...
安卓系统沃尔沃音响设置,轻松享... 你有没有发现,自从你的安卓手机和沃尔沃音响完美结合后,开车时的音乐体验简直就像是在音乐厅里一样?没错...
米10系统基于安卓,基于安卓的... 你知道吗?最近手机圈里可是热闹非凡呢!小米10这款手机,自从发布以来就吸引了无数人的目光。而它所搭载...
命令安卓系统怎么卸载,安卓系统... 手机里装了太多不用的应用,是不是感觉手机都快要爆炸了?别急,今天就来教你怎么轻松卸载安卓系统中的应用...
安卓系统安装小学教材,安卓系统... 你有没有想过,手机里的安卓系统竟然能装上小学教材呢?没错,你没听错!在这个信息爆炸的时代,科技的发展...
华为安卓系统锁住了,揭秘锁屏背... 最近是不是发现你的华为手机有点儿“顽皮”了?它突然间变得神秘起来,屏幕上那个熟悉的安卓系统仿佛被施了...
安卓电脑改苹果系统,跨越平台的... 你有没有想过,把你的安卓电脑改头换面,变成一个优雅的苹果系统使用者呢?想象那流畅的界面,那独特的触控...
安卓系统怎么按后台,并在任务完... 你有没有遇到过这种情况:手机屏幕一黑,安卓系统就自动进入后台了?是不是觉得有点小郁闷,想要手动切换回...
2021年安卓系统ui,202... 你有没有发现,手机界面最近好像换了个模样?没错,2021年的安卓系统UI可是来了一场大变身呢!今天,...
安卓系统程序编写软件,打造个性... 你有没有想过,手机里的那些神奇应用是怎么诞生的呢?没错,就是那些让你在闲暇时光刷刷视频、在通勤路上玩...
自动开机安卓系统,智能生活新篇... 你有没有想过,当你的安卓手机在清晨的第一缕阳光照耀下自动开机,那种轻松自在的感觉?想象不用再手动解锁...
真我平板x安卓系统,畅享智能生... 亲爱的读者们,你是否也在寻找一款既能满足你对平板电脑的期待,又能让你畅享安卓系统带来的无限乐趣的设备...
恒星安卓系统官网,引领未来智能... 亲爱的读者们,你是否曾好奇过那些闪耀在夜空中的星星,它们是如何在浩瀚的宇宙中熠熠生辉的呢?今天,我要...
u8安卓系统,功能与特色深度解... 你知道吗?在手机操作系统界,有一个小家伙可是相当受欢迎的,它就是U8安卓系统。今天,就让我带你来一探...
花椒安卓系统美颜功能,打造完美... 你有没有发现,现在拍照已经不仅仅是记录生活的工具了,它更是一种艺术创作呢!而在这其中,花椒安卓系统的...
戴尔平板升级安卓系统,畅享安卓... 你有没有发现,戴尔平板最近好像悄悄地来了一次大变身?没错,就是那个我们熟悉的戴尔平板,它现在竟然可以...
安卓助手怎么升级系统,畅享最新... 亲爱的安卓用户们,你是否也和我一样,对安卓系统的升级充满了期待和好奇呢?每次系统升级,都仿佛是给我们...
国产安卓系统的发展,国产安卓系... 你知道吗?在我国科技飞速发展的今天,国产安卓系统可是越来越受到大家的关注呢!它就像一颗冉冉升起的新星...