图像截屏公式识别——LaTeX-OCR安装与使用

一、简介

LaTeX-OCR 是一个开源的光学字符识别(OCR)软件,专为 LaTeX 文档提供支持。其主要目的是帮助用户将扫描的文档转换为 LaTeX 编辑器可以使用的可编辑文本,从而方便进行修改、编辑和排版。LaTeX广泛用于科技、数学、工程等领域的文档编写。而 OCR 技术则用于将图像中的文字转换为计算机可编辑的文本。LaTeX-OCR 的结合使得用户能够更方便地将扫描得到的文档内容转换为 LaTeX 格式,为文档的后续编辑和排版提供了便利。
在这里插入图片描述

  1. 高精度 OCR: LaTeX-OCR采用先进的OCR技术,能够高度准确地识别扫描文档中的字符,并以文本形式输出。这确保了转换后的文本质量,为后续编辑提供了可靠的基础。

  2. 支持 LaTeX 格式: 该软件专门为LaTeX文档设计,能够保留源文档中的LaTeX语法和格式。这意味着输出的文本与原始LaTeX文档一致,用户无需额外的格式调整。

  3. 多语言支持: LaTeX-OCR支持多种语言,包括英语、西班牙语、德语、法语等主流语言。这使得它适用于全球范围内的不同语言环境,提高了灵活性和实用性。

  4. 易于使用: 软件提供直观的用户界面,使用户能够轻松导入扫描文档、选择适当的设置,并以最少的步骤完成OCR过程。用户友好的设计有助于提高效率,降低使用门槛,使更多人能够受益于该工具。

二、环境安装

LaTeX-OCR可以从源码进行安装,也可以直接用pip来安装,源码地址:https://github.com/lukas-blecher/LaTeX-OCR,我这里直接使用pip进行安装,为了方便管理环境,这里使用conda创建虚拟环境。

1.环境安装

conda create -n latex python=3.10
activate latex
pip install "pix2tex[gui]"

在这里插入图片描述

2.启动与使用

latexocr

第一次启动的时候,它会去下载两个模型,可能会很慢,等等就可以,如果下载不下来,可以直接去官网下载后,放到指定的目录。
在这里插入图片描述
启动完成之后,出现UI交互界面,使用快捷键或者直接点击截屏识别:
在这里插入图片描述

3.识别

识别一个复杂一点的公式,如果识别得不精准,可以自己手动调节Temperature值:
在这里插入图片描述
下面是生成的LaTeX 表示方法,把它复制到支持LaTeX 表示方法的编辑器就可以不用那么麻烦自己去输入各种符号了

L I = − 1 N ∑ i = 1 N ∣ O g exp ⁡ ( s i m ( z i I , z i T ) / τ ) ∑ j = 1 N exp ⁡ ( s i m ( z i I , z j T ) / τ ) L_{I}=-\frac{1}{N}\sum_{i=1}^{N}|_{\mathrm{Og}}\frac{\exp(\mathrm{sim}(z_{i}^{I},z_{i}^{T})/\tau)}{\sum_{j=1}^{N}\exp(\mathrm{sim}(z_{i}^{I},z_{j}^{T})/\tau)} LI=N1i=1NOgj=1Nexp(sim(ziI,zjT)/τ)exp(sim(ziI,ziT)/τ)

4.代码调用

from PIL import Image
from pix2tex.cli import LatexOCRimg = Image.open('path/to/image.png')
model = LatexOCR()
print(model(img))

作者指出,该模型在较小分辨率的图像上表现最佳。为了提高其效果,添加了一个预处理步骤。在这一步中,另一个神经网络会预测输入图像的最佳分辨率。随后,定制图像会被自动调整大小,以更好地匹配训练数据的特征。这个方法旨在提升模型在真实场景中遇到的图像的性能。然而,需要注意的是,该模型可能不能在处理极大图像时达到最佳效果。因此,在拍摄图片之前,不建议进行过度放大。

5.处理步骤

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/282451.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring之容器:IOC(1)

学习的最大理由是想摆脱平庸,早一天就多一份人生的精彩;迟一天就多一天平庸的困扰。各位小伙伴,如果您: 想系统/深入学习某技术知识点… 一个人摸索学习很难坚持,想组团高效学习… 想写博客但无从下手,急需…

Vue3使用Three.js导入gltf模型并解决模型为黑色的问题

背景 如今各类数字孪生场景对三维可视化的需求持续旺盛,因为它们可以用来创建数字化的双胞胎,即现实世界的物体或系统的数字化副本。这种技术在工业、建筑、医疗保健和物联网等领域有着广泛的应用,可以帮助人们更好地理解和管理现实世界的事…

FL Studio2024破解版注册机及使用教程

FL Studio 2024破解版是一款非常实用的软件。该软件用于不同的目的,例如从音频中删除人声、管理音频以及更改不同的音频属性。此外,您还可以查看音频和歌曲的不同效果并管理其音量和大小。您还可以管理音乐和音频的自动化。您可以用它创作一首具有不同音…

Pantera Capital致信2024:继续做多BTC

作者:Dan Moredherd, Katrina Paglia, Jeff Lewis, Erik Lowe Pantera Capital 编译:秦晋 碳链价值 一年的变化有多大啊。这就是我们2023年1月信函的开头: 亲爱的投资者: 假设现在是2022年1月1日。想象一下,我告诉你…

汇编语言的前世今生

计算机中的0和1是用电的状态表示的。具体来说,断开为0,接通为1。自然而言,这也对应着二进制。曾经时代的二进制加法机是一个划时代的产物,能够进行两个8位二进制数的实时加法,尽管今天看来很LOW。 图1 二进制加法器&am…

JS代码输出题:return Promise.resolve() 情况

题目: Promise.resolve().then(() > {console.log(0);return Promise.resolve(4);}).then((res) > {console.log(res)})Promise.resolve().then(() > {console.log(1)}).then(() > {console.log(2)}).then(() > {console.log(3)}).then(() > {con…

Vue 项目关于在生产环境下调试

前言 开发项目时,在本地调试没问题,但是部署到生产会遇到一些很奇怪的问题,本地又没法调,就需要在生产环境/域名下进行调试。 在这里介绍一个插件Vue force dev ,浏览器扩展里下载 即便是设置了Vue.config.devtoolsfalse 只要安…

前端对接 —— 周末

1.点击校验 点击校验 宇哥 记得过滤 不能校验的数据(我后端还要检验吗?) 2.前端数据对接 这个可以吗? 这种的可以吗?

工具在手,创作无忧:一键下载安装Auto CAD工具,让艺术创作更加轻松愉悦!

不要再浪费时间在网上寻找Auto CAD的安装包了!因为你所需的一切都可以在这里找到!作为全球领先的设计和绘图软件,Auto CAD为艺术家、设计师和工程师们提供了无限的创作潜力。不论是建筑设计、工业设计还是室内装饰,Auto CAD都能助…

计算机网络:网络层(无分类编址CIDR、计算题讲解)

带你快速通关期末 文章目录 前言一、无分类编址CIDR简介二、构成超网三、最长前缀匹配总结 前言 我们在前面知道了分类地址,但是分类地址又有很多缺陷: B类地址很快将分配完毕!路由表中的项目急剧增长! 一、无分类编址CIDR简介 无分类域间路由选择CI…

禁毒知识竞赛流程和规则

禁毒知识竞赛是一项全国性竞赛活动。有着深化全国青少年毒品预防教育,巩固学校毒品预防教育成果的重要作用。本文介绍一场禁毒知识竞赛的完整流程和规则,供单位组织此类活动时参考。 1、赛制 第一轮10进6,第二轮6进4,4支队伍决出…

力扣刷题-二叉树-平衡二叉树

110 平衡二叉树 给定一个二叉树,判断它是否是高度平衡的二叉树。 本题中,一棵高度平衡二叉树定义为:一个二叉树每个节点 的左右两个子树的高度差的绝对值不超过1。 示例 1: 给定二叉树 [3,9,20,null,null,15,7] 返回 true 。 给定二叉树 [1…