Ubuntu系统 OCR文字识别与 Latex公式识别

一、OCR文字识别

Step1:安装tesseract

tesseract 是一个开源的OCR引擎,最初是由惠普公司开发用来作为其平板扫描仪的OCR引擎,2005年惠普将其开源出来,之后google接手负责维护。目前稳定的版本是3.0。4.0版本加入了基于LSTM的神经网络技术,中文字符识别准确率有所提高。

sudo add-apt-repository ppa:alex-p/tesseract-ocr
sudo apt-get update 
sudo apt-get install tesseract-ocr 

Step2:安装中文包

中文包下载路径, 下载完成并解压后,将解压文件中的*.traineddata 相关文件拷贝到 usr/share/tesseract-ocr/4.00/tessdata/ 路径下,然后继续安装;

Step3:安装截图等功能包

sudo apt-get install gnome-screenshot
sudo apt-get install xclip
sudo apt-get install imagemagick

Step4:制作shell文件

在Step2 中有一个 OCR.txt 文件,拷贝为 ocr.sh文件,如下所示:

#!/bin/env bash 
# Dependencies: tesseract-ocr imagemagick gnome-screenshot xclip#Name: OCR Picture
#Author:andrew
#Fuction: take a screenshot and OCR the letters in the picture
#Path: /home/Username/...
#Date: 2020-02-10#you can only scan one character at a timeSCR="/home/Username/Documents/temp"####take a shot what you wana to OCR to text
gnome-screenshot -a -f $SCR.png####increase the png
mogrify -modulate 100,0 -resize 400% $SCR.png 
#should increase detection rate####OCR by tesseract
tesseract $SCR.png $SCR &> /dev/null -l eng+chi1####get the text and copy to clipboard
cat $SCR.txt | xclip -selection clipboardexit

在这里插入图片描述
注意:将文件中SCR="路径那里替换成你想要存放截图以及识别结果txt文档的路径

设置快捷键

在 设置 → \rightarrow 键盘中添加自定义快捷键,如下所示,设置完成后按F4即可直接截图识别。
在这里插入图片描述
建议,通过别名查看结果更佳:如:alias ocr="cat ~/Documents/temp_ocr.txt | tr -d ' ' ",以后终端输入ocr命令即可,查看ocr内容。

二、Latex公式识别

方案一:官网直接下载linux版本

官网直接下载linux版本,然后找到该文件,右键属性,勾选允许作为执行程序。官网链接
在这里插入图片描述

方案二:snap安装

cd ~/Downloads
wget https://download.mathpix.com/linux/Mathpix_Snipping_Tool-x86_64.v03.00.0050.AppImage -O Mathpix_Snipping_Tool.AppImage
chmod 777 ./Mathpix_Snipping_Tool.AppImage
./Mathpix_Snipping_Tool.AppImage

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/126795.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

剑指offer——JZ82 二叉树中和为某一值的路径(一) 解题思路与具体代码【C++】

一、题目描述与要求 二叉树中和为某一值的路径(一)_牛客题霸_牛客网 (nowcoder.com) 题目描述 给定一个二叉树root和一个值 sum ,判断是否有从根节点到叶子节点的节点值之和等于 sum 的路径。 1.该题路径定义为从树的根结点开始往下一直到叶子结点所经过的结点 …

ChatGPT是如何产生心智的?

一、前言 - ChatGPT真的产生心智了吗? 来自斯坦福大学的最新研究结论,一经发出就造成了学术圈的轰动,“原本认为是人类独有的心智理论(Theory of Mind,ToM),已经出现在ChatGPT背后的AI模型上”…

PY32F003F18之sleep模式

一、WFI和WFE WFI: wait for interrupt,是"等待中断"的意思; WFE: wait for event,是"等待事件"的意思; 1)执行HAL_PWR_DisableSleepOnExit(),则令SLEEPONEXIT位置0; 当SL…

网络相关的基础知识整理

一、历史 1.1 早期阿帕网特点⭐⭐⭐ 没有纠错功能不能互联不同类型的计算机和不同类型的操作系统 1. 2 TCP/IP协议 点击【此处】跳转🔗 TCP:用来检测网络传输中差错的传输控制协议IP:专门负责对不同网络进行互联的互联网协议&#xff08…

Video Caption / 视频字幕:数据集总结

目录 一、背景 二、介绍 2.1 MSR-VTT 2.2 MSVD 2.3 VATEX 三、参考文献 一、背景 Video Caption / 视频字幕:常用指标(BELU-4,ROUGE-L,METEOR,CIDEr,SPICE)和数据集总结-CSDN博客Video C…

满足你甜食需求的葡萄酒是怎样的?

也许这是不言而喻的,但我们认为,如果没有一杯完美的葡萄酒来补充你最喜爱的菜肴的复杂风味,一顿美食就不完整。无论您是享用美味的葡萄酒作为开胃菜,还是搭配主菜,我们相信我们最喜爱的饮料是一餐中任何部分的完美补充…

智慧空调插座:智控生活好伴侣,节能降耗好帮手

所谓“智能插座”,就是在普通插座上增加Wi-Fi模块,通过手机APP控制单个或整个插座的电源通断,并统计一段时间的用电量。 目前市面上所销售的智能插座,大多具备可连接Wi-Fi网路功能,如此一 来便不需要额外再购买定时控…

Arcgis日常天坑问题(1)——将Revit模型转为slpk数据卡住不前

这段时间碰到这么一个问题,revit模型在arcgis pro里导出slpk的时候,卡在98%一直不动,大约有两个小时。 首先想到的是revit模型过大,接近300M。然后各种减小模型测试,还是一样的问题,大概花了两天的时间&am…

软考对找工作有用吗?

软考是指软件技术专业资格考试,是由中国人力资源和社会保障部主管的一项国家级考试。软考的目标是评估和认证软件技术人员的专业能力,提高软件行业的整体素质和竞争力。那么,软考对找工作有用吗?本文将从以下几个方面进行分析。 首…

LabVIEW开发教学实验室自动化INL和DNL测试系统

LabVIEW开发教学实验室自动化INL和DNL测试系统 如今,几乎所有的测量仪器都是基于微处理器的设备。模拟输入量在进行数字处理之前被转换为数字量。对于参加电气和电子测量课程的学生来说,了解ADC以及如何欣赏其性能至关重要。ADC的不确定性可以根据其传输…

【Python】下载和安装

【Python】下载和安装 下载 进入 Python官网,下载最新版本,如下图所示: 如果需要下载其他版本,请下滑该页面,找到如下位置,选择需要的版本进行下载(以3.8.10为例): 点击…

天启科技联创郭志强:趟遍教育行业信数化沟坎,创业智能赛道重塑行业生态

郭志强 天启科技联合创始人 近20年互联网、企业信息化、数字化实施、管理及培训经验。对于集团型企业及初创企业、传统企业及互联网企业的信息化、数字化转型有自己独到的见解和实操经验。具备跨区域、集团化信息规划、解决方案、系统架构及企业流程搭建、优化和技术团队管理能…