Android 开发 OCR Tesseract4Android图片文字识别 巨详细全部代码教程

下面是整个详解步骤过程

  • 效果图
  • 一、OCR的含义
  • 二、前提准备
  • 二、使用步骤详情
    • 1、将 JitPack 存储库添加到存储库末尾的项目根文件
    • 2、将依赖项添加到应用模块文件
    • 3、数据文件下载路径
    • 4、详情代码案例Demo如下:
      • Main.xml
      • Main.java

效果图

  • 流程:获取assets中的图片显示到页面,点击提取图片内的文字

一、OCR的含义

ocr是Optical Character Recognition(光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程

二、前提准备

官网奉上

注意:
1、 Android 4.1 (API 16) 或更高版本
2、JDK版本是Java 17 Java 17获取

下载后把项目的JKD 换成Java 17,如下图:
在这里插入图片描述

二、使用步骤详情

1、将 JitPack 存储库添加到存储库末尾的项目根文件

allprojects {repositories {...maven { url 'https://jitpack.io' }}
}
  • 根据自己studio位置添加,我的是新版的studio是如下图位置
    在这里插入图片描述

2、将依赖项添加到应用模块文件

dependencies {// To use Standard variant:implementation 'cz.adaptech.tesseract4android:tesseract4android:4.7.0'
}
  • 这里我们使用的是单线程依赖

在这里插入图片描述

3、数据文件下载路径

  • 数据文件下载路径或者直接下载中文数据包中文数据包
    在这里插入图片描述
  • 数据包下载下来放到assets文件夹下,cs.png是随便找的一张图片,测试用的
    在这里插入图片描述

4、详情代码案例Demo如下:

Main.xml

<?xml version="1.0" encoding="utf-8"?>
<LinearLayout xmlns:android="http://schemas.android.com/apk/res/android"xmlns:app="http://schemas.android.com/apk/res-auto"xmlns:tools="http://schemas.android.com/tools"android:layout_width="match_parent"android:layout_height="match_parent"android:orientation="vertical"tools:context=".MainActivity"><Buttonandroid:id="@+id/btn_tiqu"android:text="提取"android:layout_width="wrap_content"android:layout_height="wrap_content"/><ImageViewandroid:id="@+id/image"android:text="拍照"android:layout_width="match_parent"android:layout_height="400dp"/><TextViewandroid:id="@+id/tv_result"android:layout_width="wrap_content"android:layout_height="wrap_content"/></LinearLayout>

Main.java

package com.example.tesseract4application;import androidx.appcompat.app.AppCompatActivity;
import android.annotation.SuppressLint;
import android.content.Context;
import android.content.Intent;
import android.content.res.AssetManager;
import android.graphics.Bitmap;
import android.graphics.BitmapFactory;
import android.os.Bundle;
import android.provider.MediaStore;
import android.util.Log;
import android.view.View;
import android.widget.Button;
import android.widget.ImageView;
import android.widget.TextView;
import android.widget.Toast;import com.googlecode.tesseract.android.TessBaseAPI;import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;public class MainActivity extends AppCompatActivity {private static final int REQUEST_IMAGE_CAPTURE = 1;public static final String TESS_DATA = "/tessdata";//        private static final String DATA_FILENAME = "eng.traineddata";private static final String DATA_FILENAME = "chi_sim.traineddata";private TextView tv_result;private Button btn_tiqu;private ImageView image;@SuppressLint("MissingInflatedId")@Overrideprotected void onCreate(Bundle savedInstanceState) {super.onCreate(savedInstanceState);setContentView(R.layout.activity_main);tv_result=findViewById(R.id.tv_result);btn_tiqu=findViewById(R.id.btn_tiqu);image=findViewById(R.id.image);Bitmap bitmapFromAssets = getBitmapFromAssets(MainActivity.this, "cs.png");image.setImageBitmap(bitmapFromAssets);btn_tiqu.setOnClickListener(new View.OnClickListener() {@Overridepublic void onClick(View view) {recognizeTextFromBitmap(bitmapFromAssets);}});}// 从assets中读取一张Bitmap类型的图片private Bitmap getBitmapFromAssets(Context context, String filename) {Bitmap bitmap = null;AssetManager assetManager = context.getAssets();try {InputStream is = assetManager.open(filename);bitmap = BitmapFactory.decodeStream(is);is.close();Log.i("TAG", "图片读取成功。");
//            Toast.makeText(getApplicationContext(), "图片读取成功。", Toast.LENGTH_SHORT).show();} catch (IOException e) {Log.i("TAG", "图片读取失败。");
//            Toast.makeText(getApplicationContext(), "图片读取失败。", Toast.LENGTH_SHORT).show();e.printStackTrace();}return bitmap;}private void dispatchTakePictureIntent() {Intent takePictureIntent = new Intent(MediaStore.ACTION_IMAGE_CAPTURE);if (takePictureIntent.resolveActivity(getPackageManager()) != null) {startActivityForResult(takePictureIntent, REQUEST_IMAGE_CAPTURE);}}@Overrideprotected void onActivityResult(int requestCode, int resultCode, Intent data) {super.onActivityResult(requestCode, resultCode, data);if (requestCode == REQUEST_IMAGE_CAPTURE && resultCode == RESULT_OK) {Bundle extras = data.getExtras();Bitmap imageBitmap = (Bitmap) extras.get("data");// 在这里使用imageBitmap进行文字识别image.setImageBitmap(imageBitmap);recognizeTextFromBitmap(imageBitmap);}}private void recognizeTextFromBitmap(Bitmap image) {prepareTess();// 创建TessBaseAPI实例(这在内部创建本机Tesseract实例)TessBaseAPI tess = new TessBaseAPI();//给定的路径必须包含子目录“tessdata”,其中是“*.traineddata”语言文件//路径必须可由应用程序直接读取String dataPath = getExternalFilesDir("/").getPath() + "/";if (!tess.init(dataPath, "chi_sim")) { // could be multiple languages, like "eng+deu+fra"//初始化Tesseract时出错(数据路径错误/无法访问或语言文件不存在)//释放本机Tesseract实例tess.recycle();return;}//加载图像(文件路径、位图、像素…)//(在Tesseract生命周期内可以调用多次)tess.setImage(image);//启动识别(如果尚未对此图像进行识别)并检索结果//(在Tesseract生命周期内可以调用多次)String text = tess.getUTF8Text();tv_result.setText(text);//当您不想再使用本机Tesseract实例时,请将其释放//在该调用之后,无法在此TessBaseAPI实例上调用任何方法tess.recycle();}// 为Tesserect复制(从assets中复制过去)所需的数据private void prepareTess() {try{// 先创建必须的目录File dir = getExternalFilesDir(TESS_DATA);if(!dir.exists()){if (!dir.mkdir()) {Toast.makeText(getApplicationContext(), "目录" + dir.getPath() + "没有创建成功", Toast.LENGTH_SHORT).show();}}// 从assets中复制必须的数据String pathToDataFile = dir + "/" + DATA_FILENAME;if (!(new File(pathToDataFile)).exists()) {InputStream in = getAssets().open(DATA_FILENAME);OutputStream out = new FileOutputStream(pathToDataFile);byte[] buff = new byte[1024];int len;while ((len = in.read(buff)) > 0) {out.write(buff, 0, len);}in.close();out.close();}} catch (Exception e) {Log.e("TAG", e.getMessage());}}}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/577176.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据分析之POWER Piovt的KPI设置

内容总结&#xff1a; 1.两个表格关联不上&#xff1a;需要添加辅助列&#xff0c;建立关联 2.添加辅助列后还关联不上&#xff1a;将虚线变为实线 3.根据需求要增加一些度量值 4.设置KPI后&#xff0c;绝对值选1后设定百分比 5.在透视表里面加入KPI状态 导入所关联的数据后建立…

从关键词到上下文:GPT 如何重新定义 SEO 策略

如何利用GPT技术革新SEO内容创建&#xff1f; 新的 SEO 格局 探索 SEO 的快速变化&#xff0c;重点关注从以关键字为中心的策略到更深入地了解用户意图和上下文的转变。 GPT 简介及其对内容创建、用户参与和搜索引擎优化 (SEO) 的革命性影响。 了解 GPT&#xff1a;技术范式转…

基于单片机的便携式瓦斯检测仪系统设计

**单片机设计介绍&#xff0c;基于单片机的便携式瓦斯检测仪系统设计 文章目录 一 概要二、功能设计设计思路 三、 软件设计原理图 五、 程序六、 文章目录 一 概要 基于单片机的便携式瓦斯检测仪系统设计是一个针对煤矿等工业环境中瓦斯气体浓度检测的重要项目。以下是该设计…

HarmonyOS实战开发-使用List组件实现导航与内容联动的效果。

1 卡片介绍 使用ArkTS语言&#xff0c;实现一个导航与内容二级联动的效果。 2 标题 二级联动&#xff08;ArkTS&#xff09; 3 介绍 本篇Codelab是主要介绍了如何基于List组件实现一个导航和内容的二级联动效果。样例主要包含以下功能&#xff1a; 切换左侧导航&#xff…

2.2.1.3-移动平均线

跳转到根目录&#xff1a;知行合一&#xff1a;投资篇 已完成&#xff1a; 1、投资&技术   1.1.1 投资-编程基础-numpy   1.1.2 投资-编程基础-pandas   1.2 金融数据处理   1.3 金融数据可视化 2、投资方法论   2.1.1 预期年化收益率   2.1.2 一个关于yaxb的…

8722ES安捷伦8722ES网络分析仪

181/2461/8938产品概述&#xff1a; Agilent 8722ES 包括集成合成源、测试装置和调谐接收器。内置 S 参数测试仪可提供正向和反向的全范围幅度和相位测量。内置矢量精度增强技术包括完整的两端口、适配器移除和可选的 TRL 校准。 其他功能和规格包括&#xff1a; 频率&#x…

【八大排序】一篇文章搞定所有排序

文章目录 1.排序的概念2.常见排序算法的实现2.1 插入排序2.1.1直接插入排序2.1.2希尔排序 2.2选择排序2.2.1直接选择排序:2.2.2堆排序 2.3交换排序2.3.1冒泡排序2.3.2快速排序Hoare法前后指针法挖坑法非递归版本 2.4归并排序递归版本非递归版本 2.5计数排序3.排序的比较 1.排序…

linux 组建raid5详细操作

raid5最多运行损坏一个盘&#xff0c;最少3个盘&#xff0c;容量为少一块硬盘的容量之和。 如果硬盘数量较多&#xff0c;比如8块以上&#xff0c;建议用raid6&#xff0c;raid6最多允许两块硬盘损坏。 如果需要 一、安装raid软件 deb包 apt-get install mdadm或dnf包 dnf …

基于kalman的单目标追踪,以及demo测试(Python and C++)

一.卡尔曼滤波简单介绍 我们可以在任何含有不确定信息的动态系统中的使用卡尔曼滤波&#xff0c;对系统的下一步动作做出有根据的猜测。猜测的依据是预测值和观测值&#xff0c;首先我们认为预测值和观测值都符合高斯分布且包含误差&#xff0c;然后我们预设预测值的误差Q和观测…

【Linux多线程】线程的同步与互斥

【Linux多线程】线程的同步与互斥 目录 【Linux多线程】线程的同步与互斥分离线程Linux线程互斥进程线程间的互斥相关背景概念问题产生的原因&#xff1a; 互斥量mutex互斥量的接口互斥量实现原理探究对锁进行封装(C11lockguard锁) 可重入VS线程安全概念常见的线程不安全的情况…

Java八股文(设计模式)

Java八股文の设计模式 设计模式 设计模式 什么是设计模式&#xff1f;请列举一些常见的设计模式。 设计模式是软件设计中常用的一种思维模式&#xff0c;它描述了一类具有相似特征和解决思路的问题。 常见的设计模式包括单例模式、工厂模式、观察者模式、装饰器模式等。 请解释…

热门IT【视频教程】-华为/思科/红帽/oracle

华为认证 网络工程师-入门基础课&#xff1a;华为HCIA认证课程介绍-CSDN博客 网络工程师进阶课&#xff1a;华为HCIP认证课程介绍-CSDN博客 职场进阶&#xff0c;踏上高峰——HCIE-Datacom认证-CSDN博客 华为HCIA试听课程 &#xff1a; 超级实用&#xff0c;华为VRP系统文件…