单字符检测模型charnet使用方法,极简

Git链接

安装按照上面的说明,说下使用。

把tools下面的test做了一点修改,可以读取一张图片,把里面的单个字符都检测和识别出来。

然后绘制到屏幕上。

import torch
from charnet.modeling.model import CharNet
import cv2, os
import numpy as np
import argparse
from charnet.config import cfgdef loadDict():fn_dict="tools\char_dict.txt"with open(fn_dict, 'r') as file:lines = file.readlines()# 去除每行末尾的换行符lines = [line.strip() for line in lines]dict_char={}for line in lines:line=line.replace("\x1f","")num_line=len(line)a=line[0]index=line[1:]index=int(index)dict_char[index]=areturn dict_chardef resize(im, size):h, w, _ = im.shapescale = max(h, w) / float(size)image_resize_height = int(round(h / scale / cfg.SIZE_DIVISIBILITY) * cfg.SIZE_DIVISIBILITY)image_resize_width = int(round(w / scale / cfg.SIZE_DIVISIBILITY) * cfg.SIZE_DIVISIBILITY)scale_h = float(h) / image_resize_heightscale_w = float(w) / image_resize_widthim = cv2.resize(im, (image_resize_width, image_resize_height), interpolation=cv2.INTER_LINEAR)return im, scale_w, scale_h, w, hif __name__ == '__main__':dict_char=loadDict()parser = argparse.ArgumentParser(description="Test")fn_conf=r"configs\icdar2015_hourglass88.yaml"fn_weight=r"configs\icdar2015_hourglass88.pth"args = parser.parse_args()cfg.merge_from_file(fn_conf)cfg.freeze()charnet = CharNet()charnet.load_state_dict(torch.load(fn_weight))charnet.eval()charnet.cuda()im_file=r"data\2.jpg"im_original = cv2.imread(im_file)im, scale_w, scale_h, original_w, original_h = resize(im_original, size=cfg.INPUT_SIZE)with torch.no_grad():char_bboxes, char_scores, word_instances = charnet(im, scale_w, scale_h, original_w, original_h)for ic,box in enumerate(char_bboxes):print(box)score=char_scores[ic]max_index = np.argmax(score)label=dict_char[max_index]points = np.array(box[0:8]).reshape(-1, 2).astype(np.int32)cv2.polylines(im_original, [points], isClosed=True, color=(0, 0, 255), thickness=1)font = cv2.FONT_HERSHEY_SIMPLEXcv2.putText(im_original, label, (points[0][0],points[0][1]), font, 1, (0, 255, 0), 1)cv2.imshow("img",im_original)cv2.waitKey(0)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/314157.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

HarmonyOS 实践之应用状态变量共享

平时在开发的过程中,我们会在应用中共享数据,在不同的页面间共享信息。虽然常用的共享信息,也可以通过不同页面中组件间信息共享的方式,但有时使用应用级别的状态管理会让开发工作变得简单。 根据不同的使用场景,ArkTS…

Javaweb之JDBC的详细解析

2. JDBC介绍(了解) 2.1 介绍 通过Mybatis的快速入门,我们明白了,通过Mybatis可以很方便的进行数据库的访问操作。但是大家要明白,其实java语言操作数据库呢,只能通过一种方式:使用sun公司提供的 JDBC 规范。 Mybatis…

neovim调试linux内核过程中索引不到对应头文件问题

大家好,我叫徐锦桐,个人博客地址为www.xujintong.com,github地址为https://github.com/jintongxu。平时记录一下学习计算机过程中获取的知识,还有日常折腾的经验,欢迎大家访问。 一、环境 neovim–0.9.4 mason的clang…

牛客网SQL训练5—SQL大厂面试真题

文章目录 一、某音短视频1.各个视频的平均完播率2.平均播放进度大于60%的视频类别3.每类视频近一个月的转发量/率4.每个创作者每月的涨粉率及截止当前的总粉丝量5.国庆期间每类视频点赞量和转发量6.近一个月发布的视频中热度最高的top3视频 二、用户增长场景(某度信…

2 - 表结构 | MySQL键值

表结构 | MySQL键值 表管理1. 库的操作2. 表的操作表的创建与删除表的修改复制表 3. 管理表记录 数据类型数值类型字符类型(汉字或者英文字母)日期时间类型 表头存储与日期时间格式的数据枚举类型 数据批量处理 表管理 客户端把数据存储到数据库服务器上…

12. 整数转罗马数字

罗马数字包含以下七种字符: I, V, X, L,C,D 和 M。 字符 数值 I 1 V 5 X 10 L 50 C 100 D 500 M 1000 …

Android 反编译处理Dex

前言 当我们将Android项目打包上架的时候,为了提高被人反编译代码的可能性可以提取 dex 文件对代码进一步做混淆处理。 本文不对相关工具做过多的解释,不了解的可以先熟悉相关工具的使用。 相关工具(点击直接下载) jadx-gui&a…

假两件风衣外套,你喜欢吗?

这款假两件设计的连帽风衣外套,,姐妹们喜欢吗? 宽松版型对身材包容性很强,韩系慵懒风颜色很舒服 时尚百搭怎么穿都好看系列 做了腰部可调节抽绳,想要修身一点的可以自己调节哈 袖口处也做了金属按扣调节,防风保暖 这件风衣也很好搭配&a…

Redis的集群模式:主从 哨兵 分片集群

基于Redis集群解决单机Redis存在的问题,在之前学Redis一直都是单节点部署 单机或单节点Redis存在的四大问题: 数据丢失问题:Redis是内存存储,服务重启可能会丢失数据 > 利用Redis数据持久化的功能将数据写入磁盘并发能力问题…

【web安全】短信等各类验证码的绕过思路整理

前言 本文是对一些验证码可能出现的问题的总结。 验证码的种类分析 首先验证码有两种: 1.短信验证码,这种通常出现在一些登录,修改绑定信息等位置处。 2.人机验证码,这种一般是用来防止机器操作和密码爆破的,通常…

软件测试/测试开发丨Python 内置库 文件处理 学习笔记分享

文件操作步骤 打开文件操作文件:读/写内容关闭文件(读写完成,要及时的关闭) open 方法 def open(file, moder, bufferingNone, encodingNone, errorsNone, newlineNone, closefdTrue):文件读写模式 读操作 忘记关闭文件的危害…

HarmonyOS 路由传参

本文 我们来说两个page界面间的数据传递 路由跳转 router.pushUrl 之前我们用了不少了 但是我们只用了它的第一个参数 url 其实他还有个params参数 我们第一个组件可以编写代码如下 import router from ohos.router Entry Component struct Index {build() {Row() {Column() …