NLP项目实战02:英文文本识别

简介:

欢迎来到本篇文章!今天我们将讨论一个新的自然语言处理任务——英文短文识别。具体而言,即通过分析输入的英文文本来判断其是比较消极的还是比较积极的。

展示:

1、项目界面
如下所示是项目启动后用户使用使用界面
在这里插入图片描述
2、布局介绍
首先可以看到用户使用界面上存在这么几个部分:
2.1、最左边的功能栏
2.2、最上面的添加识别文本的输入框
2.3、一个start model按钮
2.3、Test & Result
2.4、Wordcloud
2.5、WordFrequency
在这里插入图片描述
3、功能介绍
在这里插入图片描述
3.1、最左边的功能栏
这部分暂时没有功能接入,可以根据个人需求进行功能接入

3.2、最上面的添加识别文本的输入框
在这里输入需要模型进行识别的文本,这里需要注意,由于本项目是关于英文文本识别的,所以这里输入的文本需要是英文才可以。如果输入的是其他语言的文本,可能模型没有办法进行识别,或者说会出现识别出错的情况。此外由于是英文文本识别,所以用户使用界面,我也全用英文写的

3.3、一个start model按钮
当我们输入好了文本以后,我们就可以点击这个Start model进行文本的识别了

3.3、Test & Result
当模型识别以后,用户界面会将识别结果进行展示,Test & Result的结果TaoTao这里使用的图表的形式展示的,图表有两个属性,一个是Positive还有一个是Negative,其中Positive表示输入的识别文本是积极的一类,而Negative则表示消极

3.4、Wordcloud
这里属于词云的范畴了,也就是说这里会给我们输入的文本进行统计,并给数据以词云的方式展示出来。单个词在文本中出现的次数多,则词云的字体就越大。相反当单个单词在文本中出现的次数越少,则词云的字体就越小

3.5、WordFrequency
这里统计的是输入文本中每一个单词出现的单词频率。
详细的界面效果如下所示
在这里插入图片描述
4、项目设计思路
本项目的实现思路如下流程图所示:
在这里插入图片描述
这里的model采用的是深度学习中比较基础的全连接网络实现的。
数据使用的是开源数据数据集IMDB,然后用户界面采用的是Flask结合着echarts实现的。可以看到数据和模型算法都是比较容易实现的。所以我建议大家还是需要多多练习实践,只有实践,才可以对代码有更加深刻的理解。

5、功能演示
项目的具体演示如下面的视频所示:

202312161354

6、运行环境介绍
环境:windows+anaconda
主要的python库如下:

Flask                         3.0.0
torch                         1.8.2+cu102
torchaudio                    0.8.2
torchdata                     0.7.1
torchtext                     0.9.2
torchvision                   0.9.2+cu102

说明:运行本项目cpu版本的torch也是可以运行的,但是建议使用GPU进行

7.、运行项目:
首先在项目目录下打开cmd,然后输入:python model.py
当然了,你也可以在pycharm中直接run
等待项目启动就可以了。项目启动可能会慢一点,这是由于代码需要加载数据集和模型,但是之后的使用还是比较快的,包括模型的识别速度。

在这里插入图片描述
之后,在terminal中会有一个url,如下所示:
http://127.0.0.1:5000/
我们给这个url输入到网页中回车,就可以访问了
在这里插入图片描述
之后正常使用就可以了
最后说明:
由于笔者能力有限,所以在描述的过程中难免会有不准确的地方,还请多多包含!最后TaoTao还是建议大家需要多多练习实践,只有实践,才可以对代码有更加深刻的理解。

更多NLP和CV文章以及完整代码请到"陶陶name"获取。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/279301.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

重新理解一下F.cross_entropy()的细节

最初疑问:为什么F.cross_entropy (logits,labels)里的labels为212,213,这样的标签

CSS学习

CSS学习 1. 什么是css?2.css引入方式2.1 内嵌式2.2 外联式2.3 行内式2.4 引入方式特点 3. 基础选择器3.1 标签选择器3.2 类选择器3.3 id选择器3.4 通配符选择器 4. 文字基本样式4.1 字体样式4.1.1 字体大小4.1.2 字体粗细4.1.3 倾斜4.1.4 字体4.1.5 字体font相关属性连写 4.2 …

【从零开始学习--设计模式--装饰者模式】

返回首页 前言 感谢各位同学的关注与支持,我会一直更新此专题,竭尽所能整理出更为详细的内容分享给大家,但碍于时间及精力有限,代码分享较少,后续会把所有代码示例整理到github,敬请期待。 此章节介绍装…

免费下载6G全国90米高程DEM

这里为大家分享全国90米高程原始数据。 全国90米高程DEM 90米高程数据的经纬度跨度有按30度进行分块和按5度进行分块两种,下载完成后的文件如下图所示。 30度分块与5度分块 当经纬度跨度按30度进行分块时,全国范围共分成6块,由于分块的跨度…

使用 Kubeadm 部署 Kubernetes 集群详细指南

本文中,介绍了使用 Kubeadm 部署具有一个主节点和两个工作节点的 kubernetes 集群的分步指南。 Kubeadm 是一个优秀的工具,可以在更短的时间内建立一个有效的 kubernetes 集群。它在设置所有 kubernetes 集群组件方面完成了所有繁重的工作。此外&#xf…

可回收资源的环保螺旋盖葡萄酒

在酿酒师中,选择哪种瓶盖来保存一瓶葡萄酒主要取决于葡萄酒的种类和酿酒师自己的偏好。在20世纪70年代,澳洲朋友引进并推广了一种保存葡萄酒的新方法,这种新方法螺旋盖并在70年代获得专利,投入商业使用,澳大利亚的酿酒…

linux 文本信息查询grep;控制命令执行和管道操作符号

1、grep grep "keyword" /path/to/logfile获取查询结果最后一行 grep "runs/detect/train" test4.log | tail -n 12、linux控制命令执行和管道操作符号 &、|、; 和 &&、》、>、< ##例子&#xff1b;wandb disabled && yolo …

Android Studio 软件如何将系统自带的标题栏隐藏

目录 一、实现效果 二、开发环境 三、实现方法 ①首先创建一个新的项目 ②打开你需要隐藏标题栏的Activity ③我们看下正常的显示效果 ④然后在onCreate中进行代码编写 ⑤点击运行查询看效果 三、Android Studio 模板 一、实现效果 二、开发环境 三、实现方法 在Andro…

vue脚手架安装及使用

准备工作 安装node安装cnpm cnpm是npm的“廉价平替” 提高安装速度 npm install -g cnpm --registryhttps://registry.npm.taobao.org 安装脚手架 安装Vue脚手架 cnpm install -g vue/cli 用vue脚手架创建vue项目 找好创建项目的位置 创建项目 vue create test (test为项…

力扣题:数字与字符串间转换-12.16

力扣题-12.16 [力扣刷题攻略] Re&#xff1a;从零开始的力扣刷题生活 力扣题1&#xff1a;640. 求解方程 解题思想&#xff1a;首先将方程按照“”进行划分&#xff0c;然后分别记录x的因数和常数项&#xff0c;最后进行返回的判断即可 class Solution(object):def solveEqu…

玩转大数据18:大规模数据处理与分布式任务调度

引言 在数字化时代&#xff0c;数据成为了一种宝贵的资源&#xff0c;对于企业和组织来说&#xff0c;如何有效地处理和分析这些数据成为了关键的竞争力。大规模数据处理与分布式任务调度作为大数据处理的核心技术&#xff0c;为解决这一问题提供了有效的解决方案。 随着数据…

杰发科技AC7840——CAN通信简介(1)

简介 7840支持4路CAN-FD Demo调试 官网下载demo&#xff0c;烧录&#xff0c;打开串口发现打印如下。原因是没有连接CAN盒子&#xff0c;总线错误。 CAN收发器端波形 CAN_L有信号&#xff0c;CAN_H没有 波形放大 GPIO端波形 有持续波形输出 波形放大查看&#xff0c;有50U…