Python人工智能应用-----文本情感分析(2)

1.神经网络

人工神经网络,也称为神经网络,是机器学习的一个子集,也是最常见的监督学习算法之一。

它模拟了人脑的神经系统对复杂信息的处理机制,允许计算机程序解决人工智能、机器学习和深度学习领域的常见问题。

神经网络的强大之处在于它们能够学习训练集中特征与标签之间的关系,完成高速分类的预测任务。
多层感知器(Multilayer Perceptron,简称MLP)是最基础、最简单的一种人工神经网络。它通常应用于监督学习问题。

2.MLP处理数据

输入层就是我们的数据,隐藏层就是进行预测分析的过程。通常情况下有多个隐藏层,原始数据到达第一个隐藏层之后,第一个隐藏层把自己的预测结果返回到下一个隐藏层,第二个隐藏层根据第一个隐藏层返回的数据进行处理,逐次进行,最后到达输出层;

接下来,我们要在训练集上使用多层感知器(MLP)这个算法构造一个分类器模型;

3.搭建和训练模型

sklearn.neural_network是sklearn中的神经网络模块,我们可以使用其中的MLPClassifier类。

它为我们提供了多层感知器算法,能直接搭建和训练一个分类器模型。

(1)导入模块

从 sklearn.neural_network 模块中导入 MLPClassifier 类。

(2)创建分类器

使用MLPClassifier(),创建一个MLPClassifier对象,也就是我们的分类器模型。

我们将返回的对象存储在变量mlp中。

(3)训练分类器

接下来,就可以对mlp对象使用fit()函数,来完成模型的训练。

只需将训练集的数据,也就是文本特征train_feature和标签train_label,依次传入该函数中即可。

我们的分类器会学习传入的文本特征和标签之间的关系

4.评估模型准确率

上面的MLP算法根据我们传入进去的文本特征预测出对应的标签数据,我们让预测的数据和我们的测试集进行对比就可以了;

(1)对测试集进行预测

MLPClassifier类中提供了predict()函数,它会通过刚刚创建的多层感知器对测试集的数据进行预测。

只需对创建的分类器对象使用predict()函数,再将测试集的文本特征作为参数传入该函数中即可。

该函数会返回预测的标签数据。

(2)计算准确率

# 对测试集数据进行预测
test_pred = mlp.predict(test_feature)# 从sklearn.metrics中导入accuracy_score
from sklearn.metrics import accuracy_score# 计算预测准确率,并将结果赋值给score
score = accuracy_score(test_pred,test_label)# 输出score进行查看
print(score)

5.总结

说了这么多,通俗的讲一下,我们的数据不是分为训练集特征、测试集特征、训练集标签和测试集标签这四个部分吗?我们通过上面的神经网络里面的MLP算法,把训练集的文本特征和标签进行训练,找出一定的规律,然后把测试集的文本特征传进去,根据我们得到的规律进行预测,让后我们把测试集的标签和已知的预测结果进行比较,得出准确率,就行了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/596269.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

堆排序解读

在算法世界中,排序算法一直是一个热门话题。推排序(Heap Sort)作为一种基于堆这种数据结构的有效排序方法,因其时间复杂度稳定且空间复杂度低而备受青睐。本文将深入探讨推排序的原理、实现方式,以及它在实际应用中的价…

Qt报错:C1083 无法打开包括文件: No such file or directory

我用的是VS2019 添加了一个继承自QTextEdit 的新类QMsgTextEdit, 就出现了这样的报错: 我双击ui_TalkWindow.h, 打开这个文件后, 发现: 我就试着打开qmsgtextedit.h,发现: 于是,我就在当前ui_TalkWindow.h文件的目…

015——步进电机模块驱动开发(基于I.MX6uLL、MX-1502和28BYJ-48)

目录 一、电机驱动模块介绍 1.1 特性 1.2 应用范围 1.3 概述 1.4 电气属性 1.5 经典应用线路 二、电机介绍(本节内容来自韦东山老师课程资料) 三、 代码编写思路 四、 驱动程序 五、应用程序 一、电机驱动模块介绍 1.1 特性  低待机电流 (…

0基础学习Mybatis系列数据库操作框架——自定义分布式缓存器

Mysql这类的数据库,其查询性能往往不能100%扛住我们业务请求量。于是我们一般都会在查询数据库之前,先查询下缓存。如果缓存存在,则直接使用缓存中数据;如果缓存失效,则读取数据库,并将数据记录到缓存中。 …

手动实现Tomcat底层机制+自己设计Servlet

文章目录 1.Tomcat整体架构分析自己理解 2.第一阶段1.实现功能2.代码1.TomcatV1.java 3.调试阶段1.阻塞在readLine导致无法返回结果 4.结果演示 3.第二阶段1.实现功能2.代码1.RequestHander.java2.TomcatV2.java 3.调试阶段1.发现每次按回车会接受到两次请求 4.结果演示 4.第三…

【服务器部署篇】Linux下安装Docker容器

作者介绍:本人笔名姑苏老陈,从事JAVA开发工作十多年了,带过大学刚毕业的实习生,也带过技术团队。最近有个朋友的表弟,马上要大学毕业了,想从事JAVA开发工作,但不知道从何处入手。于是&#xff0…

【自用笔记】【大数据】

1 mapreduce (1)Map任务的数量:由输入数据的大小决定的,如文件数量和大小、HDFS块大小以及FileInputFormat的设置等。每个MapSlot可以运行一个Map任务 (2)Reduce任务的数量(分区数)&…

配置Mysql集群主从复制报错

配置Mysql集群主从复制报错: 我在master创建了一个数据库(demo_ds_0),然后又快速删除了。然后又再次创建了 demo_ds_0, 发现 slave 数据库没有将 demo_ds_0 库同步过来。 后面在 slave 数据库中执行 show slave status 发现 SLave_IO_Running 字段是 …

练习 17 Web [极客大挑战 2019]PHP

常见的网站源码备份文件名和后缀,反序列化攻击 unserialize():wakeup绕过,private类以及属性序列化后的%00修改 开靶机 提到”备份“ 那看看有没有backup.php啥的 如果网站存在备份文件,常见的备份文件后缀名有:“.gi…

开源代码分享(17)-基于足球队训练算法(Football Team Training Algorithm,FTTA)的组合风速预测

参考文献: [1]Tian Z, Gai M. Football team training algorithm: A novel sport-inspired meta-heuristic optimization algorithm for global optimization[J]. Expert Systems with Applications, 2024, 245: 123088. 1.算法基本原理 足球队训练算法&#xff0…

练习14 Web [极客大挑战 2019]Upload

phtml格式绕过,burp修改content-type绕过,常见的文件上传存放目录名 题目就叫upload,打开靶机 直接上传一个图片格式的一句话木马,返回如下: 提交练习5和9中的两种可以执行图片格式php代码的文件,修改con…

前端三剑客 —— CSS (第四节)

目录 内容回顾: 1.常见样式 2.特殊样式 特殊样式 过滤效果 动画效果 动画案例: 渐变效果 其他效果: 多列效果 字体图标(icon) 内容回顾: 1.常见样式 text-shadow x轴 y轴 阴影的模糊程度 阴影的…