【深度学习教程】Python 如何用 LSTM 做情感分析？小白也能上手！

news/2025/1/16 17:15:39/文章来源:https://www.cnblogs.com/gdutxiaoxu/p/18675403

【深度学习教程】如何用 LSTM 做情感分析？小白也能上手！

Hello 大家好，今天我们来聊一个超热门的话题——LSTM 网络在情感分析中的应用！想象一下，通过深度学习，你的代码可以读懂人类情绪，知道“我爱你”和“我讨厌你”的区别，是不是很酷？今天这篇文章，我会手把手教你从零开始，用 Python 和 Keras 实现一个基于 LSTM 的情感分析项目，新手小白也能看得懂！

LSTM 是深度学习里的一位“长跑选手”，尤其擅长处理文本序列数据，像语音识别、机器翻译、文本生成这些领域，它都能大显身手。这篇文章我会带你了解：

LSTM 网络的基础原理；
如何用 LSTM 搭建情感分析模型；
数据预处理、训练和评估的完整流程。

一、LSTM 是什么？为什么它适合情感分析？

先来点“基础知识补课”。
LSTM，也就是 Long Short-Term Memory，是一种改良的循环神经网络（RNN）。普通的 RNN 很容易在长序列数据上“记不住”之前的信息，比如说，它看到了一句小说的前半段，但后半段完全忘了上下文。LSTM 的厉害之处在于它的结构——遗忘门、输入门和输出门——可以让它有效地保留长期记忆，还能屏蔽无关信息。

而情感分析呢，本质上就是一类序列数据的分类问题：从一段文本里分析它是正面的还是负面的情绪。LSTM 擅长处理这种数据，因为它不仅能记住单词，还能理解单词之间的关系和上下文含义。

二、我们要实现什么？情感分析项目概述

在今天的项目中，我们会用 Keras 这个深度学习框架，基于一个叫做 IMDB 数据集 的经典数据集，搭建一个简单的 LSTM 模型。IMDB 数据集包含 50,000 条电影评论，每条评论都被标记为正面（1）或负面（0），这正好是我们情感分析模型的理想训练素材。

项目的主要步骤：

数据加载与预处理：将文本数据转换为机器可读的格式；
LSTM 模型构建：设计一个简单的 LSTM 网络；
模型训练与验证：让模型“学习”这些数据；
模型评估与预测：检查模型效果并用它进行情感预测。

三、项目环境准备

在正式开始之前，我们需要确保环境里安装了必要的工具。所需的库如下：

TensorFlow：主框架，Keras 集成在其中；
numpy：用于数组处理；
matplotlib（可选）：用来画训练曲线。

安装命令：

pip install tensorflow numpy matplotlib

安装好之后，我们就可以开整啦！

四、加载和预处理数据

在深度学习中，数据处理是第一步，也是最重要的一步。我们直接用 Keras 提供的 IMDB 数据集，它已经帮我们完成了分词和编号的工作，非常方便。

加载数据集

from tensorflow.keras.datasets import imdb
from tensorflow.keras.preprocessing.sequence import pad_sequences# 定义参数
max_words = 10000  # 只保留数据集中最常见的 10,000 个单词
max_len = 200  # 每条评论截断或填充到 200 个单词# 加载数据集
(x_train, y_train), (x_test, y_test) = imdb.load_data(num_words=max_words)print(f"训练集样本数: {len(x_train)}, 测试集样本数: {len(x_test)}")

数据预处理

IMDB 数据集的每条评论已经转换成了一个整数序列，每个整数对应一个单词。我们需要将这些序列统一填充到 200 个单词的长度，这样才能输入到 LSTM 模型中。

# 填充序列
x_train = pad_sequences(x_train, maxlen=max_len)
x_test = pad_sequences(x_test, maxlen=max_len)print(f"填充后的训练数据形状: {x_train.shape}")

五、构建 LSTM 模型

网络架构

LSTM 模型的核心是：

嵌入层（Embedding Layer）：将整数序列转换为稠密向量；
LSTM 层：学习序列数据的特征；
全连接层（Dense Layer）：生成分类结果。

代码实现

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, LSTM, Dense# 定义模型
model = Sequential([Embedding(input_dim=max_words, output_dim=128, input_length=max_len),  # 嵌入层LSTM(128, dropout=0.2, recurrent_dropout=0.2),  # LSTM 层Dense(1, activation='sigmoid')  # 输出层
])# 编译模型
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])# 输出模型结构
model.summary()

这个模型结构相当紧凑，非常适合新手入门。

六、训练模型

我们定义训练的超参数：

batch_size = 64：每次输入到模型的样本数；
epochs = 5：训练的迭代次数。

开始训练：

history = model.fit(x_train, y_train, batch_size=64, epochs=5, validation_split=0.2  # 20% 的训练数据用作验证集
)

训练完成后，Keras 会返回一个 history 对象，记录了每个 epoch 的训练损失和准确率。

七、评估模型

训练完成后，我们可以在测试集上检查模型的表现。

# 在测试集上评估
test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
print(f"测试集准确率: {test_acc:.4f}")

如果测试集准确率超过 85%，说明模型已经表现不错啦！

八、预测新评论的情感

模型训练完成后，我们可以用它对新评论的情感进行预测。假设我们有一条新评论：“The movie was fantastic and the acting was superb!”

预测代码：

from tensorflow.keras.preprocessing.text import Tokenizer# 定义新评论
new_review = ["The movie was fantastic and the acting was superb!"]# 将评论转为序列
tokenizer = Tokenizer(num_words=max_words)
tokenizer.fit_on_texts(new_review)
new_review_seq = tokenizer.texts_to_sequences(new_review)# 填充序列
new_review_pad = pad_sequences(new_review_seq, maxlen=max_len)# 预测情感
prediction = model.predict(new_review_pad)
print(f"情感预测: {prediction[0][0]:.4f}，(0 为负面，1 为正面)")

模型会输出一个概率值，接近 1 表示正面情感，接近 0 表示负面情感。

九、项目优化建议

使用双向 LSTM：通过双向 LSTM 同时捕捉前后文信息。
引入预训练词向量：例如 GloVe，可以让模型更好地理解单词含义。
增加数据增强：通过同义词替换、反义词生成等方法增加训练数据。

双向 LSTM 的代码示例：

from tensorflow.keras.layers import Bidirectionalmodel = Sequential([Embedding(input_dim=max_words, output_dim=128, input_length=max_len),Bidirectional(LSTM(128, dropout=0.2, recurrent_dropout=0.2)),Dense(1, activation='sigmoid')
])