路透社新闻分类--自然语言处理

路透社新闻分类数据准备和载入查看文件基本信息创建网络模型训练网络模型词向量预训练与模型优化embedding_matrix = pd.read_csv('embedding_matrix.csv')embedding_matriximport numpy as npimport pandas as pdfrom tkinter import _flattenimport tensorflow as

qq_48566899

516人浏览 · 2021-09-27 10:13:08

qq_48566899 · 2021-09-27 10:13:08 发布

路透社新闻分类

数据准备和载入
查看文件基本信息
创建网络模型
训练网络模型
词向量预训练与模型优化

embedding_matrix = pd.read_csv('embedding_matrix.csv')
embedding_matrix

在这里插入图片描述

import numpy as np
import pandas as pd
from tkinter import _flatten
import tensorflow as tf

embedding_matrix = pd.read_csv('embedding_matrix.csv')
data = np.load('reuters.npz', allow_pickle=True)
data.files   # 查看数据文件中的数据信息
X = data['x']   # 样本自变量
y = data['y']   # 样本标签（新闻主题类别）
pd.Series(X).apply(len).describe()   # 统计新闻词语数量的分布

在这里插入图片描述

wordList = _flatten(X.tolist())      # 将所有新闻报道转为一个一维元组
len(list(set(wordList)))             # 对单词编码去重并统计单词数量

30979

X_padding = tf.keras.preprocessing.sequence.pad_sequences(X, maxlen=200, padding='post')   # 执行padding操作

搭建RNN模型结构

input_shape=(200, )#文档长度
mask_zero=True
trainable=False不训练这个embedding
预训练embedding
30980*128=3965440就是我们要训练的参数的个数，即参数规模，这个参数是网络输出过程中的中间产物

# 搭建RNN神经网络模型
model = tf.keras.models.Sequential([
    tf.keras.layers.Embedding(30980, 128, input_shape=(200, ), mask_zero=True,
                              weights=[embedding_matrix.values], trainable=False),
    tf.keras.layers.Bidirectional(tf.keras.layers.LSTM(64, return_sequences=True)),
    tf.keras.layers.Bidirectional(tf.keras.layers.LSTM(32)),
    tf.keras.layers.Dense(64, activation='relu'),
    tf.keras.layers.Dense(46, activation='softmax')
])
model.summary()   # 查看网络结构

在这里插入图片描述

训练网络模型从而实现文本分类

# 网络模型训练参数设置
model.compile(loss='sparse_categorical_crossentropy',
              optimizer=tf.keras.optimizers.Adam(1e-4),
              metrics=['accuracy'])
model.fit(X_padding, y, validation_split=0.2, epochs=5, batch_size=8)   # 模型训练

在这里插入图片描述

技术共进，成长同行——讯飞AI开发者社区

更多推荐

（2025年最新）人工智能学习指南：零基础入门到精通，超详细，一篇搞定所有基础知识！

讯飞AI开发者社区

如何使用Gradio快速搭建AI演示

Gradio支持对标题、描述、主题，甚至示例进行自定义设置。目前，应用程序会展示例句，用户点击这些例句即可立即开展测试。Gradio革新了开发者分享机器学习模型的方式。以往需耗时数小时编码才能达成的任务，如今借助Gradio仅需几分钟便可完成。开发者只需编写模型代码，并将其与Gradio进行连接，即可迅速获得一个可运行的演示程序以及与之对应的可分享链接。对于学习人工智能的学生、分享研究成果的科研人