PyTorch - 使用 Convents 进行序列处理

在本章中,我们提出了一种替代方法,它依赖于跨两个序列的单个 2D 卷积神经网络。 我们网络的每一层都根据目前产生的输出序列重新编码源标记。 因此,类似注意力的属性在整个网络中普遍存在。

在这里,我们将专注于根据数据集中包含的值创建具有特定池化的顺序网络。 这个过程也最好应用在"图像识别模块"中。

顺序网络

以下步骤用于使用 PyTorch 创建带有 convents 的序列处理模型 −


步骤 1

使用 Convents 导入执行序列处理所需的模块。

import keras 
from keras.datasets import mnist 
from keras.models import Sequential 
from keras.layers import Dense, Dropout, Flatten 
from keras.layers import Conv2D, MaxPooling2D 
import numpy as np

步骤 2

使用以下代码执行必要的操作以按相应的顺序创建模式 −

batch_size = 128 
num_classes = 10 
epochs = 12
# input image dimensions 
img_rows, img_cols = 28, 28
# the data, split between train and test sets 
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train = x_train.reshape(60000,28,28,1) 
x_test = x_test.reshape(10000,28,28,1)
print('x_train shape:', x_train.shape) 
print(x_train.shape[0], 'train samples') 
print(x_test.shape[0], 'test samples')
y_train = keras.utils.to_categorical(y_train, num_classes) 
y_test = keras.utils.to_categorical(y_test, num_classes)

步骤 3

编译模型并拟合上述常规神经网络模型中的模式,如下所示 −

model.compile(loss = 
keras.losses.categorical_crossentropy, 
optimizer = keras.optimizers.Adadelta(), metrics = 
['accuracy'])
model.fit(x_train, y_train, 
batch_size = batch_size, epochs = epochs, 
verbose = 1, validation_data = (x_test, y_test)) 
score = model.evaluate(x_test, y_test, verbose = 0) 
print('Test loss:', score[0]) 
print('Test accuracy:', score[1])

生成的输出如下 −

Neural network model