为未遇到的输入创建神经网络

2024-01-20

我正在使用创建一个简单的多层前馈神经网络锻造网 http://www.aforgenet.com/framework/NN 库。我的神经网络是一个 3 层激活网络，使用反向传播学习算法通过监督学习方法进行训练。

以下是我的初始设置：

//learning rate
learningRate=0.1;

//momentum value
momentum=0;

//alpha value for bipolar sigmoid activation function
sigmoidAlphaValue=2.0;

//number of inputs to network
inputSize=5;

//number of outputs from network
predictionSize=1;

//iterations
iterations=10000;


// create multi-layer neural network
            ActivationNetwork network = new ActivationNetwork(new BipolarSigmoidFunction

(sigmoidAlphaValue), 5, 5 + 1, 3, 1);

//5 inputs
//6 neurons in input layer
//3 neurons in hidden layer
//1 neuron in output layer

// create teacher
BackPropagationLearning teacher = new BackPropagationLearning(network);

// set learning rate and momentum
teacher.LearningRate = learningRate;
teacher.Momentum = momentum;

现在我有一些输入系列，如下所示， 1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20

使用窗口滑动方法（如上所述here http://www.obitko.com/tutorials/neural-network-prediction/training-set.html）作为时间序列的输入，我的输入和

预期输出数组看起来像这样

//Iteration #1
double input[][] = new input[0][5] {1,2,3,4,5};
double output[][] = new output[0][0] {6};

//Iteration #2
double input[][] = new input[1][5] {2,3,4,5,6};
double output[][] = new output[1][0] {7};

//Iteration #3
double input[][] = new input[2][5] {3,4,5,6,7};
double output[][] = new output[2][0] {8};
.
.
.
//Iteration #n
double input[][] = new input[n][5] {15,16,17,18,19};
double output[][] = new output[n][0] {20};

经过 10k 次迭代后，使用

teacher.RunEpoch(input, output);

我的网络已成功针对给定的训练集进行了训练。所以现在，如果我使用输入 4、5、6、7、8 进行计算，网络会成功给出 9 作为答案，太棒了！

然而，当输入为 21,22,23,24,25 时，神经网络无法生成 26！

我的问题：如何训练我的网络接受这种未遇到的输入，以产生学习过程中训练集中发现的正确序列模式？

正如 @runDOSrun 所说，您的模型似乎过度拟合（训练）数据。为了避免这个问题，您可以将集合（时间序列）分为 3 部分。

训练集

第一个可能是训练网络的训练集。

验证集

第二个是验证集，对于训练的每个时期，您在验证集上测试神经网络并获取错误并将该错误存储在变量和神经网络的副本（克隆）中。在下一个时期，您必须测试（修改后的）神经网络，如果验证集上的新错误低于您测试的最后一个错误，则存储一个新的“验证神经网络”。它将为您提供一个神经网络，该神经网络在非训练集的集合中可以更好地泛化。这样你就可以避免训练集过度拟合。

训练结束时，您将拥有两个神经网络。这训练神经网络这是训练集的最佳神经网络验证神经网络，它可以为您提供一个能够更好地概括训练集的神经网络。

Test Set

最后一部分，您只需在看不见的集合中测试模型并检查错误。测试集的建议是检查神经网络在未见过的测试中的行为。真正的考验。

一般来说，您可以将整个集合分成 3 个相等的部分，或者作为示例

60%用于培训
20% 用于验证
20%用于测试

例如，请查看下图：

的样本伪代码如何实施它：

int epochs = 1;
double error = 0;
double validationError = 10000;
object validationNetwork;
do
{
    // train your network

    error = getError(trainingSet);

    //validation part...

    var currentValidationError = getError(validationSet);
    if (currentValidationError < validationError)
    {
       validationError = currentValidationError;
       validationNeuralNetwork = neuralNetwork.Clone();
    }

} while (epochs < 2000 && error < 0.001);

时间序列的交叉验证

另一方面，您也可以尝试对时间序列进行交叉验证。首先，您将集合分为 6 个部分（或更多），并训练神经网络来验证模型，如下所示：

1：训练[1 https://i.stack.imgur.com/7dVdU.png]、验证[2]、测试[3]
2：训练 [2]、验证 [3]、测试 [4]
3：训练 [3]、验证 [4]、测试 [5]
4：训练 [4]、验证 [5]、测试 [6]

如果你愿意的话，你可以分成更多的部分。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)