OpenCV笔记(4)实现神经网络(ANN)
参考博客:点击打开链接。
1.神经网络
神经网络最重要的功能是分类,前面用opencv实现的SVM也是分类器。
分类器的输入是数值向量,输出是数值。目标是让正确分类的比例尽可能高。一般我们需要建立训练样本,标记好分类结果,用这些标记好的数据去训练分类器,训练好的分类器就可以在新来的特征向量上预测。
下面是一些样本:
若是将其分开,只需要画出一条直线,如下所示:
再来的新的向量,落到左边就是蓝球,在右边就是红球,这样就实现了一个简单的分类器。这个分类器被称为神经元。直线的方程我们可以写出来:。等式左边大于0还是小于0决定点在直线的哪一侧。
神经元的一个问题是只能分类一次,如果出现下面这种情况,就没有办法画一条直线将其分开,我们的解决办法是使用多层神经网络。
在多层神经网络之中,低层的神经元的输出是高层神经元的输入。上图我们可以分别用几条直线将其割开,再重新组合。这里每使用一条直线就是一个神经元,神经元之间依次连接,就能达到分类的目的。
神经网络的工作与人脑中的神经元有着很大的相似,每一个神经元都有若干神经元作其输入,而且自身也是另外神经元的输入,数值向量就像电信号,在不同神经元之间传导,每一个神经元只有满足了一定条件才会发射信号到下一层神经元。当然,人脑比人工神经网络要复杂的多。
神经网络的训练依靠反向传播算法,最开始的输入层输入特征向量,网络层计算得到输出,输出层发现最终结果和正确的类型不一样,便调整最后一层神经元的参数,除此之外,还让连接它的倒数第二层的神经元修改参数,如此层层后退调整。经过调整之后,继续用样本测试,如果输出继续出错,继续调整,直到输出令人满意为止。
2.OpenCV实现
建立训练样本:
float train_data[6][2] = {{500,60},{245,40},{480,250},{160,380},{400,25},{55,400}};
float labels[6] = { 0, 0, 0, 1, 0, 1 };
Mat train_data_mat(6, 2, CV_32FC1, train_data);
Mat labels_mat(6, 1, CV_32FC1, labels);
Mat layers_size = (Mat_<int>(1, 3) << 2, 6, 1);
layers_size指定了神经网络共三层:输入层、隐藏层、输出层。
模型创建和参数设置:
Ptr<ml::ANN_MLP> ann = ml::ANN_MLP::create();//创建一个空模型
ann->setLayerSizes(layers_size);
ann->setTrainMethod(ml::ANN_MLP::BACKPROP, 0.1, 0.1);
ann->setActivationFunction(ml::ANN_MLP::SIGMOID_SYM);
ann->setTermCriteria(TermCriteria(TermCriteria::MAX_ITER, 10000, 1e-6));
设置训练数据并训练分类器:
Ptr<TrainData> tData = TrainData::create(train_data_mat, ROW_SAMPLE, labels_mat);
ann->train(tData);
显示分类结果:
Vec3b green(0, 255, 0), blue(255, 0, 0);
for (int i = 0; i<img.rows; ++i)
{
for (int j = 0; j<img.cols; ++j)
{
Mat sample_mat = (Mat_<float>(1, 2) << j, i);
Mat response_mat;
ann->predict(sample_mat, response_mat);
float response = response_mat.ptr<float>(0)[0];
if (response > 0.5)
{
img.at<Vec3b>(i, j) = green;
}
else if (response < 0.5)
{
img.at<Vec3b>(i, j) = blue;
}
}
}
画出训练数据:
int thickness = -1;
int lineType = 8;
circle(img, Point(500, 60), 5, Scalar(255, 255, 255), thickness, lineType);
circle(img, Point(245, 40), 5, Scalar(255, 255, 255), thickness, lineType);
circle(img, Point(480, 250), 5, Scalar(255, 255, 255), thickness, lineType);
circle(img, Point(160, 380), 5, Scalar(0, 0, 255), thickness, lineType);
circle(img, Point(400, 25), 5, Scalar(255, 255, 255), thickness, lineType);
circle(img, Point(55, 400), 5, Scalar(0, 0, 255), thickness, lineType);
程序运行结果:
完整代码:
#include <stdio.h>
#include "opencv2/core/core.hpp"
#include "opencv2/imgproc/imgproc.hpp"
#include "opencv2/imgcodecs/imgcodecs.hpp"
#include "opencv2/highgui/highgui.hpp"
#include "opencv2/ml/ml.hpp"
using namespace cv;
using namespace ml;
using namespace std;
int main()
{
int width = 512, height = 512;
Mat img = Mat::zeros(height, width, CV_8UC3);
//建立训练样本
float train_data[6][2] = {{500,60},{245,40},{480,250},{160,380},{400,25},{55,400}};
float labels[6] = { 0, 0, 0, 1, 0, 1 };
Mat train_data_mat(6, 2, CV_32FC1, train_data);
Mat labels_mat(6, 1, CV_32FC1, labels);
Mat layers_size = (Mat_<int>(1, 3) << 2, 6, 1);
//模型创建和参数设置
Ptr<ml::ANN_MLP> ann = ml::ANN_MLP::create();//创建一个空模型
ann->setLayerSizes(layers_size);
ann->setTrainMethod(ml::ANN_MLP::BACKPROP, 0.1, 0.1);
ann->setActivationFunction(ml::ANN_MLP::SIGMOID_SYM);
ann->setTermCriteria(TermCriteria(TermCriteria::MAX_ITER, 10000, 1e-6));
//设置训练数据并训练分类器
Ptr<TrainData> tData = TrainData::create(train_data_mat, ROW_SAMPLE, labels_mat);
ann->train(tData);
//显示分类的结果
Vec3b green(0, 255, 0), blue(255, 0, 0);
for (int i = 0; i<img.rows; ++i)
{
for (int j = 0; j<img.cols; ++j)
{
Mat sample_mat = (Mat_<float>(1, 2) << j, i);
Mat response_mat;
ann->predict(sample_mat, response_mat);
float response = response_mat.ptr<float>(0)[0];
if (response > 0.5)
{
img.at<Vec3b>(i, j) = green;
}
else if (response < 0.5)
{
img.at<Vec3b>(i, j) = blue;
}
}
}
//画出训练样本数据
int thickness = -1;
int lineType = 8;
circle(img, Point(500, 60), 5, Scalar(255, 255, 255), thickness, lineType);
circle(img, Point(245, 40), 5, Scalar(255, 255, 255), thickness, lineType);
circle(img, Point(480, 250), 5, Scalar(255, 255, 255), thickness, lineType);
circle(img, Point(160, 380), 5, Scalar(0, 0, 255), thickness, lineType);
circle(img, Point(400, 25), 5, Scalar(255, 255, 255), thickness, lineType);
circle(img, Point(55, 400), 5, Scalar(0, 0, 255), thickness, lineType);
imshow("Example", img);
waitKey(0);
}
代码的基本结构与前一篇实现SVM类似。