Softmax回归C++实现

2023-10-27

前言

Softmax回归模型的理论知识上一篇博文已经介绍。C++代码来源于一个开源项目，链接地址我忘了

，哪天找到了再附上。对原代码改动不大，只是进行了一些扩充。

实验环境

Visual Studio 2013

数据

数据来自http://archive.ics.uci.edu/ml/datasets/Optical+Recognition+of+Handwritten+Digits，包含了26个大写字母。

里面共有20000个样本，每个样本16维。

实验目的

完成对数据集中字符样本的分类。

实验代码

1.定义一个LogisticRegression的类：

头文件 LogisticRegression.h

#include <iostream>
#include <math.h>
#include<algorithm> 
#include <functional> 
#include <string>
#include <cassert>
#include <vector>
using namespace std;
class LogisticRegression {
public:
	LogisticRegression(int inputSize, int k, int dataSize, int num_iters,double learningRate);
	~LogisticRegression();
	bool loadData(const string& filename);//加载数据
	void train();//训练函数
	void softmax(double* thetaX);//得到样本对应的属于某个类别的概率
	double predict(double* x);//预测函数
	double** getX();
	double** getY();
	void printX();
	void printY();
	void printTheta();
private:
	int inputSize;//输入特征数，不包括bias项
	int k;//类别数
	int dataSize;//样本数
	int num_iters;//迭代次数
	double **theta;//学习得到的权值参数
	double alpha;//学习速率
	double** x;//训练数据集
	double** y;//训练数据集对应的标号
};

实现文件 LogisticRegression.cpp

#include "LogisticRegression.h"
LogisticRegression::LogisticRegression(int in, int out,int size, int num_iters,double learningRate) {
	inputSize = in;
	k = out;
	alpha = learningRate;
	dataSize = size; 
	this->num_iters = num_iters;
	// initialize theta
	theta = new double*[k];
	for (int i = 0; i<k; i++) theta[i] = new double[inputSize];
	for (int i = 0; i<k; i++) {
		for (int j = 0; j<inputSize; j++) {
			theta[i][j] = 0;
		}
	}
	//initialize x
	x = new double*[dataSize];
	for (int i = 0; i<dataSize; i++) x[i] = new double[inputSize];
	for (int i = 0; i<dataSize; i++) {
		for (int j = 0; j<inputSize; j++) {
			x[i][j] = 0;
		}
	}
	//initialize y
	y = new double*[dataSize];
	for (int i = 0; i<dataSize; i++) y[i] = new double[k];
	for (int i = 0; i<dataSize; i++) {
		for (int j = 0; j<k; j++) {
			y[i][j] = 0;
		}
	}
}

LogisticRegression::~LogisticRegression() {
	for (int i = 0; i<k; i++) delete[] theta[i];
	delete[] theta;
	for (int i = 0; i < dataSize; i++)
	{
		delete[] x[i];
		delete[] y[i];
	}
	delete[] x;
	delete[] y;
}

void LogisticRegression::train() {
	for (int n = 0; n < num_iters; n++)
	{
		for (int s = 0; s < dataSize; s++)
		{
			double *py_x = new double[k];
			double *dy = new double[k];
			//1.求出theta*x
			for (int i = 0; i<k; i++) {
				py_x[i] = 0;
				for (int j = 0; j<inputSize; j++) {
					py_x[i] += theta[i][j] * x[s][j];
				}
			}
			//2.求出概率
			softmax(py_x);
			for (int i = 0; i<k; i++) {
				dy[i] = y[s][i] - py_x[i];//真实值与预测值的差异

				for (int j = 0; j<inputSize; j++) {
					theta[i][j] += alpha * dy[i] * x[s][j] / dataSize;
				}
			}
			delete[] py_x;
			delete[] dy;
		}
	}
}

void LogisticRegression::softmax(double *x) {
	double max = 0.0;
	double sum = 0.0;

	for (int i = 0; i<k; i++) if (max < x[i]) max = x[i];
	for (int i = 0; i<k; i++) {
		x[i] = exp(x[i] - max);
		sum += x[i];
	}

	for (int i = 0; i<k; i++) x[i] /= sum;
}


double LogisticRegression::predict(double *x) {
	double clsLabel;
	double* predictY = new double[k];
	for (int i = 0; i < k; i++) {
		predictY[i] = 0;
		for (int j = 0; j < inputSize; j++) {
			predictY[i] += theta[i][j] * x[j];
		}
	}
	softmax(predictY);
	double max = 0;
	for (int i = 0; i < k; i++)
	{
		if (predictY[i]>max) {
			clsLabel = i;
			max = predictY[i];
		}
	}
	return clsLabel;
}

double** LogisticRegression::getX()
{
	return x;
}
double** LogisticRegression::getY()
{
	return y;
}

bool LogisticRegression::loadData (const string& filename)
{
	const int M = 1024;
	char buf[M + 2];
	int i;
	vector<int> responses;
	FILE* f = fopen(filename.c_str(), "rt");
	if (!f)
	{
		cout << "Could not read the database " << filename << endl;
		return false;
	}
	int rowIndex = 0;
	for (;;)
	{
		char* ptr;
		if (!fgets(buf, M, f) || !strchr(buf, ','))// char *strchr(const char *s,char c):查找字符串s中首次出现字符c的位置
			break;
		y[rowIndex][buf[0] - 'A'] = 1;
		ptr = buf + 2;
		for (i = 0; i < inputSize; i++)
		{
			int n = 0;//存放sscanf当前已读取了的总字符数
			int m = 0;
			sscanf(ptr, "%d%n", &m, &n);//sscanf() - 从一个字符串中读进与指定格式相符的数据
			x[rowIndex][i] = m;
			ptr += n + 1;
		}
		rowIndex++;
		if (rowIndex >= dataSize) break;
		if (i < inputSize)
			break;
	}
	fclose(f);
	cout << "The database " << filename << " is loaded.\n";
	return true;
}

void LogisticRegression::printX()
{
	for (int i = 0; i<dataSize; i++) {
		for (int j = 0; j<inputSize; j++) {
			cout << x[i][j] << " ";
		}
		cout << endl;
	}
}
void LogisticRegression::printY()
{
	for (int i = 0; i<dataSize; i++) {
		for (int j = 0; j<k; j++) {
			cout << y[i][j] << " ";
		}
		cout << endl;
	}
}

void LogisticRegression::printTheta()
{
	for (int i = 0; i < k; i++) {
		for (int j = 0; j < inputSize; j++) {
			cout << theta[i][j] << " ";
		}
		cout << endl;
	}

}

2.代码测试：

#include "LogisticRegression.h"
void letter_recog()
{
	double learning_rate = 0.1;
	int num_iters = 500;//迭代次数
	int train_N =10000;//训练样本个数
	int test_N = 8;//测试样本个数
	int n_in = 16;//输入特征维数
	int n_out = 26;//类别数
	LogisticRegression classifier(n_in, n_out, train_N, num_iters, learning_rate);
	classifier.loadData("letter-recognition.data");
	//训练
	classifier.train();
	// test data
	double test_X[8][16] = {
		{ 5, 10, 6, 8, 4, 7, 7, 12, 2, 7, 9, 8, 9, 6, 0, 8 },//M
		{ 6, 12, 7, 6, 5, 8, 8, 3, 3, 6, 9, 7, 10, 10, 3, 6 },//W
		{ 3, 8, 4, 6, 4, 7, 7, 12, 1, 6, 6, 8, 5, 8, 0, 8 },//N
		{ 1, 0, 1, 0, 0, 7, 8, 10, 1, 7, 5, 8, 2, 8, 0, 8 },//H
		{ 3, 6, 5, 5, 6, 6, 8, 3, 3, 6, 5, 9, 6, 7, 5, 9 },//R
		{ 7, 11, 11, 8, 7, 4, 8, 2, 9, 10, 11, 9, 5, 8, 5, 4 }, //X
		{ 6, 9, 6, 4, 4, 8, 9, 5, 3, 10, 5, 5, 5, 10, 5, 6 },//P	
		{ 4, 7, 6, 5, 5, 8, 5, 7, 4, 6, 7, 9, 3, 7, 6, 9 }//Q
	};
	// test
	for (int i = 0; i<test_N; i++) {
		double predict = classifier.predict(test_X[i]);
		char char_predict = 'A' + predict;
		cout << "predict:" << char_predict << endl;
	}
}

int main() {
	letter_recog();
	getchar();
	return 0;

输出结果：

程序中用了前1w个样本来训练分类器，整个训练过程花了328.117s。为了加快程序的运行速度，决定使用OpenMP来加速for循环。

在Visual Studio里面使用OpenMP很简单。

点击项目-->属性，进入属性页。在c/c++下面的Language中开启Open MP Support即可。

修改过后的train函数：

void LogisticRegression::train() {
	for (int n = 0; n < num_iters; n++)
	{
#pragma omp parallel for  
		for (int s = 0; s < dataSize; s++)
		{
			double *py_x = new double[k];
			double *dy = new double[k];
			//1.求出theta*x
			for (int i = 0; i<k; i++) {
				py_x[i] = 0;
				for (int j = 0; j<inputSize; j++) {
					py_x[i] += theta[i][j] * x[s][j];
				}
			}
			//2.求出概率
			softmax(py_x);
#pragma omp parallel for  
			for (int i = 0; i<k; i++) {
				dy[i] = y[s][i] - py_x[i];//真实值与预测值的差异			
				for (int j = 0; j<inputSize; j++) {
					theta[i][j] += alpha * dy[i] * x[s][j] / dataSize; //- lambda*theta[i][j];
				}
			}
			delete[] py_x;
			delete[] dy;
		}
	}
}

修改过后的softmax函数：

void LogisticRegression::softmax(double *x) {
	double max = 0.0;
	double sum = 0.0;
	for (int i = 0; i<k; i++) if (max < x[i]) max = x[i];
#pragma omp parallel for  
	for (int i = 0; i<k; i++) {
		x[i] = exp(x[i] - max);//防止数据溢出
		sum += x[i];
	}
#pragma omp parallel for  
	for (int i = 0; i<k; i++) x[i] /= sum;
}

输出结果：

训练时间从之前的328.117s较少到49.081s,提升了6.68倍。

从测试结果来看，分类器把R预测成了K，把X预测成了U。本文没有对分类器的准确率进行严格的测试，有兴趣的同学可以自己去测一下。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习

deeplearning

Softmax

c

算法

Softmax回归C++实现的相关文章

每个托管线程是否都有自己对应的本机线程？

我想知道是否在 Net 中创建托管线程通过调用Thread Start 导致在后台创建一个本机线程那么托管线程是否有对应的本机线程呢如果是当托管线程等待或睡眠时是否意味着相应的本机线程也在等待或睡眠是的 NET 线程映射到所有当
在 C++ 中使用 matlab 结构（matlab 函数调用的返回值）（由 matlab 编译器生成的库）

你好我有一个相当简单的 matlab 函数例如 function MYSTRUCT myfunc MYSTRUCT prop1 test MYSTRUCT prop2 foo MYSTRUCT prop3 42 end 我用 matla
未提供参数时如何指定 C# System.Commandline 行为？

在我的控制台应用程序中当未提供控制台参数时将执行我指定列表在本例中为参数 3 的任何处理程序调用该处理程序时布尔参数设置为 false 但对我来说根本不调用它更有意义如何防止这种情况发生并显示帮助文本 using System
如何在c++中读取pcap文件来获取数据包信息？

我想用 C 编写一个程序来读取 pcap 文件并获取数据包的信息例如 len sourc ip flags 等现在我找到了如下代码我认为它会帮助我获取信息但是我有一些疑问首先我想知道应该将哪个库添加到我的程序中然后什么是 pca
如何让 Swagger 插件在自托管服务堆栈中工作

我已经用 github 上提供的示例重新提出了这个问题并为任何想要自己运行代码的人提供了一个下拉框下载链接 Swagger 无法在自托管 ServiceStack 服务上工作 https stackoverflow com questio
在 LINQ 中按 Id 连接多表和分组

我想按categoryId显示列表产品的名称组这是我的代码我想要我的视图显示结果 Desktop PC HP Red PC Dell Yellow PC Asus Red SmartPhone Lumia 720 Blue 我的组模型
在 C 中匹配二进制模式

我目前正在开发一个 C 程序需要解析一些定制的数据结构幸运的是我知道它们是如何构造的但是我不确定如何在 C 中实现我的解析器每个结构的长度都是 32 位并且每个结构都可以通过其二进制签名来识别举个例子有两个我感兴趣的特定结构
当我们想要返回对象的引用时，为什么我们在赋值运算符中返回 *this 而通常（而不是 this）？

我正在学习 C 和指针我以为我理解了指针直到我看到这个一方面 asterix 运算符是解引用的这意味着它返回值所指向的地址中的值而与号运算符则相反它返回值存储的地址记忆现在阅读有关赋值重载的内容它说我们返回 this因
使用 LINQ2SQL 在 ASP.NET MVC 中的各种模型存储库之间共享数据上下文

我的应用程序中有 2 个存储库每个存储库都有自己的数据上下文对象最终结果是我尝试将从一个存储库检索到的对象附加到从另一个存储库检索到的对象这会导致异常 Use 构造函数注入将 DataContext 注入每个存储库 public cl
复制目录内容

我想将目录 tmp1 的内容复制到另一个目录 tmp2 tmp1 可能包含文件和其他目录我想使用C C 复制tmp1的内容包括模式如果 tmp1 包含目录树我想递归复制它们最简单的解决方案是什么我找到了一个解决方案来打开目录并读
单个对象的 Monogame XNA 变换矩阵？

我读过一些解释 XNA Monogame 变换矩阵的教程问题是这些矩阵应用于 SpriteBatch Begin matrix 这意味着所有 Draw 代码都将被转换如何将变换矩阵应用于单个可绘制对象就我而言我想转换滚动背景使其自
获取两个工作日之间的天数差异

这听起来很简单但我不明白其中的意义那么获取两次之间的天数的最简单方法是什么DayOfWeeks当第一个是起点时如果下一个工作日较早则应考虑在下周 The DayOfWeek 枚举 http 20 20 5B1 5D 3a 20htt
是否有实用的理由使用“if (0 == p)”而不是“if (!p)”？

我倾向于使用逻辑非运算符来编写 if 语句 if p some code 我周围的一些人倾向于使用显式比较因此代码如下所示 if FOO p some code 其中 FOO 是其中之一false FALSE 0 0 0 NULL etc
如何在 Xaml 文本中添加电子邮件链接？

我在 Windows Phone 8 应用程序中有一些大文本我希望其中有电子邮件链接例如 mailto 功能这是代码的一部分
外键与独立关系 - Entity Framework 5 有改进吗？

我读过了several http www ladislavmrnka com 2011 05 foreign key vs independent associations in ef 4 文章和问题 https stackoverflow
CMake 无法确定目标的链接器语言

首先我查看了this https stackoverflow com questions 11801186 cmake unable to determine linker language with c发帖并找不到解决我的问题的方法我
方法优化 - C#

我开发了一种方法允许我通过参数传入表字符串列数组字符串和值数组对象然后使用这些参数创建参数化查询虽然它工作得很好但代码的长度以及多个 for 循环散发出一种代码味道特别是我觉得我用来在列和值之间插入逗号的方法可以用不同的
C++ 条件编译

我有以下代码片段 ifdef DO LOG define log p record p else define log p endif void record char data 现在如果我打电话log hello world 在我的代码中
使用 .NET Process.Start 运行时挂起进程 - 出了什么问题？

我在 svn exe 周围编写了一个快速而肮脏的包装器来检索一些内容并对其执行某些操作但对于某些输入它偶尔会重复挂起并且无法完成例如一个调用是 svn list svn list http myserver 84 svn Docum
从列表中选择项目以求和

我有一个包含数值的项目列表我需要使用这些项目求和我需要你的帮助来构建这样的算法下面是一个用 C 编写的示例描述了我的问题 int sum 21 List

随机推荐

Unity之URP开启PostProcessing后使用RenderTexture渲染模型背景为不透明

项目需要在UI界面显示角色模型使用一个模型相机投射到RT上然后放在Raw Image上现在这个模型相机需要开启后处理Post Processing 只针对模型添加了后处理效果问题是开启后 Raw Image背景变了把UI背景图遮住了
TensorFlow找不到cudart64_110.dll not found的解决方案

问题描述当我写了两句小程序准备开启我的TensorFlow之路时候 import tensorflow as tf hello tf constant hello tensorflow print Hello python sess tf
安防监控视频云存储平台EasyNVR对接EasyNVS时，一直不上线该如何解决？

视频安防监控平台EasyNVR可支持设备通过RTSP Onvif协议接入并能对接入的视频流进行处理与多端分发包括RTSP RTMP HTTP FLV WS FLV HLS WebRTC等多种格式近期有用户在使用安防视频平台EasyNV
STLvector源码——实现框架、具体实现的详细分段剖析(重点是insert_aux在指定位置插入元素和在指定位置插入n个元素的源码)、vector实现的基本函数总结

VS2010的源码真的让人放弃还是安安稳稳看侯捷老师的SGI 源码 SGI vector 实现框架 include
Vue语言基础——ECMAScript 6.0

ECMAScript 1ES6基础 1 1ES6简介 1 2let命令 1 3const命令 2 变量的结构赋值 2 1数组的解构赋值 2 2对象的解构赋值 2 3解构赋值的主要用途 3 箭头函数 3 1箭头函数的定义 3 2箭头函数与解构
Feign的使用及原理剖析

feign使用及原理剖析一简介 Feign是一个http请求调用的轻量级框架可以以Java接口注解的方式调用Http请求 Feign通过处理注解将请求模板化当实际调用的时候传入参数根据参数再应用到请求上进而转化成真正的请求
MAC下配置PHPMyAdmin

最近需要用到MySQL 用到了客户端的管理工具 PHPMyAdmin 一配置Apache 在 Mac OS中PHP apache 环境是自带的不需要单独下载安装包只需要简单配置一下即可首先打开终端输入命令 sudo vim etc
使用Mac终端给文件夹加密压缩

首先进入文件目录cd Desktop 否则的话压缩出来的文件会包含长长的文件路径就像下面这样 zip er zip file name file name zip file name 是即将要生成的zip包的名字当前路径下是不存在的
ubuntu16.04配置以太坊环境

没有guo审放了图片我尽力了希望大家都能够不走弯路
记一次网关项目Actuator未授权访问漏洞的修复方案

前言公司项目在做等保测评的时候发现网关项目存在Actuator未授权访问漏洞在 Actuator 启用的情况下如果没有做好相关权限控制非法用户可通过访问默认的执行器端点 endpoints 来获取应用系统中的监控信息从而导致信息泄
Java 功能篇之 Object 转Map

工具类源码 import java lang reflect Field import java util HashMap import java util Map import org slf4j Logger import org sl
汽车行业相关课程推荐

ATC汽车电子课程很适合汽车行业人士学习
springmvc项目实现自动化部署

在一个ssm项目中实际执行的文件在target的和项目同名的文件夹中部署到服务器上时使用target内的war包即可在本地服务器上配置mvn命令将target文件夹删除再下载最新版的就可以做到target文件夹的更新 mvn cle
改变世界的17个数学公式

目录 1 勾股定理 2 对数 3 微积分 4 万有引力定律 5 1的平方根 6 多面体欧拉定理 7 正态分布 8 波动方程 9 傅里叶变换 10 纳维斯托克斯方程 11 麦克斯韦方程组 12 热力学第二定律 13 爱因斯坦的质能方程 14
简单几步就教会你如何使用 dockerfile 制作 LNMP 镜像，还不赶紧学起来

简单几步就教会你如何使用dockerfile制作LNMP镜像前言一 dockerfile撰写php镜像二 dockerfile撰写mysql镜像三 dockerfile撰写nginx镜像四查看镜像构建情况五分别开启nginx
springboot rabbitmq属性配置spring.rabbitmq.publisher-confirm和spring.rabbitmq.publisher-confirm-type详解

springboot rabbitmq publisher confirm 新版本已被弃用现在使用 spring rabbitmq publisher confirm type correlated 实现相同效果在springboot2
打开html文件进入文件索引,打开网站网页是文件夹目录怎么办

文章简介正常来说打开网页都可正常显示网页却在换空间之后打开二级目录却不是显示网站网页而是显示服务器文件夹中的所有html文件及文件夹目录这是一个网友问过的问题相信不少网友也曾经碰到过类似或是还没碰到过这种问题那么当网站出现这种
idea2022版本如何快速创建spring-mvc项目

目录前言一创建普通的Maven的项目 1 创建项目命名为Springmvc hello 2 添加web项目 3 导入依赖资源pom xml 建议保存 4 在resources目录创建springmvc servlet xml 5 编写
Android平台-彩色RGB图像灰度化-neon优化实例解析

图像的灰度化公式比较简单 Y R 77 G 151 B 28 256 传统的C语言一次处理一个像素点 neon指令可以一次处理8个像素点下面看看neon优化后的加速效果在Android NDK Samples 中有一个hello neo
Softmax回归C++实现

前言 Softmax回归模型的理论知识上一篇博文已经介绍 C 代码来源于一个开源项目链接地址我忘了哪天找到了再附上对原代码改动不大只是进行了一些扩充实验环境 Visual Studio 2013 数据数据来自http archi

Softmax回归C++实现

Softmax回归C++实现 的相关文章

随机推荐

热门标签

Softmax回归C++实现的相关文章