Window下用caffe实现MNIST训练

2023-11-19

本博包含MNIST原始数据的格式转化，以及分类训练

1.数据转化

Caffe源码中src/caffe/caffe/examples/mnist/convert_mnist_data.cpp提供的实现代码并不能直接在Windows下运行，这里在源码的基础上进行了改写，使其可以直接在Windows 64位上直接运行，改写代码如下（直接替换convert_mnist_data.cpp中所有内容）：

PS1：蓝色字体部分需要根据你自己的实际路径进行修改

PS2：目前该程序一次只能处理train集或者test集中的一个，下方代码是处理test集的，处理train集的时候需要把蓝色路径改为train集的路径。

#include <gflags/gflags.h>  
#include <glog/logging.h>  
#include <google/protobuf/text_format.h>  
#include <leveldb/db.h>  
#include <leveldb/write_batch.h>  
#include <lmdb.h>  
#include <stdint.h>  
#include <sys/stat.h>  

#include <fstream>  // NOLINT(readability/streams)  
#include <string>  
#include <iostream>  

#include "caffe/proto/caffe.pb.h"  

using namespace caffe;  // NOLINT(build/namespaces)  
using std::string;

// gflags中的数据类型，c++ string，在这里指定转换到lmdb还是leveldb  
DEFINE_string(backend, "lmdb", "The backend for storing the result");

uint32_t swap_endian(uint32_t val) {
	val = ((val << 8) & 0xFF00FF00) | ((val >> 8) & 0xFF00FF);
	return (val << 16) | (val >> 16);
}

void convert_dataset(const char* image_filename, const char* label_filename,
	const char* db_path, const string& db_backend) {
	// Open files  
	std::ifstream image_file(image_filename, std::ios::in | std::ios::binary);
	std::ifstream label_file(label_filename, std::ios::in | std::ios::binary);
	CHECK(image_file) << "Unable to open file " << image_filename;
	CHECK(label_file) << "Unable to open file " << label_filename;
	// Read the magic and the meta data  
	uint32_t magic;
	uint32_t num_items;
	uint32_t num_labels;
	uint32_t rows;
	uint32_t cols;

	// 读取文件前n个字节，获取图像数量、图像宽、图像高  
	image_file.read(reinterpret_cast<char*>(&magic), 4);
	magic = swap_endian(magic);
	CHECK_EQ(magic, 2051) << "Incorrect image file magic.";
	label_file.read(reinterpret_cast<char*>(&magic), 4);
	magic = swap_endian(magic);
	CHECK_EQ(magic, 2049) << "Incorrect label file magic.";
	image_file.read(reinterpret_cast<char*>(&num_items), 4);
	num_items = swap_endian(num_items);
	label_file.read(reinterpret_cast<char*>(&num_labels), 4);
	num_labels = swap_endian(num_labels);
	CHECK_EQ(num_items, num_labels);
	image_file.read(reinterpret_cast<char*>(&rows), 4);
	rows = swap_endian(rows);
	image_file.read(reinterpret_cast<char*>(&cols), 4);
	cols = swap_endian(cols);

	// lmdb  
	MDB_env *mdb_env;
	MDB_dbi mdb_dbi;
	MDB_val mdb_key, mdb_data;
	MDB_txn *mdb_txn;
	// leveldb  
	leveldb::DB* db = NULL;
	leveldb::Options options;
	options.error_if_exists = true;
	options.create_if_missing = true;
	options.write_buffer_size = 268435456;
	leveldb::WriteBatch* batch = NULL;

	// Open db  
	if (db_backend == "leveldb") {  // leveldb  
		LOG(INFO) << "Opening leveldb " << db_path;
		leveldb::Status status = leveldb::DB::Open(
			options, db_path, &db);
		CHECK(status.ok()) << "Failed to open leveldb " << db_path
			<< ". Is it already existing?";
		batch = new leveldb::WriteBatch();
	}
	else if (db_backend == "lmdb") {  // lmdb  
		int rc;
		LOG(INFO) << "Opening lmdb " << db_path;
		// 创建指定的存放目录  
		//CHECK_EQ(mkdir(db_path, 0744), 0)  
		std::string strPath = std::string(db_path);
		std::string delPath = "rmdir /s/q " + strPath;
		system(delPath.c_str());
		strPath = "mkdir " + strPath;
		system(strPath.c_str());
		//CHECK_EQ(system(strPath.c_str()), 0) << "mkdir " << db_path << "failed";  

		// 创建lmdb数据库  
		CHECK_EQ(mdb_env_create(&mdb_env), MDB_SUCCESS) << "mdb_env_create failed";
		//CHECK_EQ(mdb_env_set_mapsize(mdb_env, 1099511627776), MDB_SUCCESS) << "mdb_env_set_mapsize failed";//1TB  
		CHECK_EQ(mdb_env_set_mapsize(mdb_env, 107374182), MDB_SUCCESS) << "mdb_env_set_mapsize failed";//100MB  
		CHECK_EQ(mdb_env_open(mdb_env, db_path, 0, 0664), MDB_SUCCESS) << "mdb_env_open failed";
		CHECK_EQ(mdb_txn_begin(mdb_env, NULL, 0, &mdb_txn), MDB_SUCCESS) << "mdb_txn_begin failed";
		CHECK_EQ(mdb_open(mdb_txn, NULL, 0, &mdb_dbi), MDB_SUCCESS) << "mdb_open failed. Does the lmdb already exist? ";
	}
	else {
		LOG(FATAL) << "Unknown db backend " << db_backend;
	}

	// Storing to db  
	char label;
	char* pixels = new char[rows * cols];
	int count = 0;
	const int kMaxKeyLength = 10;
	char key_cstr[kMaxKeyLength];
	string value;

	Datum datum; // Caffe数据类  
	datum.set_channels(1);
	datum.set_height(rows);
	datum.set_width(cols);
	LOG(INFO) << "A total of " << num_items << " items.";
	LOG(INFO) << "Rows: " << rows << " Cols: " << cols;
	// 将数据写入lmdb或leveldb数据库  
	for (int item_id = 0; item_id < num_items; ++item_id) {
		image_file.read(pixels, rows * cols);
		label_file.read(&label, 1);
		datum.set_data(pixels, rows*cols);
		datum.set_label(label);
		//snprintf(key_cstr, kMaxKeyLength, "%08d", item_id);  
		int ret = _snprintf(key_cstr, kMaxKeyLength, "%08d", item_id);
		if (ret == kMaxKeyLength || ret < 0) {
			printf("warning ");
			key_cstr[kMaxKeyLength - 1] = 0;
		}
		datum.SerializeToString(&value);
		string keystr(key_cstr);

		// Put in db  
		if (db_backend == "leveldb") {  // leveldb  
			batch->Put(keystr, value);
		}
		else if (db_backend == "lmdb") {  // lmdb  
			mdb_data.mv_size = value.size();
			mdb_data.mv_data = reinterpret_cast<void*>(&value[0]);
			mdb_key.mv_size = keystr.size();
			mdb_key.mv_data = reinterpret_cast<void*>(&keystr[0]);
			CHECK_EQ(mdb_put(mdb_txn, mdb_dbi, &mdb_key, &mdb_data, 0), MDB_SUCCESS)
				<< "mdb_put failed";
		}
		else {
			LOG(FATAL) << "Unknown db backend " << db_backend;
		}

		if (++count % 1000 == 0) {
			// Commit txn  
			if (db_backend == "leveldb") {  // leveldb  
				db->Write(leveldb::WriteOptions(), batch);
				delete batch;
				batch = new leveldb::WriteBatch();
			}
			else if (db_backend == "lmdb") {  // lmdb  
				CHECK_EQ(mdb_txn_commit(mdb_txn), MDB_SUCCESS)
					<< "mdb_txn_commit failed";
				CHECK_EQ(mdb_txn_begin(mdb_env, NULL, 0, &mdb_txn), MDB_SUCCESS)
					<< "mdb_txn_begin failed";
			}
			else {
				LOG(FATAL) << "Unknown db backend " << db_backend;
			}
		}
	}
	// write the last batch  
	if (count % 1000 != 0) {
		if (db_backend == "leveldb") {  // leveldb  
			db->Write(leveldb::WriteOptions(), batch);
			delete batch;
			delete db;
		}
		else if (db_backend == "lmdb") {  // lmdb  
			CHECK_EQ(mdb_txn_commit(mdb_txn), MDB_SUCCESS) << "mdb_txn_commit failed";
			mdb_close(mdb_env, mdb_dbi);
			mdb_env_close(mdb_env);
		}
		else {
			LOG(FATAL) << "Unknown db backend " << db_backend;
		}
		LOG(ERROR) << "Processed " << count << " files.";
	}
	delete[] pixels;
}

int main(int argc, char* argv[])
{
#ifndef GFLAGS_GFLAGS_H_  
	namespace gflags = google;
#endif  
	argc = 4;
#ifdef _DEBUG  
	argv[0] = "D:/Caffe/caffe-windows/Build/x64/Debug/convert_imageset.exe";
#else  
	argv[0] = "D:/Caffe/caffe-windows/Build/x64/Release/convert_imageset.exe";
#endif  
	argv[1] = "D:/Caffe/caffe-windows/Build/x64/Release/MNIST/t10k-images.idx3-ubyte";
	argv[2] = "D:/Caffe/caffe-windows/Build/x64/Release/MNIST/t10k-labels.idx1-ubyte";
	argv[3] = "D:\\Caffe\\caffe-windows\\Build\\x64\\Release\\MNIST\\lmdb\\test";

	// 用来设定usage说明  
	gflags::SetUsageMessage("This script converts the MNIST dataset to\n"
		"the lmdb/leveldb format used by Caffe to load data.\n"
		"Usage:\n"
		"    convert_mnist_data [FLAGS] input_image_file input_label_file "
		"output_db_file\n"
		"The MNIST dataset could be downloaded at\n"
		"    http://yann.lecun.com/exdb/mnist/\n"
		"You should gunzip them after downloading,"
		"or directly use data/mnist/get_mnist.sh\n");
	// 解析命令行参数  
	gflags::ParseCommandLineFlags(&argc, &argv, true);

	// 获取标志参数backend的值  
	const string& db_backend = FLAGS_backend;

	if (argc != 4) {
		// 输出usage说明  
		gflags::ShowUsageWithFlagsRestrict(argv[0],
			"examples/mnist/convert_mnist_data");
	}
	else {
		// 设置日志文件名中"文件名"字段  
		// 每个进程中至少要执行一次InitGoogleLogging，否则不产生日志文件  
		google::InitGoogleLogging(argv[0]);
		convert_dataset(argv[1], argv[2], argv[3], db_backend);
	}

	std::cout << "ok!" << std::endl;
	return 0;
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

caffe

Window下用caffe实现MNIST训练的相关文章

Caffe源码中caffe.proto文件分析

Caffe源码 caffe version 09868ac date 2015 08 15 中有一些重要文件这里介绍下caffe proto文件在src caffe proto目录下有一个caffe proto文件 proto目录下除了
Windows 版 Caffe 中的未知图层类型（裁剪）

我想使用以下卷积神经网络 http lmb informatik uni freiburg de people ronneber u net 与咖啡构建https github com BVLC caffe tree windows 适用于
如何将 .npy 文件转换为 .binaryproto？

我使用 python 创建了一个平均图像文件并将其保存到 numpy 文件中我想知道如何将此 npy 文件转换为 binaryproto 文件我正在使用此文件来使用 GoogLeNet 进行训练您可以简单地使用 numpy 创建 bi
Caffe sigmoid交叉熵损失

我正在使用 sigmoid 交叉熵损失函数来解决多标签分类问题如下所示本教程然而在他们的教程结果和我的结果中输出预测都在范围内 Inf Inf 而 sigmoid 的范围是 0 1 sigmoid 仅在反向传播中处理吗也就是说前
如何编写带有预加载的caffe python数据层？

如何编写异步数据层以在执行其他处理时预加载批次有一些示例代码吗谢谢有多种方法可以实现您想要的目标我将尝试在这里勾勒出一种选择系统的总体视图是你有n Loader异步加载数据并送入队列然后该层读取batch size队列中的项目
Caffe Sigmoid交叉熵损失层损失函数

我正在查看Caffe的代码Sigmoid 交叉熵损失层 https github com BVLC caffe blob master src caffe layers sigmoid cross entropy loss layer cp
未知的底部 blob“数据”（层“conv1”，底部索引 0）

尝试在我自己的数据集上训练 LeNet 我从长一维矢量数据集生成了 HD F5 文件并创建了 HDF5 数据层如下所示我对顶部 blob 的命名与生成 HDF5 时的命名相同 name Test net layer name data
Caffe 求解器中的average_loss 字段有什么用？

有什么用average loss 有人可以举个例子或者用通俗易懂的语言解释一下吗您可以在caffe proto https github com BVLC caffe blob master src caffe proto caffe p
如何更改CUDA版本

我在编译修改后的caffe版本时遇到了这个错误 OpenCV static library was compiled with CUDA 7 5 support Please use the same version or rebuild
Caffe/pyCaffe：设置所有 GPU

是否可以为Caffe 尤其是pyCaffe 设置所有GPU 就像是 caffe train solver examples mnist lenet solver prototxt gpu all 这两个分支现在都支持多 GPU 一段时间了
caffe： **group** 参数是什么意思？

我已阅读有关的文档group param group g 默认 1 如果 g gt 1 我们将每个过滤器的连接限制为输入的子集具体地将输入和输出通道分为g组第i个输出组通道将仅与第i个输入组通道连接但首先我不明白它们的确切含义其次
Caffe net.predict() 输出随机结果 (GoogleNet)

我使用了预训练的 GoogleNethttps github com BVLC caffe tree master models bvlc googlenet https github com BVLC caffe tree master
PyInstaller“ValueError：太多值无法解压”

pyinstaller 版本 3 2 操作系统 win10 我的 python 脚本在 Winpython Python 解释器中运行良好但是当我使用 Pyinstaller 包时 python 脚本包含 caffe 模块我将面临的问题
如何在 pycaffe 中获取图层类型？

是否有可能在 pycaffe 中获取每一层的类型例如卷积数据等我搜索了提供的示例但找不到任何内容目前我正在使用图层名称来完成我的工作这是非常糟糕和有限的这很容易 import caffe net caffe Net path
nvcc fatal：安装 cuda 9.1+caffe+openCV 3.4.0 时不支持 gpu 架构“compute_20”

我已经安装了CUDA 9 1 cudnn 9 1 opencv 3 4 0 caffe 当我尝试跑步时make all j8 in caffe目录下出现这个错误 nvcc fatal 不支持的 GPU 架构 compute 20 我尝试过
Google Inceptionism：按类别获取图像

在著名的 Google Inceptionism 文章中 http googleresearch blogspot jp 2015 06 inceptionism going deeper into neural html http goo
如何加载 caffe 模型并转换为 numpy 数组？

我有一个 caffemodel 文件其中包含 ethereon 的 caffe tensorflow 转换实用程序不支持的层我想生成我的咖啡模型的 numpy 表示我的问题是如何将 caffemodel 文件我还有 prototx
如何在 Caffe 中沿着通道分割 Blob

我想在Caffe中分割Blob通道这样我就可以分割一个Blob N c w h 分成两个大小相同的输出 Blob N c 2 w h 我上面描述的是非常笼统的我实际上想做的是将一个两通道输入图像分离成两个不同的图像一个进入卷积层另一
如何使用pycaffe重构caffe网络

我想要的是加载网络后我将分解一些特定的图层并保存新的网络例如原网数据 gt conv1 gt conv2 gt fc1 gt fc2 gt softmax New net 数据 gt conv1 1 gt conv1 2 gt c
根据caffe中的“badness”缩放损失值

我想根据训练期间当前预测与正确标签的接近远近来缩放每个图像的损失值例如如果正确的标签是猫而网络认为它是狗那么惩罚损失应该小于网络认为它是汽车的情况我正在做的方式如下 1 我定义了标签之间距离的矩阵 2 将该矩

随机推荐

【Python网络蜘蛛】：基础 - HTTP基本原理

文章目录 1 1 HTTP基本原理 1 URI和URL 2 HTTP和HTTPS 3 HTTP请求过程 4 请求 5 响应 1 1 HTTP基本原理 1 URI和URL URI为统一资源标识符 URL为统一资源定位符举个例子理解 http
最简单的方式来理解阻抗、反射和端接

1 阻抗失配与反射在深入学习电磁场之后就觉得高中物理老师不应该用水流来比喻电流结果到了自己去和别人讲阻抗反射发现用水来做比喻还是很方便轻松的所以之前在电源滤波的系列文章中高速先生就多次请水来友情出演这不欢迎我们的水小
Simulink仿真模型中的常数符号赋值

对模型中的参数或者是常数符号赋值可以通过下面两种方法在MATLAB的命令行中直接赋值然后再运行仿真模型如下图在file gt model properties的initFcn 中进行设置
AI芯片，是噱头还是趋势？

随着AlphaGo的诞生深度学习日益普及人工智能开始从智能化工具向智能机器进军原有的MCU已无法满足深度学习的高速海量数据运算要求 AI芯片便应运而生如今嵌入式芯片领域正面临AI芯片的新一轮机遇那么在AI成为风口的当下 AI芯片
2022年高级性能测试岗面试题【面试必看】

昨天一个前同事找我问有没有性能测试岗位的面试题正好之前帮业务团队加面过几次性能测试岗位的候选人我将面试时候会问的一些问题以及要考察的点列了出来供大家参考一介绍下最近做过的项目背景预期指标系统架构场景设计及遇到的性能问题
oobabooga-text-generation-webui可能是最好的语言模型启动器（包含手把手安装教程）

原文 oobabooga text generation webui可能是最好的语言模型启动器包含手把手安装教程哔哩哔哩引言问 oobabooga是什么 oobabooga text generation webui是一个用于运行类
HeadFirst 设计模式学习笔记10——MVC分析

1 M V C Model View Controller 模式视图控制器这是一种范型模型对象正是应用系统存在的理由你设计的对象包含了数据逻辑和其他在你的应用领域创建定制的类视图通常是控件用来显示和编辑控制器位于二者中间
3.3 C++多继承与虚基类

书接上回继承存在二义性上图中 A是虚基类 virtual的继承方式就是虚继承参考下文章 C 虚继承和虚基类详解知乎 zhihu com
apache和iis文件解析漏洞原理及修复

Apache文件解析漏洞是指攻击者可以利用Apache服务器的文件解析功能通过构造特殊的URL 访问服务器上的敏感文件从而获取服务器上的敏感信息 IIS文件解析漏洞是指攻击者可以利用IIS服务器的文件解析功能通过构造特殊的URL 访问
面试官：如何用a标签实现文件下载？（一文带你手撕知识点）

前言大家好今天给大家带来前端小知识前端利用a标签实现文件图片下载也就是教大家利用a标签或者是 window open 来实现下载功能文章目录前言常用方式方法分析代码实现常用方式 a href url 下载 a a标签
Weex简介及环境搭建(mac版)

1 Weex简介及特点 weex 是一个使用 Web 开发体验来开发高性能原生应用的框架在Ios和Android上都实现了一个渲染引擎并提供了一套基础的内置组件渲染出来的都是原生组件提供了一套基础的内置模块可以通过这些模块来调用一
校园网服务器系统需求分析,校园网建设需求分析.doc

校园网建设需求分析校园网建设需求分析文档日期2012 5 9编号002项目名称北京市信息职业技术学院东校区校园网建设项目部门网建部开始时间2012 5 9结束时间2012 5 文档名称北京市信息职业技术学院东校区校园网建设项目需求分析文
放弃Dubbo，选择最流行的Spring Cloud微服务架构实践与经验总结

51CTO com原创稿件 Spring Cloud 在国内中小型公司能用起来吗从 2016 年初一直到现在我们在这条路上已经走了一年多在使用 Spring Cloud 之前我们对微服务实践是没有太多的体会和经验的从最初的开源软件
uniapp git忽略unpackage文件

最近在写整理一个app框架遇到git提交时unpackage文件无法忽略的问题 1 第一反应是创建 gitignore文件并写入unpackage目录本以为大功告成奈何还是不行思考可能是由于该文件已经被提交过处于被跟踪状态所
opencv安装教程python3.8_Python3.8 安装 OpenCV 库

我是 Python 小新本文演示如何在 Windows 10 下为 Python 安装 OpenCV 库事实上借助于强大的包管理工具 pip 只需要一条安装命令就可搞定打开命令提示符输入如下命令 pip install openc
Openframework在VS2010中的配置

Openframework在VS2010中的配置首先去官网下载Openframework 下载后最好解压到C盘根目录下不然会出现各种问题我也不知道怎么解决随便打开其中的例程然后右击该工程选择属性如下图接着在C C 常规选项里
基于MATLAB的WSN网络时间同步仿真

目录 1 算法概述 2 仿真效果 3 matlab仿真源码 1 算法概述 WSN时间同步时钟偏移与同步问题主讲教师马小林 1 时钟偏移与同步问题 1 时钟偏移与同步问题时钟偏移时钟之间的时间差 Clock Offset WSN系统
【王道·计算机网络】第一章计算机网络基本体系

一计算机网络概述 1 概念计算机网络是一个将分散的具有独立功能的计算机系统通过通信设备与线路连接起来由功能完善的软件实现资源共享和信息传递的系统简而言之计算机网络就是一些互联的通过通信链路互联互通自治的计算机系统的集合 2
pycharm：Updating Indices 解决办法

pycharm Updating Indices 解决办法右下角一直在update 然后我的文件夹里面文件很多都是图片流 pycharm相当于预加载这些然后在左侧可以查看但是这个过程比较慢解决的方法是让pycharm直接无视某些文
Window下用caffe实现MNIST训练

本博包含MNIST原始数据的格式转化以及分类训练 1 数据转化 Caffe源码中src caffe caffe examples mnist convert mnist data cpp提供的实现代码并不能直接在Windows下运行这里

Window下用caffe实现MNIST训练

Window下用caffe实现MNIST训练 的相关文章

随机推荐

热门标签

Window下用caffe实现MNIST训练的相关文章