基于深度学习的图像检索 image retrieval based on deep learning （code ，代码）

2023-11-11

本次代码分享主要是用的caffe框架，至于caffe框架的安装过程不再说明。代码修改自“cross weights”的一篇2016年的文章，但是名字忘记了，谁记得，提醒我下。

一、环境要求

1、python

2、gcc

3、opencv

4、一些图像数集合，比如holiday、oxford、paris不过这些都是标准数据集，你也可以用到自己的系统上。

5、完整代码会之后放在github上。

二、使用说明

1、首先将整个图库进行特征提取

流程：图像->VGG 最后一个卷积层得到 H*W*512维度的tensor利用*.npy格式进行保存。对于每张图像都需要这么处理，存储每个图像的“特征”。

# Licensed under the terms of the Apache License, Version 2.0. See the LICENSE file associated with the project for terms.

import _init_paths

import os

import caffe

import numpy as np

from PIL import Image

import scipy

###################################

# Feature Extraction

###################################

##################################

#这个函数用于打开图像并且转换为RGB，其中img1=·~~~~~~~这一行可以用于改变图像尺寸。

##################################

def load_img(path):

try:

img = Image.open(path)

rgb_img = Image.new("RGB",img.size)

rgb_img.paste(img)

return rgb_img

except:

return None

#################################

#这个函数用于转换输入图像的数据量，转换为32位浮点数，同时减去3个通道上各自的均值，将数据进行通道转换。

#################################

def format_img_for_vgg(img):

d = np.array(img, dtype=np.float32)

d = d[:,:,::-1]

# Subtract mean pixel values of VGG training set

d -= np.array((104.00698793,116.66876762,122.67891434))

return d.transpose((2,0,1))

#################################

#这个函数用于特征提取，net.blob中的net代表了我们初始化完成后的网络，blob代表数据块

#################################

def extract_raw_features(net, layer, d):

"""

Extract raw features for a single image.

"""

# Shape for input (data blob is N x C x H x W)

net.blobs['data'].reshape(1, *d.shape) #这个reshape表示将网络的入口修改为适合我们图像尺寸大小的shape

net.blobs['data'].data[...] = d #d就是我们数据，将数据传入网络中

# run net and take argmax for prediction

net.forward() #这个是让网络开始计算

return net.blobs[layer].data[0] #将网络的计算结果输出（定义layer就能得到对应的层的输出）

################################

#下面这两个函数先不用管

################################

def reshape(image):

mu=np.array((104.00698793,116.66876762,122.67891434))

transformer=caffe.io.Transformer({'data':net.blobs['data'].data.shape})

transformer.set_transpose('data',(2,0,1))

transformer.set_mean('data',mu)

transformer.set_raw_scale('data',255)

#transformer.set_channel_swap('data',(2,1,0))

net.blobs['data'].reshape(10,

224,224)

transformed_image=transformer.preprocess('data',image)

print transformed_image.shape

return transformed_image

def extract_raw_features_fc6(net, layer, d):

#net.blobs['data'].reshape(1, *d.shape)

# Shape for input (data blob is N x C x H x W)

net.blobs['data'].data[...]=d

net.forward()

return net.blobs[layer].data[0]

#################################

#这是python的主函数入口，parser.add_argument代表我们手动在控制台需要输入的参数，或者提前定义好的一些参数，我们的网络的prototxt和caffemodel的路径也在参数中定义

################################

if __name__ == '__main__':

from argparse import ArgumentParser

parser = ArgumentParser()

parser.add_argument('--images', dest='images', type=str, nargs='+', required=True, help='glob pattern to image data')

parser.add_argument('--layer', dest='layer', type=str, default='fc6', help='model layer to extract')

parser.add_argument('--prototxt', dest='prototxt', type=str, default='vgg/VGG_ILSVRC_16_fc6.prototxt', help='path to prototxt')

parser.add_argument('--caffemodel', dest='caffemodel', type=str, default='vgg/VGG_ILSVRC_16_layers.caffemodel', help='path to model params')

parser.add_argument('--out', dest='out', type=str, default='', help='path to save output')

args = parser.parse_args()

##################################

#这个net=~~~~~~表示将我们的网络进行提前初始化，方便后面调用

####################################

net = caffe.Net(args.prototxt, args.caffemodel, caffe.TEST)

if not os.path.exists(args.out):

os.makedirs(args.out) #这里是检测我们的数据来源的路径是否正确

for path in args.images:

#img = load_img(path)

img=image=caffe.io.load_image(path) #加载图像

# Skip if the image failed to load

if img is None:

print path

continue

d = format_img_for_vgg(img) #对图像加载并且网络继续提取特征

#d=reshape(img)

X = extract_raw_features_fc6(net, args.layer, d) #这后面的两句，是我采用的另外的方式进行，修改层名，就会从不同的层抽取特征

filename = os.path.splitext(os.path.basename(path))[0]

np.save(os.path.join(args.out, filename), X) #将得到的结果采用*.npy的数据格式保存下来W*H*C，每一个图片对应一个*.npy

2、特征进一步计算，这里有很多的文章可以参考，但是我们介绍一种最简单的，就是把H*W*512 变成1*1*512，也就是对于每个H*W进行了sum-pooling也就是求和，这里也可以有别的一些加权方法，很多论文，主要就在这一步做文章。

这里就一句话：

def sum-pooling(X): #这里的X就是刚才512*W*H

return X.sum(axis=1,2)

3、最后，就是采用欧式距离，和我们求平面中两个点的距离一样。

distance=(X1-X2)**2

这里的X需要在计算距离之前进行normlzation。然后才可以计算距离。这样的化，距离排个倒叙就能得到了我们最后的检索结果。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

基于深度学习的图像检索 image retrieval based on deep learning （code ，代码）的相关文章

MIT_线性代数笔记：复习二

目录第二单元主要内容例题第二单元主要内容正交矩阵 Q 用矩阵形式描述正交性质投影矩阵 P 最小二乘法在方程无解时求最优解 Gram Schmidt 正交化从任意一组基得到标准正交基策略是从向量中减去投影到其它向量方向的分
【需求响应】改进连续时间控制方法用于分散式需求响应的恒温负荷研究（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Python代码及文章
基于GPT4+Python近红外光谱数据分析及机器学习与深度学习建模

详情点击链接基于ChatGPT4 Python近红外光谱数据分析及机器学习与深度学习建模教程第一 GPT4 基础 1 ChatGPT概述 GPT 1 GPT 2 GPT 3 GPT 3 5 GPT 4模型的演变 2 ChatGPT对话初
用通俗易懂的方式讲解：图解 Transformer 架构

文章目录用通俗易懂方式讲解系列 1 导语 2 正文开始现在我们开始编码从宏观视角看自注意力机制从微观视角看自注意力机制通过矩阵运算实现自注意力机制
用通俗易懂的方式讲解：内容讲解+代码案例，轻松掌握大模型应用框架 LangChain

本文介绍了 LangChain 框架它能够将大型语言模型与其他计算或知识来源相结合从而实现功能更加强大的应用接着对LangChain的关键概念进行了详细说明并基于该框架进行了一些案例尝试旨在帮助读者更轻松地理解 LangChai
【毕业设计选题】复杂背景下的无人机(UVA)夜间目标检测系统 python 人工智能深度学习

前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有不少课题是研究生级别难度的对本科同学来说是充满挑战为帮助大家顺利通过和节省时间
机器学习算法实战案例：时间序列数据最全的预处理方法总结

文章目录 1 缺失值处理 1 1 统计缺失值 1 2 删除缺失值 1 3 指定值填充 1 4 均值中位数众数填充
开始弃用NeRF？为什么Gaussian Splatting在自动驾驶场景如此受欢迎？（浙江大学最新）...

点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取今天自动驾驶之心为大家分享浙大刚刚出炉的3D Gaussian Splatting综述文章首先回顾了3D Gaussian的原理和应用借着全面比较了3D GS在静态
深度学习：人脸识别系统 Tensorflow 人脸检测 Python语言 facenet人脸识别算法毕业设计（源码）✅

博主介绍全网粉丝10W 前互联网大厂软件研发集结硕博英豪成立工作室专注于计算机相关专业毕业设计项目实战6年之久选择我们就是选择放心选择安心毕业感兴趣的可以先收藏起来点赞关注不迷路毕业设计 2023 2024年计算机毕业
自动驾驶离不开的仿真！Carla-Autoware联合仿真全栈教程

随着自动驾驶技术的不断发展研发技术人员开始面对一系列复杂挑战特别是在确保系统安全性处理复杂交通场景以及优化算法性能等方面这些挑战中尤其突出的是所谓的长尾问题即那些在实际道路测试中难以遇到的罕见或异常驾驶情况这些问题暴露了实车
Caffe 到 Tensorflow（Kaffe by Ethereon）：TypeError：不应直接创建描述符，而只能从其父级检索

我想使用 ethereon 的精彩包 caffe tensorflow 但遇到了中描述的相同问题这个已关闭的问题 https github com ethereon caffe tensorflow issues 10 当我运行该示例或尝试
由于 gcc 编译器版本不受支持，Caffe 编译失败

我挣扎着Caffe http caffe berkeleyvision org 汇编不幸的是我没能编译它 Steps http caffe berkeleyvision org installation html cmake compil
Caffe/pyCaffe：设置所有 GPU

是否可以为Caffe 尤其是pyCaffe 设置所有GPU 就像是 caffe train solver examples mnist lenet solver prototxt gpu all 这两个分支现在都支持多 GPU 一段时间了
caffe： **group** 参数是什么意思？

我已阅读有关的文档group param group g 默认 1 如果 g gt 1 我们将每个过滤器的连接限制为输入的子集具体地将输入和输出通道分为g组第i个输出组通道将仅与第i个输入组通道连接但首先我不明白它们的确切含义其次
如何设计深度卷积神经网络？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案据我了解所有 CNN 都非常相似它们都有一个卷积层后面是池化层和 relu 层有些具有专门的层例如 FlowNet 和 Segn
使用内置显卡，没有NVIDIA显卡，可以使用CUDA和Caffe库吗？

使用内置显卡没有 NVIDIA 显卡可以使用 CUDA 和 Caffe 库吗我的操作系统是 ubuntu 15 CPU为 Intel i5 4670 3 40GHz 4核内存为12 0GB 我想开始学习深度学习 CUDA 适用于 N
如何在 CAFFE 的新网络中重复使用同一网络两次

我有一个预训练的网络我们称之为N 我想在新网络中使用两次有人知道如何复制吗然后我想为每个副本分配不同的学习率例如 N1是第一个副本N N2是第二个副本N 新网络可能如下所示 N1 gt joint ip N2 gt layer 我知
查找带有 Anaconda cmake 前缀的 boost-python3

DLDR如何将 cmake 指向 boost python3 库 cmake 不会自动检测到它我正在尝试建立caffe https github com BVLC caffe对于 Python 3 6 使用提供的 cmake 我的系统规格
Caffe，在层中设置自定义权重

I have a network In one place I want to use concat As on this picture 不幸的是该网络无法训练为了理解为什么我想连续改变权重这意味着 FC4096 中的所有值一开始都
如何在 Caffe 的网络中出现多次损失？

如果我在网络中定义多个损失层从这些末端到网络的开头是否会发生多个反向传播我的意思是他们真的是这样工作的吗假设我有这样的事情 Layer1 Layer2 Layer n Layer cls1 bottom layer n top cl

随机推荐

SeetaFace C++环境搭建(详细图文)

SeetaFace C 环境搭建详细图文 SeetaFace开源库由FaceDetection FaceAlignment FaceIdentification三部分组成本文综合网上其他SeetaFace环境搭建的教程经实践后整理出一
vue新建一个项目

新建一个vue项目步骤 1 在workspace中新建一个文件夹Test 2 在VScode中点击文件将文件夹添加到工作区若要添加到现有的工作空间可以将文件夹直接拖入 3 右击文件夹点击在终端中打开 4 打开后输入vue init
密码学基础（一）——哈希算法

一常用密码学算法分类哈希算法哈希算法不可逆包括 MD4 MD5 hash1 ripeMD160 SHA256 SHA3 Keccak256 国家标准SM3 国家密码管理局加密解密算法加密解密算法可逆但是必须要有秘钥对称加密
获取单选框的值

Jq获取单选框的值 var type id input name type id checked val html和smarty tr style display none td class d label 是否关联减项项目 td td t
Opencv-C++笔记 (18) : 轮廓和凸包

文章目录一轮廓 findContours发现轮廓 drawContours绘制轮廓代码二几何及特性概括凸包 Convex Hull 凸包概念凸包扫描算法介绍 Graham扫描算法相关API介绍程序示例轮廓集合及特性性概括
关于单片机PDR和POR应用注意事项

关于单片机PDR和POR应用注意事项在单片机相关项目的开发中很少有同行会关注到POR和PDR的问题本人也是经过相关项目的一步步填坑才发现PDR和POR很容易被忽视一旦出现问题也是比较致命的为此我将展开阐述并将我开发中遇到的相关问题分
CSS内部样式、外部样式

文章目录为什么需要CSS样式表一样式表的基本语法二常用的样式属性 1 文本属性 2 背景属性 3 行内嵌入样式表 4 外部样式表文件为什么需要CSS样式表 HTML标签的外观样式比较单一颜色只有黑白字体类型和大小无变化
深度学习-目标检测

应用背景在AI视觉领域许多高精度测量场景需要搭配传统视觉算法才会有更好的使用效果例如本项目测量被检目标的长度需要两个步骤框选识别被检目标对被检目标进行分析测量程序功能本程序功能通过深度学习算法框选出被检目标后可获取
echarts 文本标签配置 label文字样式

字体基本样式设置 fontStyle fontWeight fontSize fontFamily 文字颜色 color 文字描边 textBorderColor textBorderWidth 文字阴影 textShadowColor t
Mac的idea启动项目贼慢，但其它小伙伴启动却很快

前言最近开发一直觉自己的mac本idea启动项目贼慢很影响工作效率然而同事的mac本启动同一项目却贼快而且我的电脑性能比他的高这就很尴尬然后我尝试了多个方法终于解决了这个问题解决办法如下找到系统偏好设置打开后找到共
打印螺旋矩阵（C语言）

本博文主要给大家介绍的是正方形的螺旋矩阵因为这个螺旋矩阵是最简单的我之后再把其他类型的螺旋矩阵写成博客和大家一起交流百度对螺旋矩阵的定义如下螺旋矩阵是指一个呈螺旋状的矩阵它的数字由第一行开始到右边不断变大向下变大向左变大向上
2018年度区块链十大安全事件

2019年1月3日是一个特别的日子全球的区块链从业者都在以比特币十年的特殊仪式纪念比特币创世区块诞生十周年十年风雨不由人十年踪迹十年心如果说过去七年这是条少有人走的路的话过去三年尤其是刚刚过去的2018年这条路街景开始变
for循环嵌套

写if语句的时候 if else等是可以重叠的也可以在大的if语句里套一个小的if语句实际上for循环也是可以嵌套的例1 写一个脚本输出三行每行有5个 for i 1 5 fprintf end fprintf n 第一行的5个输
微信小程序-模板消息全面解析加实例

一模板消息是什么模板消息是微信为小程序提供的消息推送能力小程序可以向用户发送重要的消息通知类似于App的推送通知二限制相对于App的推送通知模板消息有很多限制这是因为微信放置开发者滥用推送能力骚扰用户限制1 固定格式模
【满分】【华为OD机试真题2023 JS】机器人活动区域

华为OD机试真题 2023年度机试题库全覆盖刷题指南点这里机器人活动区域知识点深搜广搜时间限制 1s 空间限制 256MB 限定语言不限题目描述现有一个机器人可放置于 M N的网格中任意位置每个网格包含一个非负整数编号当
【Node.js】定时任务cron：

文章目录一文档 Nodejs 插件二安装与使用 1 安装 2 使用三 cron表达式秒数分钟小时日期月份星期年份可为空四案例一文档说明文档 https www npmjs com package cron
Allegro学习笔记---3.页面设置

1 参数设置板层颜色设置
YYF login功能

Controller package com chinasofti fwgl ctrl import java util HashMap import java util List import org springframework be
sql怎么把查询的几个结果求和_sql多表查询-从1到很多怎么玩

大纲表的加法表的联结联结应用案例 case表达式一表的加法加法 union 不保留重复行 select 课程号课程名称 from course union select 课程号课程名称 from course1 保留重复行
基于深度学习的图像检索 image retrieval based on deep learning （code ，代码）

本次代码分享主要是用的caffe框架至于caffe框架的安装过程不再说明代码修改自 cross weights 的一篇2016年的文章但是名字忘记了谁记得提醒我下一环境要求 1 python 2 gcc 3 opencv 4

基于深度学习的图像检索 image retrieval based on deep learning （code ，代码）

基于深度学习的图像检索 image retrieval based on deep learning （code ，代码） 的相关文章

随机推荐

热门标签

基于深度学习的图像检索 image retrieval based on deep learning （code ，代码）的相关文章