程明明：面向弱监督的图像理解

2023-05-16

点击上方“深度学习大讲堂”可订阅哦！

编者按：

若言琴上有琴声，放在匣中何不鸣？

若言声在指头上，何不于君指上听？

苏轼的《琴诗》暗示了全局认知对于场景理解的重要性。而在图像理解领域，相较于基于精细标注数据的全监督学习，弱监督学习本质上是一种试图从全局出发来理解场景的方式，也更接近于人类对世界的认知机制。本文中，来自南开大学的程明明副教授，将从局部认知拓展至全局认知，为大家介绍面向弱监督的图像理解。大讲堂特别在文末提供文章以及代码的下载链接。

我报告的主题是“面向弱监督的图像理解”，并对我们组的相关工作进行总结和介绍。

本次报告中介绍的所有工作代码都是开源的，大家可以扫描图中二维码获取我们主页进行下载。

理解图像信息是计算机视觉的重要部分，我们希望计算机能够像人的眼睛一样看见并理解图像中的内容。

现在计算机视觉领域的大多数问题还是依赖于特定的数据集进行训练和测试评估的。

而Data annotation（数据标注）的成本是极其高昂的。比如，对于PASCAL VOC数据集，需要十余工人来标注27374个bounding box（标注框），而对于ImageNet甚至需要25000名人员对上千万张数据进行标注。MIT的Antonio Torralba曾经在CVML会议上讲过一个非常有意思的故事，他的退休的母亲帮他做了20余万分割目标的精细标注，他开玩笑说希望有更多的父母参与到这份工作中来。

如图，是ADE20K数据集的一张图片，针对分割任务标注起来是非常困难的。一方面高质量的图像标注为我们进行图像理解提供了方便，另一方面，获取这样的标注是非常困难和耗时的。而回顾我们从小识物的过程，父母都是指着不同物体告诉我们每一个物体是什么，而不用精确地描绘物体的轮廓。这种从物体层面的认识区别于现有多数算法对像素精度标注的依赖。

这里我们对近期的工作做了一些梳理。在low level vision层面，我们做了一些基于attention mechanism（注意力机制）的工作，以及边缘检测和区域分割工作来对图像进行预处理和category-independent的图像分析，注意力机制可以帮助我们准确快速地定位图像的区域，而不需要进行人工分割。

在light weighted semantic parsing方面，我们一方面将介绍语义分割，另一方面介绍它和interaction的结合。

最后，为大家介绍它们在图像及视觉领域的应用，比如进行editing（编辑）、Synthesis（合成）、web images（网络图片）方面的工作。

Low Level Vision

视觉注意力机制在图像认知中起到了非常重要的作用。对于机器而言，传统方法采用滑动窗口机制来检测图像中的每一个位置可能是什么样的物体，而人类观察图像并不是基于滑动窗口的机制对上百万个图像窗口进行搜索和检测，往往是借助很强的注意力来定位可能的物体区域，只是判断少量潜在物体区域的具体类别信息，这能够帮助我们进行快速有效地识别，并摆脱对大数据的依赖。

注意力机制有几个重要的分支：其一为fixation prediction，旨在预测出图像中的注视点，这个注视点有可能是bottom-up与任务无关的，还有可能是top-down与当前任务相关的；其二为salient object detection（显著性物体检测）；其三为objectness proposals，它是基于窗口的度量方法，通过预测图像中的每个窗口有多大可能性含有物体，有助于后期做物体检测。

首先介绍我们基于全局对比的显著性区域检测工作。我们通过对图像预分割，根据图像区域和其他所有区域的对比度来计算显著性物体的区域。我们将在后面介绍如何用它来进行弱监督的学习。

在公开数据集上的测试结果显示我们的方法相对于传统方法有较大的提升。

刚才的工作无论是选择特征还是特征组合都是基于人手工的方法来做的。我们提出了基于学习的方式进行显著性物体检测，对每个区域提取特征，基于机器学习的方式自动选择特征的组合，这样能得到更好的分割结果。这个工作也取得了非深度学习方法中最好的结果。

如果大家对我们的这方面工作感兴趣，可以看这篇Benchmark综述文章，我们基于40多个主流的数据集进行了实验比较。

除了对特征的组合进行学习，我们去年CVPR上有一个工作通过深度方法对特征本身也进行学习，来得到显著性物体的区域。通过把不同层次的深度特征结合起来，通过一些short connections（短连接）的形式，能得到非常好的显著性物体检测结果，

我们采用多层次的信息融合方式，如上图中间所示，它是一种深度神经网络架构。对于我们的方法，越高层的卷积运算，可以得到更加大尺度的信息。我们把不同尺度信息通过short-connection层连接起来，同时通过side output做指导，能够得到更好的显著性物体检测的结果。

近几年，显著性物体检测取得了很大的进步。在很多公开数据集上，显著性物体检测的结果已接近实用，比如在MSRA-B和ECSSD数据集上precision和recall都已达到了90%以上的结果，同时missing error都已下降到零点零几的水平。由此启发我们是否能将它用于弱监督学习中去，从显著性物体检测的结果来学习知识。

物体是由闭合轮廓围成的区域并有其重心，我们在2014年的一个工作中据此设计了一种根据图像梯度估计图像中区域可能含有物体的可能性的方法。

在PASCAL VOC2007数据集上进行测试，我们的方法和传统的方法效果基本接近，但是我们的方法速度要快出1000倍。

除了注意力机制，边缘检测也是对弱监督学习非常有帮助的。

这是我们近期发表在CVPR2017的边缘检测方面的工作。我们发现在不同的卷积层都有不同的有用信息，与其从池化层的前一层中拿出来做整合，不如提出所有卷积层的信息充分利用。

传统上我们在几次卷积运算之后再做池化，中间层的特征只利用池化前的最后一层。我们新的工作把不同层的信息叠加起来，通过concat的方式来得到更加丰富的特征表达，通过这样的特征表达来训练边缘检测的结果。

这样的方法也达到了非常好的效果。比如在pascal voc数据集上，我们的方法是国际上首个能够实时运算，并且结果的F measure值已经超过当时在伯克利segmentation dataset上的人类平均的标注质量的方法。

此外，在low level vision里面，还有分割问题。通过对图像分组得到很多区域，期望每一个region里面只含有一个物体类别，作为比较强的约束信息可以帮助我们更好地理解图像内容。

这里边一个例子就是，我们曾经用显著性物体检测的结果帮助我们initialize图像的区域，然后通过iteratively run GrabCut的方法分割出图像中的重要物体区域。这些分割信息加上keyword 信息本身可以帮助我们生成一些高质量的pixel-accurcy label（像素层面的图像标签），来更好地做语义分割。

除了做语义分割之外，我们直接用图像处理的方式（比如显著性物体检测、分割等）进行处理，我们对Internet image做object segmentation和显著性物体检测，借助一些关键字在分割里面做retrievel，得到这些retreival信息后，top ranking里面的retrieval results信息很多都是我们需要的物体类别，通过物体类别自动获取的example 包括它的分割信息去学习一些apperance model学习一些更加重要的知识，通过这些知识来更新我们对显著性物体的理解。

还有一个分割的工作是对图像做over segmentation，就是把图像分成很多块，我们希望每个块都不要跨越多个物体，因为同一个块通常只属于其中一个物体，哪怕区域里面有一些噪声，通过平均抑制噪声让分割信息更好，之前常用的over segmentation方法是efficient graph based image segmentation，其缺点是比较慢，因此我们在ECCV2016提出了一种基于GPU的方法对图像预处理而得到superpixel（超像素），然后对超像素提取特征并通过SVM（支持向量机）去学习一些特征组合，再对特征组合进行融合来得到非常好的结果。

在伯克利的数据集上我们的方法取得了非常好的结果，速度上每秒能处理几十上百张图像，F measure值也不错，可以作为low-level领域的一个很好的工具去更好地约束弱监督学习的方式。

Light Weighted Semantic Parsing

之前介绍的low level vision领域的注意力机制、边缘检测、图像分割相关工作结果都和图像的object category（物体类别）无关，因此这些信息就可以直接地运用到图像中去，帮助我们约束一个问题。比如图像里只含有一个物体，训练集里哪怕没有语义分割信息只有关键字信息，也会帮助我们去做语义分割。

这里介绍我们的一个工作（STC:A Simple to Complex Framework for Weakly-supervised Semantic Segmentation）。通过显著性物体检测的结果，自动地生成语义分割的标签。通过low-level vision得到的约束能够帮助我们在弱监督的语义分割的学习中，减少对人工标注的依赖。

上一个工作是通过bottom-up的方式进行分割，发表在CVPR2017的另外一个工作使用一种top-dowm的方式。比如针对一个分类任务，可以通过attention network找到哪个区域属于哪类别，通过迭代使用top-down的注意力机制，更好地实现语义分割。

从实验结果可以得知，虽然只有keyword的监督信息，语义分割的结果通过top-down attention机制也能得到很好的改进。

除了语义分割之外，通过light weighted semantic parsing，我们还可以支持一些interaction的工作。

在interaction方面特别是在graphics方面，很多情况下我们关注一些应用问题，比如做image manipulation，图像编辑。对于这样的问题，graphics领域的大公司比如photoshop、迪士尼会更加关注。对于mage level detection（图像层面的物体检测）问题，人与机器之间存在一定的鸿沟，图像在计算机中是以像素为单位存储的，而人是从物体、场景层次等关系来理解的。基于这种机理，我们只能选择一些像素来进行处理，一方面这些像素选择时候可能会出现错误，另一方面这种方式不符合人的直观理解，人脑是从high-level的角度来思考。我们试图借助计算机视觉的一些工具对图像的内容进行理解，使得图像编辑更加符合人的直观感受。

这是在SIGGRAPH2010年的一个工作，对于一张图像，通过简单交互找到图像中的不同物体，同时通过相似对象的分析把物体的遮挡部分补全，并分析图像中物体层次的关系，这里不同于视觉中的图像深度，我们关心的只是物体大小位置等相对关系。即使有这些简单的关系，我们也可以做图像编辑的简单应用。

class="video_iframe" frameborder="0" allowfullscreen="" scrolling="no" data-vidtype="-1" data-ratio="1.3529411764705883" data-w="368" data-src="http://v.qq.com/iframe/player.html?vid=o0527v4x3au&width=670&height=502.5&auto=0" style="display: block; width: 670px !important; height: 502.5px !important;" width="670" height="502.5" data-vh="502.5" data-vw="670" src="http://v.qq.com/iframe/player.html?vid=o0527v4x3au&width=670&height=502.5&auto=0"> &amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;nbsp;

class="video_iframe" frameborder="0" allowfullscreen="" scrolling="no" data-vidtype="-1" data-ratio="1.7647058823529411" data-w="480" data-src="http://v.qq.com/iframe/player.html?vid=m0527ctewgy&width=670&height=376.875&auto=0" style="display: block; width: 670px !important; height: 376.875px !important;" width="670" height="376.875" data-vh="376.875" data-vw="670" src="http://v.qq.com/iframe/player.html?vid=m0527ctewgy&width=670&height=376.875&auto=0"> &amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;nbsp;

另外一个工作是我们把interaction（交互）扩展到三维空间，通过输入的RGB和depth（深度）图像重构出三维场景，在重构的过程中也可以做一些用户的交互。

Graphics/Vision Applications

下面介绍一下我们light weighted semantic parsing的工作在图形学和视觉领域的应用，首先是在图像编辑中的应用。

其中一个将语义解析的结果用于图形学应用的事例是，通过对图像的理解做一些交互任务。

其中一个是基于语音的交互。通过一些移动设备拍摄照片，这些照片其实只是二维矩阵，须对其进行处理才能更好地利用图像，我们试图采用交互的方式提高这类方法的鲁棒性，但是这些设备没有外接鼠标键盘，传统的交互方式在此并不能被很好地用起来，因此我们试图寻找方法更好地利用这些图像信息。

比如一个非常简单的图像编辑的操作，用户语音指令为“把图像中间靠下方的木桌子变得低一点”。这个任务离不开对图像里面每一个像素语义的理解，把用户指令中的动词自动转化为图像编辑的一些操作，名词和形容词对应物体检测中的属性分析，通过物体检测和属性分析，来实现并服务于图像编辑应用。这个问题是image caption（从图像生成语言）的反问题。

另外给大家介绍把light weighted semantic parsing的结果用于图像合成（synthesis）的工作。

这是我们之前做的一个sketch2photo图像合成工作，用户输入类似于左上角的图像（包含很多keywords），每个keyword就可以对应很多的Internet image，然后可以把物体区域自动分割出来，并通过轮廓比对获取目标区域，然后据此就可以自动生成目标图像。再加之一些图形学里的合成处理，使得生成的图像符合用户输入的轮廓信息。

除了对单个图像的编辑和合成，我们还可以对海量的web images进行分析。

在web images里面，国际上很多研究者用我们的工作开展了object discovery，图像的彩色化（把黑白图像变成彩色），图像分类及语义分割等工作。

今天主要对我们组的工作做了survey性质的介绍，上图是我们在南开的团队。这是我们组的一些低年级的同学们近来发表的学术成果。希望有更多的合作也欢迎硕士生的加入！

文中引用文章的下载链接为：

http://pan.baidu.com/s/1gfALAIR

文中提到的语义分割工作详见：

见微知著：语义分割中的弱监督学习

致谢：

本文主编袁基睿，诚挚感谢志愿者杨茹茵对本文进行了细致的整理工作

该文章属于“深度学习大讲堂”原创，如需要转载，请联系 astaryst。

作者信息：

作者简介：

程明明，南开大学副教授，博导，国家“万人计划”青年拔尖人才、中科协青年人才托举工程、南开大学百名青年学科带头人计划入选者。2012年博士毕业于清华大学，之后在英国牛津从事计算机视觉研究，并于2014年加入南开大学。其主要研究方向包括：计算机图形学、计算机视觉、图像处理等。已在IEEE PAMI等CCF-A类国际会议及期刊发表论文20余篇。相关研究成果受到国内外同行的广泛认可，论文他引5000余次，最高单篇他引1700余次。其研究工作曾被英国《BBC》，《每日电讯报》，德国《明镜周刊》，美国《赫芬顿邮报》等权威国际媒体撰文报道。

VALSE是视觉与学习青年学者研讨会的缩写，该研讨会致力于为计算机视觉、图像处理、模式识别与机器学习研究领域内的中国青年学者提供一个深层次学术交流的舞台。2017年4月底，VALSE2017在厦门圆满落幕，近期大讲堂将连续推出VALSE2017特刊。VALSE公众号为：VALSE，欢迎关注。

往期精彩回顾

俞扬：“审时度势”的高效强化学习

揭秘CVPR2017 WebVision图片分类竞赛冠军背后的技术

山世光：AI产业需要赋能平台

曹汛：计算摄像学研究 | VALSE2017之十六

见微知著：语义分割中的弱监督学习

欢迎关注我们！

深度学习大讲堂是由中科视拓运营的高质量原创内容平台，邀请学术界、工业界一线专家撰稿，致力于推送人工智能与深度学习最新技术、产品和活动信息！

中科视拓（SeetaTech）将秉持“开源开放共发展”的合作思路，为企业客户提供人脸识别、计算机视觉与机器学习领域“企业研究院式”的技术、人才和知识服务，帮助企业在人工智能时代获得可自主迭代和自我学习的人工智能研发和创新能力。

中科视拓目前正在招聘：人脸识别算法研究员，深度学习算法工程师，GPU研发工程师， C++研发工程师，Python研发工程师，嵌入式视觉研发工程师，运营经理。有兴趣可以发邮件至：hr@seetatech.com，想了解更多可以访问，www.seetatech.com

中科视拓

深度学习大讲堂

点击阅读原文打开中科视拓官方网站

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

程明明：面向弱监督的图像理解的相关文章

阿里云服务器的使用

阿里云服务器的使用外网ip 39 108 98 xxx xff08 linux xff09 ubuntu16 04 root root密码 putty ssh工具 xshell ssh scp 登录到阿里云服务器上 xff08 ubunt
项目如何介绍

谈谈XXX项目分析 xff1a 考官通过看你的简历或者你的介绍来了解你所做的项目 xff0c 那么考官肯定想更详细的了解您的项目 xff0c 看是不是与你的简历写的项目经验一致也就是考核你是否具有真实的项目经验一般来说 xff0c 在
K8S的flannel组件容器网络分析

kubernetes的网络通信可以分为一下几个部分 xff1a pod内部的容器间通信pod间通信pod与service之间网络通信kubernetes外部与service之间的网络通信理论 xff1a 1 pod内部的容器间通信 kub
数据结构（Data Structure）——1、栈（Stack）

栈的介绍栈 xff08 stack xff09 在计算机科学中是限定仅在表尾进行插入或删除操作的线形表栈是一种数据结构 xff0c 是只能在某一端插入和删除的特殊线性表它按照先进后出的原则存储数据 xff0c 先进入的数据被压入栈底
进程间通信之消息队列

首先说一下什么是消息队列消息队列是进程间通信的一种 xff0c 它是由操作系统维护的以字节序列为基本单位的间接通信机制 xff0c 它提供了一个进程向另一个进程发送一个带类型的数据块的方法我们知道用管道来实现进程间通信的机制是两个进程利
STM32 编码器模式详解

0 编码器模式 stm32的定时器带的也有编码器模式所用的编码器是有ABZ三相 xff0c 其中ab相是用来计数 xff0c z相输出零点信号 AB相根据旋转的方向不同 xff0c 输出的波形如下图所示 xff1a 从图上可以看出来 xf
LAN8720A网络模块关于时钟的使用问题

微雪的LAN8720A驱动电路 xff1a 正点原子LAN8720A驱动电路 xff1a 1 nINTSEL Configuration 从原理图中可以看出正点原子的LAN8720A模块所使用的晶振是25M 而微雪的LAN8720A模块使用
机器学习和深度学习大纲

机器学习 https blog csdn net qq 45056216 article details 104303569 深度学习 https blog csdn net weixin 42237113 article details
VIM 助记符

https www bilibili com video BV114411J7Z8 from 61 search amp seid 61 9900190950002805677 一工作模式 vim其实三种模式 xff0c 一般模式 xff
STLINK下载程序（附STLINK驱动包）

一 ST Link V2的JTAG SWD接口定义及产品图实物图 STLINK指定标准接口 xff1a 二 STLINK驱动安装 xff1a 双击ST LinkUpgrade安装即可安装成功之后 xff0c 设备管理器三打开工程文件
STM32 之 HAL库

1 STM32的三种开发方式通常新手在入门STM32的时候 xff0c 首先都要先选择一种要用的开发方式 xff0c 不同的开发方式会导致你编程的架构是完全不一样的一般大多数都会选用标准库和HAL库 xff0c 而极少部分人会通过直接配
迷你版的ARDUINO MEGA2560

1 传统的MEGA2560板 xff1a 2 迷你的MEGA2560 特点 xff1a 嵌入版Mega 2560 CH340G ATmega2560 兼容 Mega 2560主板基于Atmel ATmega2560微控制器和USB UAR
MATLAB撸了一个2D LiDAR SLAM

0 引言刚刚入门学了近一个月的SLAM xff0c 但对理论推导一知半解 xff0c 因此在matlab上捣鼓了个简单的2D LiDAR SLAM的demo来体会体会SLAM的完整流程 1 数据来源 xff1a 德意志博物馆Deutsch
基于粒子滤波的定位算法 ——原理、理解与仿真

1 算法原理 1 1 机器人定位问题关于机器人定位 xff0c 有三大问题 xff0c 它们分别是 xff1a 1 全局定位 xff1a 指初始位置未知 xff0c 机器人靠自身运动确定自己在地图中的位姿 2 位姿跟踪 xff1a 指已知
从图片中提取曲线坐标数据--基于MATLAB

转载 https zhuanlan zhihu com p 52112012 0 引言在读文献的时 xff0c 经常遇到这样的情况 xff1a 文章里提出的方法好有趣啊 xff0c 好想拿文中用的数据来试试看看能不能得到相近的结果 xff
49天精通Java，第8天，JDK 和 JRE 、final 与 static 、堆和栈

作者简介哪吒 CSDN2022博客之星Top1 CSDN2021博客之星Top2 多届新星计划导师博客专家专注Java硬核干货分享立志做到Java赛道全网Top N 本文收录于 Java基础教程系列目前已经700 订阅 CSDN最
Python 之 Serial串口通信

0 Serial方法 1 导入pyserial模块 import serial 2 打开串行口打开串口0 xff0c 9600 xff0c 8N1 xff0c 连接超时0 5秒 import serial ser 61 serial Se
PYTHON字符串转数字，数字转字符串；数字转bytes，bytes转数字；字符串转bytes，bytes转字符串。数字表达字符串

字符串str转数字 float str int str 数字num转字符串 str num a 61 39 1234 39 print 39 a 61 39 a print type a b 61 int a print 39 b 61 3
杂记 | Linux中修改docker默认访问端口（2375）

2375端口是docker的默认访问端口 xff0c 使用该端口可实现远程访问和操作docker xff0c 但在服务器上直接开启该端口有安全风险 xff08 笔者本人今天就应该端口导致服务器被入侵 xff09 xff0c 可以修改该默认端
RVIZ中的fixed frame选项以及“For frame [XX]: Fixed Frame [map] does not exist”

RVIZ 使用的时候如果fixed frame选项设置不正确 xff0c 那么就会无法显示显示相应的数据信息 xff0c 并提示一下错误 xff1a For frame XX Fixed Frame map does not exist 官

随机推荐

C++常见面试题总结

本文主要总结了一些常见的C 43 43 面试题链接现在不让发 xff0c 所以如果需要整理好的文档的话 xff0c 请关注本篇文章底部的推广订阅公众号获取 xff1a Cpp编程小茶馆进入正题 xff0c 下面是自己整理的文档目录截图
ROS系统安装Kinetic（零基础教程）

文章目录一引言二安装过程2 1 配置软件库2 2 添加ROS软件源2 3 添加密钥2 4 安装ROS2 4 初始化rosdep2 5 设置环境变量2 5 构建工厂依赖三测试过程3 1 启动ROS Master3 2 启动小海龟仿真
《C++ Primer》一书极不适合我国“国情”

客气地说 xff0c C 43 43 Primer 不适合大学C 43 43 基础课堂教学 xff0c 也不适合初学者入门不客气地说 xff0c 恐怕你们的大学老师也搞不定 C 43 43 Primer xff0c 更别说拿这本书教学生了
肝了两宿才收集的17个超炫酷的 CSS 动画加载与进度条特效，绝对值得收藏！！！

文章目录一圆形加载动画二上下跳动的圆球加载动画三 3D立体加载动画四饼图加载动画五多色圆点波动效果的加载动画六制作顺时针放大的圆圈加载动画七制作小圆圈轮流放大的加载动画八制作竖条加载动画九制作水波扩散效果加载动画十制作逆
C 语言学习笔记(三)：C 语言开发环境搭建

文章目录一 Windows二 Linux2 1 VMware Workstation Pro软件简介及安装2 2 安装 Ubuntu 系统2 2 1 Ubuntu 下载2 2 2 安装 Ubuntu2 2 3 安装共享文件夹 2 3 概念
windows和虚拟机ROS串口通信

windows和虚拟机ROS串口通信 ROS串口通信步骤1 windows下安装VSPD xff08 虚拟串口工具 xff09 2 VMWare虚拟机添加串口3 Windows下串口通信测试工具设置4 ROS通信代码5 运行结果最近在学习
jsonp原理详解——终于搞清楚jsonp是啥了

一 JSONP的由来 1 Ajax直接请求普通文件存在跨域无权限访问的问题 xff0c 不管是静态页面动态页面 web服务 xff0c 只要是跨域请求 xff0c 一律不准 2 不过我们发现 xff0c web页面调用js文件则不受跨域的
无人机分类

无人机分类方式一按飞行平台构型分类无人机可分为固定翼无人机多旋翼无人机无人飞艇伞翼无人机扑翼无人机等固定翼无人机固定翼 xff0c 顾名思义 xff0c 就是机翼固定不变 xff0c 靠流过机翼的风提供升力跟我们平时坐的
python网络编程smtp协议发送电子邮件

SMTP协议 SMTP 的全称是 Simple Mail Transfer Protocol xff0c 即简单邮件传输协议它是一组用于从源地址到目的地址传输邮件的规范 xff0c 通过它来控制邮件的中转方式 SMTP 协议属于 TCP
实时通讯技术Ajax，WebSocket，SSE

实时通讯技术是一项基于web开发的重要技术 xff0c 网站是需要前后端通讯的 xff0c 因此数据刷新的时间就是获取信息的时间 xff0c 为了能准确而有快速的获取信息需要尽可能的提高信息的刷新效率常见的实时通讯技术 xff1a 通讯方
当前主流的后端语言，谁能夺得桂冠，果然是后生可畏！

主流后端语言如今编程语言遍地开花 xff0c 烟花迷乱 xff0c 小编整理了最流行的几种编程语言如下 xff1a 这几种语言都是经久不衰 xff0c 占领着后端编程界的半壁江山 TIOBE上的语言排名 xff1a C Java pyth
CVPR2020 | 中科院VIPL实验室录取论文详解

编者按 xff1a 近日 xff0c 计算机视觉顶会 CVPR 2020 接收论文结果揭晓 xff0c 从 6656 篇有效投稿中录取了 1470 篇论文 xff0c 录取率约为 22 中科院VIPL实验室共七篇论文录取 xff0c 内容涉
迁移学习：他山之石，可以攻玉【VALSE Webinar】Panel实录

编者按 xff1a 迁移学习是机器学习与计算机视觉中的重要研究问题之一 xff0c 旨在研究如何将一个领域的知识迁移到另外的领域 xff0c 具有重要的研究意义与应用价值但迁移学习又会存在哪些局限性 xff1f 在实际应用中的价值是什么
「见微知著」(2) - 细粒度视觉检索特辑【VALSE Webinar】Panel实录

编者按 xff1a 细粒度图像识别和检索的差异有哪些呢 xff1f 细粒度视觉有哪些重要实际应用及重要场景呢 xff1f 未来细粒度图像分析领域又会如何发展呢 xff1f 为此 xff0c VALSE Webinar 2020 20期邀请了
VALSE 2020线上大会学生论坛【VALSE Student Seminar】Panel实录

首届VALSE Student Seminar于2020年7月31日在VALSE 2020线上大会拉开帷幕 xff0c Student Seminar邀请了6名年轻的研究生 xff1a 张士峰中国科学院自动化研究所董胤蓬清华大学刘宇
见微知著：语义分割中的弱监督学习

点击上方深度学习大讲堂可订阅哦 xff01
曹汛：计算摄像学研究 | VALSE2017之十六

点击上方深度学习大讲堂可订阅哦 xff01
Spring常用注解（绝对经典）

x1f3c6 作者简介 xff1a 哪吒 xff0c CSDN2022博客之星Top1 CSDN2021博客之星Top2 多届新星计划导师博客专家 x1f4aa xff0c 专注Java硬核干货分享 xff0c 立志做到Java赛道全网T
c++排序方式

选择排序第一个数和后面n 1个数比 xff0c 找出最小的数 xff0c 替换第一个数后面依此类推 include lt bits stdc 43 43 h gt using namespace std const int N 61 1
程明明：面向弱监督的图像理解

点击上方深度学习大讲堂可订阅哦 xff01

程明明：面向弱监督的图像理解

程明明：面向弱监督的图像理解 的相关文章

随机推荐

热门标签

程明明：面向弱监督的图像理解的相关文章