【重制ver】LesaNet论文简析(CVPR2019)——医学影像

2023-11-08

Holistic and Comprehensive Annotation of Clinically Significant Findings on Diverse CT Images: Learning from Radiology Reports and Label Ontology论文简析
在这里插入图片描述

0 Links

1 Authors and Team

这是一篇被CVPR2019收录的论文。主要作者Ke Yan,之前有一篇论文是关于迄今世界最大的CT医学影像数据集DeepLesion的,因此这篇论文的数据集也使用了Deeplesion。来自NIH,全称美国国立卫生研究院,是美国最高水平的医学与行为学研究机构。Yifan Peng,也来自NIH,主要研究方向是医学方面的自然语言处理。对这篇论文的贡献在于对于病变标签的筛选。

2 Introduction

2.1 Purpose

  • 协助诊断决策
  • 找到相似病变
  • 生成结构化报告
  • 收集病变数据集
  • 学习如何自动“阅片”

2.2 Motivation

在这里插入图片描述
放射科医生的日常工作之一就是阅片然后找出重要病变并在放射性医学报告中描述它们。这篇文章旨在设计一个深度学习算法,它能够根据给定的病变图像,预测出一套全面的相关标签,同时,这些标签也包含从报告中提取的重要信息,如病变部位、类型和属性。

2.3 Challenge: Image and Labels

在这里插入图片描述
训练这样一个算法需要一个大规模且多样的病变图像标注数据集,论文选用了DeepLesion数据集,但是DeepLesion数据集并没有为每个病变提供详细的语义标签,手动标注又显得繁琐、昂贵、可扩展性不强,所以,论文提出了一种自动数据挖掘方法,这种方法能够在报告中找到涉及病变的带有指向标注的超链接的句子(带有BOOKMARK的句子,如下图),然后从句子中提取标签

3 Network

总体的框架如下:
在这里插入图片描述
一共包括三个分支Ontology这个分支定义了标签和它们间的关系Text这个分支利用Text-mining模块从报告中挖掘和过滤标签Image这个分支提出了一个病变标注网络——LesaNet,结合Text分支的标签信息,以及Ontology分支的标签关系,最终能得到每个病变的置信度

3.1 Ontology branch

如下图,是Ontology的其中一个子图:
在这里插入图片描述
其中,红色代表病变的类型(Type)标签、蓝色代表病变的身体部位(Body Part)标签、绿色代表病变属性(Attribute)标签。单箭头表示标签的层次关系(即包含关系),双箭头表示标签的互斥关系

3.2 Text branch

在这里插入图片描述
构建了病变本体(ontology)之后,作者从Deeplesion数据集的相关放射学报告中提取了标签。方法是首先使用NLTK(Natural Language Toolkit)标记带有BOOKMARK的句子并对其进行词性化以获得其基本形式,然后,将预处理句子中的标签与病变本体(ontology)中提到的匹配,并根据它们的同义词将他们标准化为标签。之后这些被提取的标签会经过一个NLP模型过滤掉不相关的标签,最后利用标签扩展策略再扩展得到标签。
所提到的NLP模型如下:
在这里插入图片描述
这个模型最后会输出与标签和BOOKMARK之间的关系类型(不相关、不确定和相关)相对应的概率向量。注:如果一个标签描述了感兴趣的书签,就称之为“相关的”;如果它描述了其他书签,则称之为“不相关的”;如果它是在一个假设语句中,则称之为“不确定的”。

2.3 Image branch

这个分支主要是提出了一个Lesion Annotation Network(LesaNet),在每个病变周围裁剪一个120mm²的patch作为输入输出分数矢量s∈ RC,其中C标签数
其网络结构如下:
在这里插入图片描述

2.3.1 Relation hard example mining(RHEM)

接下来讲讲RHEM,困难标签关系挖掘,用于挖掘报告中没有提到的子标签。RHEM使用的是标签间的互斥关系找到可靠的负标签。
在这里插入图片描述
比如,如果Left Lung是正标签,那么Liver、Kidney cyst等等是负标签,因为它们是互斥的。这里还受到online hard example mining (OHEM) 的启发,计算了具有标记c的病变i的困难度(difficulty):
在这里插入图片描述
对于困难标签采用多采样的方式以便挖掘困难标签的关系。

2.3.2 Score Propagation Layer(SPL)

最后介绍SPL,分数传播层,简单的全连接层,使用线性变换矩阵W定义了预测分数,它用一个单位矩阵初始化,用来学习标签间的一阶相关性。
如下图是其中一个学习变换矩阵W:
在这里插入图片描述
SPL有助于增强正相关标签的得分、并抑制负相关标签与清楚分离的标签的得分。

4 Loss Function

总损失共有4个部分组成,分别是网络输出预测分数的平均交叉熵损失调整之后的平均交叉熵损失RHEM的交叉熵损失以及三态损失
在这里插入图片描述

4.1 Weighted CE Loss

由于大多标签正例较少,因此对每个标签采用加权交叉熵损失(Weighted Cross-Entropy Loss):
在这里插入图片描述

4.2 Multilabel Triplet Loss

在这里插入图片描述
三态损失能使得具有相似标签对的病变在embedding空间中离得更近。即类内差距减小,类间差距增大。

5 Experiments

5.1 Dataset

从DeepLesion中及其相关报告中,共收集了 19,213个带有句子的病变作为训练集,1,852个作为验证集,1,759个作为测试集。每个患者仅被分到其中一个子集里。因为并非所有病变在报告中都有书签,所以提取的总数小于DeepLesion中的数量。
因为在报告中带有书签的句子可能并没有包含病变得所有信息,所以仅靠句子时,测试集中可能缺少标注。因此,两名放射科医生进一步手动标注了测试集中的500个随机的病变。将原始测试集称为"文本挖掘测试集",因为标签是从报告中提取的,第二个手工标注的测试集也用于评估LesaNet。

5.2 Evaluation Metric

评价标准:AUC,即ROC曲线下方的面积,是CAD任务中常用的指标。但是,AUC是基于等级的度量标准,并不涉及标签决策,因此无法评估多标签情况下最终预测标签集的质量。因此,作者还计算了每个标签的精度(prediction),召回率(recall),和F1分数(F1 score),这些分数经常在多标签图像分类任务中使用,每个指标在权重相等的标签上取平均(每个类别平均),没有采用总体平均,因为它偏向于信息较少的频繁标签(如胸部、腹部等)。为了将置信度分数化为标签决策,作者为验证集上产生最佳F1分数的每个标签进行了阈值的校准,然后将其应用于测试集。

5.3 Lesion Annotation Results

实验结果如下:
在这里插入图片描述
加权近似成对排名损失(Weighed Approximate Ranking Pairwise Loss,WARP)是一种广泛使用的多标签损失,旨在使正标签的排名大于负标签的排名。作者将该损失应用于多尺度多标签CNN,并定义如果细粒度标签全部为正的话,则排名应高于粗略的标签。在DeepLesion上病灶嵌入(Lesion Embedding)基于身体的粗略部位、病灶大小和位置进行了训练。这四种方法中,LesaNet在两个测试集中获得了最佳的AUC和F1分数
消融实验中发现,去除SPL会使每个类的平均召回率降低3%,频繁出现的标签(ntr>1000)的召回率下降0.4%,这表明SPL对稀有标签的召回率很重要,但代价是很小的精度损失
与SPL相反,RHEM对于提高精度至关重要,这可能是因为它以略微降低的召回率为代价抑制了可靠的较难阴性标签的得分
没有标签扩展策略,训练集将丢失40%(父)标签,从而导致准确性不高。
不使用文本挖掘模块时,由于不相关的训练标签会带来噪音,因此总体准确性会下降。但是,性能并未显着降低,这表明模型能够在一定程度上宽限有噪声的标签。
另外,三重态损失也对**分类精度有轻微的贡献。**从三重态损失中获悉的256维向量可用于从数据库中检索出类似的病灶(给定一个查询)。在下图中,**LesaNet不仅可以正确预测查询病变的标签,而且可以使用相同的标签检索病变,尽管它们的外观并不相同。**检索到的病变和报告可以为预测的标签提供证据,并帮助用户理解查询病变。
在这里插入图片描述

5.4 Accuracies of some typical labels

如下图,是文本挖掘测试集上某些典型标签的准确性
在这里插入图片描述
身体部位、类型和属性的平均AUC分别是0.9656、0.9044和0.8384。身体部位通常更规则,因此更容易预测;而有些标签(如椎旁,结节)的视觉特征是可变的,因此较难学习。属性具有较低地AUC,一方面是因为某些属性是主观、微妙的。此外,放射科医生通常不会在报告中描述病变的每个属性,因此测试集中缺少标注。

5.5 Sample prediction

在这里插入图片描述
上图是预测的示例,由图可知,LesaNet可以准确预测出许多病变的标签。如在图(a)和(b)中,确定了两个细粒度的身体部位(右肺门和气管前淋巴结);在图©和(d)中,是毛玻璃样征和肺空洞;在图(g)和(h)中,是血管瘤和肝转移;LesaNet还可以正确预测一些属性。如图(e)中的钙化,图(h)中的小叶,图(i)中的微小。在某些相似的身体部位和类型上可能会发生错误。如,在图©中,尽管“左下肺叶”的分数很高,但由于两个身体部位很近,因此也可以预测为“左上肺叶”;在图(g)中,"转移"被预测错了,因为在某些情况下可能难以与血管瘤区分开来。一些罕见的and/or的可变标签没有被很好地学习,如图(b)中的“聚合”和“坏死”。

5.6 Training and testing LesaNet on different subsets of labels

在这里插入图片描述
其中,子集1由训练集中出现次数超过1000次的标签组成(ntr > 1000),子集2由ntr>500的标签组成。在对子集2进行训练后,可以对子集1和2测试,以查看子集1的准确性是否下降了。

6 Conclusions and future work

  • 通过从放射性报告中获取标签实现全面的病变标注
  • 利用标签本体来推断缺失的标签
    • 标签扩展策略
    • 困难标签关系挖掘(RHEM)
  • 未来的工作
    • 收集更多的稀有标签和困难标签数据
    • 试图吸收更多的先验知识
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【重制ver】LesaNet论文简析(CVPR2019)——医学影像 的相关文章

  • 初识运营,明晰运营的学习路径

    关于运营的思考 问题1 运营是什么 运营到底是做什么工作的 如题 到底什么是运营 为什么我们所接触到的很多运营都不太一样 有的运营就是每天追寻互联网热点 加班加点的写文案 有的运营每天就是在不同的群里和成千上万的人唠嗑 有的运营活跃在不同的
  • html获取text输入框中的值

    1 在head中引用jquery 2 定义一个text输入框
  • 指针用作函数参数、指针型函数和函数指针

    指针用作函数参数 以前我们学过的函数参数要么是基本数据类型的变量 要么是类的对象 又或者是数组名 前几讲学到的指针同样可以用作函数参数 指针作函数形参时 我们调用此函数将实参值传递给形参后 实参和形参指针变量将指向相同的内存地址 那么在被调

随机推荐

  • Linux主要命令功能

    1 dmesg 主要用来显示内核信息 使用dmesg可以有效诊断机器硬件故障或者添加硬件出现的问题 另外使用dmesg可以确定你的服务器安装了那些硬件 每次系统重启 系统都会检查所有硬件并将信息记录下来 执行 bin dmesg命令可以查看
  • 第十届蓝桥杯真题-灵能传输

    题目 OJ https www lanqiao cn problems 196 learning 考点 前缀和 贪心 思路 题目意思就是希望通过灵能交换后使得不稳定度最小 假设对a i 进行灵能传输 可以发现前缀和s i 1 和s i 进行
  • Java值传递和引用传递详细说明(详细分析)

    1 形参与实参 我们先来重温一组语法 形参 方法被调用时需要传递进来的参数 如 func int a 中的a 它只有在func被调用期间a才有意义 也就是会被分配内存空间 在方法func执行完成后 a就会被销毁释放空间 也就是不存在了 实参
  • FormData同时传输多个文件和其他数据

    近日有个需求是 在web的对话框中 用户可以输入文本内容和上传附件 附件的数量不限 所有附件总和大小不超过20M 这个实现的方法不止一种 比如之前的后端同事是要求 文件和文本分开传输 文件用一个单独接口上次 上传成功后返回一个id 把这个i
  • 【论文翻译】Iterative Geometry Encoding Volume for Stereo Matching and Multi-View Stereo(CVPR 2023)

    一 论文简述 1 第一作者 Gangwei Xu 2 发表年份 2023 3 发表期刊 CVPR 4 关键词 立体匹配 MVS 几何编码体 GRU 3D卷积 5 探索动机 RAFT的全对相关体缺乏非局部几何知识 难以处理病态区域的局部模糊
  • perp系列之五:perp安装

    perp系列之五 perp安装 版本说明 版本 作者 日期 备注 0 1 ZY 2019 5 29 初稿 目录 文章目录 perp系列之五 perp安装 版本说明 目录 概要 描述 激活 升级 例子 概要 vi conf mk make m
  • Vmware虚拟机设置静态IP地址

    一 安装好虚拟后在菜单栏选择编辑 虚拟网络编辑器 打开虚拟网络编辑器对话框 选择Vmnet8 Net网络连接方式 随意设置子网IP 点击NAT设置页面 查看子网掩码和网关 后面修改静态IP会用到 二 检查宿主机VM8 网卡设置 打开网络和共
  • 欧科云链OKLink:2023年6月安全事件盘点

    一 基本信息 2023年6月REKT和RugPull事件约造成约1000万美元损失 相比上月有显著下降 但安全事件发生数量依旧不减 其中被废弃的Atlantis Loans遭受治理攻击 造成的损失超250万美元 对该协议有过授权的用户需及时
  • Faster R-CNN详解

    Faster R CNN代码实现详解参见 faster rcnn源码详解 樱花的浪漫的博客 CSDN博客 faster rcnn源码 Faster rcnn详细注释版源码地址 faster rcnn源码详细注释版 每一步均有详细批注 深度学
  • 目标检测 实践

    文章目录 0 数据标注via 一 添加图片 二 定义标记类型 Attributes 三 标注 四 导出标注文件 1 模型 1 1 数据准备 1 2 模型训练 1 3 模型使用 1 4 改进方向 0 数据标注via via工具的界面如下图所示
  • python3中多项式创建_利用 Python3 ,实现数学科学计算

    SymPy是符号数学的Python库 旨在用一套强大的符号计算体系完成诸如多项式求值 求极限 解方程 求积分 微分方程 级数展开 矩阵运算等等计算问题 虽然Matlab的类似科学计算能力也很强大 但是Python以其语法简单 易上手 异常丰
  • JDBC和数据库连接池

    JDBC 基本介绍 JDBC原理 模拟JDBC public class MysqlJdbcImp implements JdbcInterface Override public Object getConnection System o
  • 解决element ui select下拉框不回显数据问题

    最近在做一个项目 项目的后端是地址 https github com wangyuanjun008 wyj springboot security git 前端地址是 https github com wangyuanjun008 wyj
  • 用通俗易懂的方式讲解:lightGBM 算法及案例(Python 代码)

    文章目录 1 介绍lightGBM之前 1 1 lightGBM演进过程 1 2 AdaBoost算法 1 3 GBDT算法以及优缺点 1 4 启发 2 什么是 lightGBM 3 lightGBM 原理 3 1 基于Histogram
  • 开源中文大语言模型集合【2023-06-19】

    整理开源的中文大语言模型 以规模较小 可私有化部署 训练成本较低的模型为主 包括底座模型 垂直领域微调及应用 数据集与教程等 自ChatGPT为代表的大语言模型 Large Language Model LLM 出现以后 由于其惊人的类通用
  • Java利用Mybatis进行数据权限控制

    权限控制主要分为两块 认证 Authentication 与授权 Authorization 认证之后确认了身份正确 业务系统就会进行授权 现在业界比较流行的模型就是RBAC Role Based Access Control RBAC包含
  • 经典加法器Verilog实现

    简介 加法器是数字系统最基础的计算单元 用来产生两个数的和 加法器是以二进制做运算 负数是用二进制的补码来表示计算的 减法器也是加法器 8bite并行加法器 并行加法器就是利用多个全加器实现两个操作数各位同时相加 并行加法器中全加器的个数与
  • 数据分析师的必备能力—样本数据异常值识别的4种经典方法

    对于从事数据分析岗位的小伙伴 日常工作中可能会接触到很多类型的维度数据 而在开展任务的具体实践过程中 需要我们只有具备较好的数据分析能力 才能根据实际业务需求得到有价值的分析结果 在包括业务熟悉 数据理解 逻辑思维等能力的范围内 掌握数据分
  • 利用递归函数输出斐波拉契数列前n个数之和——C语言

    include
  • 【重制ver】LesaNet论文简析(CVPR2019)——医学影像

    Holistic and Comprehensive Annotation of Clinically Signi cant Findings on Diverse CT Images Learning from Radiology Rep