Owl Eyes: Spotting UI Display Issues via Visual Understanding

2023-11-07

2020年ASE的一篇文章

ASE，全称 IEEE/ACM International Conference on Automated Software Engineering，是软件工程领域的顶级会议。

标题：通过视觉理解发现UI显示问题

研究问题：基于深度学习方法，进行UI图像bug的自动检测工作。UI图像bug主要有组件遮挡、文本重叠、图像缺失、空值、屏幕模糊5种。

研究思路：提出OwlEye，基于卷积神经网络(CNN)来识别有UI显示问题的截图，并利用梯度加权类激活映射（ Gradient-weighted Class Activation Mapping,Grad-CAM）来定位截图中有UI显示问题的区域，以指导开发人员修复该bug。

Grad-CAM可以对任意结构的CNN进行可视化，不需要修改网络结构或者重新训练。 Grad-CAM使用流入CNN的最后一个卷积层的梯度信息为每个神经元分配重要值，以进行特定的关注决策。尽管技术相当笼统，因为它可以用来解释深层网络任何层中的激活

主要创新：

1.提出了能够自动检测并定位bug的模型OwlEye；

2.人工构建了一个带有UI显示问题的GUI屏幕截图的大规模带标签的数据集，并开发了一种基于启发式的数据增强方法。

数据增强：开发了一种基于启发式的数据增强方法，用于从无bug的UI图像生成带有显示问题的UI截图。数据增加是基于Rico数据集，其中包含了超过66K的唯一的屏幕截图，从93k的Android应用程序，以及他们的附带JSON文件。对于输入的截图及其相关的JSON文件，算法首先定位所有的TextView和ImageView，然后根据扩展的类别随机选择一个TextView或ImageView。根据TextView/ImageView的坐标和大小，然后算法进行复制，并按照特定的规则调整其位置或大小，以生成具有相应UI显示问题的截图。具体来说，从Rico数据集中随机选择的10,000个应用程序中随机下载一个截图，每个截图将用于一次数据增强。为了使训练数据跨类别平衡，使用了10%的截图来增强组件遮挡类别，而使用30%的截图来增强其他三个类别的数据。对于增加的10,000个带有UI显示问题的屏幕截图，首先使用ORB特征提取算法提取它们的特征，随机排序，计算一个特定的截图与之前每个截图之间的余弦相似度，当相似度值高于0.8时，将其删除，最终剩余增强后的7800张图片。

优势：它可以应用于包括Android、iOS在内的任何平台，并且它以屏幕截图作为输入，这在现实世界的实践中很容易获得。

研究方法：

数据集：1.实验数据集是从最大的众测平台之一收集的，在这个平台上，众测工作者被要求在完成测试任务后提交测试报告。

562个Android手机，包含新闻、娱乐、媒体等方面的测试，共有10330张不同的屏幕截图。

2.数据增强后的数据集，7800个有UI显示问题的屏幕截图被保留下来并添加到实验数据集中。

实验方法：

评估指标：精度，召回率，F1

实验结果：

消融实验：

总结：与最佳基线相比，OwlEye的召回率和准确率提高了17%和50%以上。作为同类的第一个工作，还对真实世界的移动应用中的UI显示问题进行了系统的研究，并为后续研究提供了一个大规模的应用UI显示问题数据集。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Owl Eyes: Spotting UI Display Issues via Visual Understanding 的相关文章

WPF 数据绑定到复合类模式？

我是第一次尝试 WPF 并且正在努力解决如何将控件绑定到使用其他对象的组合构建的类例如如果我有一个由两个单独的类组成的类 Comp 为了清楚起见请注意省略的各种元素 class One int first int second cla
在 WPF 中使用 ReactiveUI 提供长时间运行命令反馈的正确方法

我有一个 C WPF NET 4 5 应用程序用户将用它来打开某些文件然后应用程序将经历很多动作读取文件通过许多插件和解析器传递它这些文件可能相当大 gt 100MB 因此这可能需要一段时间我想让用户了解 UI 中发生的情况
如何在C#背后的代码中动态创建数据模板并绑定TreeView分层数据

我有一个场景其中树视图动态更改其数据模板和数据绑定定义我在 XAML 中创建了一个树视图如下所示
如何从代码隐藏访问ListBox动态创建的项目的属性？

XAML
如何使 WPF 应用程序在 Web 浏览器上运行

我们有一个用 WPF 编写的现有应用程序我们正在寻找一种迁移它的方法以便它可以在 Web 浏览器上运行深入研究后我们似乎需要找到一种将代码编译为 WebAssembly 的方法但我不确定它对于现有的完全加载的 WPF 应用程序有多
WPF - 如何从 DataGridRow 获取单元格？

我有一个具有交替行背景颜色的数据绑定 DataGrid 我想根据单元格包含的数据对单元格进行不同的着色我已经尝试过该线程建议的解决方案 http wpf codeplex com Thread View aspx ThreadId 511
不支持将数据直接绑定到存储查询（DbSet、DbQuery、DbSqlQuery）

正在编码视觉工作室2012并使用实体模型作为我的数据层但是当页面尝试加载时上面提到的标题我使用 Linq 语句的下拉控件往往会引发未处理的异常下面是我的代码 using AdventureWorksEntities dw new
带动态元素的 WPF 启动屏幕。如何？

我是 WPF 新手我需要一些帮助我有一个加载缓慢的 WPF 应用程序因此我显示启动屏幕作为权宜之计但是我希望能够在每次运行时更改屏幕并在文本区域中显示不同的引言这是一个生产力应用程序所以我将使用非愚蠢但激励性的引言当然如
WPF/C# 将自定义对象列表数据绑定到列表框？

我在将自定义对象列表的数据绑定到ListBox in WPF 这是自定义对象 public class FileItem public string Name get set public string Path get set 这是列表
.NET / C# / WPF 项目的命名约定

NET C WPF 项目广泛接受的命名约定是什么 Microsoft 有一篇关于命名约定的内容广泛的 MSDN 文章here http msdn microsoft com en us library ms229002 aspx
如何以编程方式调用应用程序菜单？

我有自定义样式的非矩形透明窗口
复杂对象上的 GroupBy（例如 List）

Using GroupBy and Count gt 1我试图在列表中查找我的类的重复实例该类看起来像这样 public class SampleObject public string Id public IEnumerable
包含内容的 WPF 新窗口

我想在现有的主 Windwoe 旁边创建一个带有可滚动文本框的新窗口我在主窗口中按下打开新窗口按钮然后它应该打开一个带有可滚动文本框的新窗口 inside form2 在 WPF 中您可以在主窗口中拖放元素但不能在新窗口中执行此
WPF 创建同级窗口并关闭当前窗口

我需要的是我的窗口类中的这样一个事件处理程序 void someEventHandler object sender RoutedEventArgs e MyNewWindow mnw new MyNewWindow mnw Owner W
阻止 WPF 文本框增长

我花了两个小时研究如何避免在输入长文本时我的 WPF TextBox 控件变长但我无法做到这一点即使我读过一些关于它的答案如下所示停止 wpf textbox from grow with text https stackoverf
更改其他页面的主窗口内容

在 WPF 应用程序的主窗口中我有一个 Badged 元素来自材料设计这是我的代码
是什么原因导致 Linq 错误：此方法无法转换为存储表达式？

我有一堆具有相同 select 语句的 Linq to Entity 方法所以我想我会很聪明并将其分离到它自己的方法中以减少冗余但是当我尝试运行代码时我得到了以下内容错误该方法不能转化为商店表达式这是我创建的方法 public
元素属性语法和属性属性语法之间有语义差异吗？

我认为元素属性语法和属性属性语法在语义上没有太大区别但是我发现一定有什么不同例如下面的例子只是演示了一个简单的触发器
wpf，如何限制TextBox的MaxLength？
C# 抽象泛型方法

C net 3 5 我正在尝试创建一个具有通用方法的基类从它继承的类应该指定方法的类型这样做的前提是创建管理过滤的类所以我有 public abstract class FilterBase NEED Help Declaring t

随机推荐

电脑启机时出\windows\system32\drivers\bootsafe64.sys什么

开机时出现如下故障解决办法用老毛桃制作PE启动盘把C WINDOWS system32 drivers下bootsafe64 sys删除还有一个kavbootc sys删除重启即可此问题就出在金山的产品给系统加入的这个文件它不知出
注释转换(C的多行注释转换为C++的单行注释)

目录题目描述 AnnotationConvert h 状态划分 AnnotationConvert c 处理每个字符 main c 测试代码 Makefile 编译 test in 待测试数据 test out 输出题目描述把C的多行
2019年安徽省大数据与人工智能应用赛总结---本科组

前言 2019年安徽省大数据与人工智能决赛于10月13日在安徽省职业经济管理学院举办现场赛共计90支队伍经过4个小时的激烈追逐我们组获得了22名的不错成绩荣获省级二等奖严格意义上说这是我第一次参加省级比赛因为缺少比赛经验所以
mysql Initial client character set can be forced via the ‘characterEncoding‘ property.问题

是数据库版本不一致导致的问题 1查看本地是数据库版本删除旧包 2在配置文件pom xml文件中修改为对应的版本 3 更新为新的数据连接包参考https blog csdn net qq 37077976 article details
业务敏捷 SOA从概念到实践迈出的一大步

2007年5月30号在北京西四环的世纪金源大酒店宴会厅里一场关于中国SOA最佳实践的技术大会在这里举行从Gartner首度提出SOA这个概念到现在已经超过了十个年头在这十年发展的演变中 SOA的内涵发生了多次的变化从ESB Web
layui使用初步入门

目录布局元素字体图标按钮表单数据表格弹出层 layui官方地址 layui是模块化框架这表示你想实现它的某个功能可以选择不全部引入只要引入一个一个相关的模块文件即可引入的方式有两种一种是将之当成独立组件引入如另一种
面试准备1

上海银行目录 1 java io 字节流字符流使用场景你了解java的流吗怎么用流打开一个大文件 2 java序列化什么时候会用到必问 3 java集合类哪些是线程安全的为什么它们是线程安全的 4 String a a 创
leetcode 150-200题-java版（按顺序，不分专题）

leetcode 150 200题 java版 152 乘积最大子数组 160 相交链表 167 两数之和输入有序数组 168 Excel表列名称 169 多数元素 172 阶乘后的0 174 地下城游戏 188 买卖股票的最佳时机 4
在学校，你需要知道的8种思维导图的类型及其工作方式

思维导图是一种学习方法它可以将学习者的思维和抽象的思想以具体的视觉形象化具体来说思维导图可以帮助学习者有效地组织他们的想法和信息此外学习者可以更容易地将他们的信息碎片连接起来这可以提高他们的理解能力这可以提高他们的理解能力通
Springboot系列(二十二):如何纯文本转成.csv格式文件？

一前言不知道大家有咩有遇到这么个需求给你一长串文本要求你能导成excel格式展示数据一时间我陷入了沉思如果要常规转excel 最明显的一点就是固定表头名然而并不是这表头名是动态给的连字段名都不相同这可如何是好我突然想到
error @achrinza/node-ipc@9.2.2: The engine “node“ is incompatible with this module. Expected version

解决方法三看报错信息版本不兼容这个最好解决了输入这个命令该命令是自动补充兼容所报的错误 yarn config set ignore engines true 成功可以
gtest在使用中出现错误：error: undefined reference to ‘testing::internal::EqFailure(char const*, char const*,

如题业务需要编写了一个C的API库顺带写了一个gtest测试用例但是编译的时候出现题目中的错误折腾了半天以为是gtest的问题结果发现是自己CMakelist txt的问题因为Gtest支持的最低版本是Cxx 14版本所以只要
TCP/IP协议二十一：HTTPS/SSL协议详解（1）加密原理

TCP IP协议二十一 HTTPS SSL协议详解 1 加密原理 1 加密历史对称加密算法 1 1 加密 1 2 密钥 1 3 对称加密算法 2 非对称加密算法 2 1 RSA算法 2 1 1 RSA 非对称加密原理 2 1 2 RSA通
Rust 近乎宗教般信仰的案例

Rust 近乎宗教般信仰的案例亚历山大西多罗夫众所周知 Rust 社区对 Rust 非常热情有些人甚至责怪我们偶尔表现得像一个邪教恐怕我不会打消这个印象因为在这篇文章将证明 Rust 使您成为一个更好的工程师更好的管理者和更好
学习JavaScript必须知道的10个难点，你都知道吗？

立即执行函数立即执行函数即Immediately Invoked Function Expression IIFE 正如它的名字就是创建函数的同时立即执行它没有绑定任何事件也无需等待任何异步操作 function 代码 funct
Redmi4X刷入Ubuntu touch真正成为一台远程无需人操作的云服务器（就是配置垃圾）

前言前几天把高一买的手机相册和文件拷贝到了电脑上寻思这旧手机还能干嘛搜了一下有做监控的行车记录仪的最后决定还是做Linux服务器香啊用了一天时间参考网上的教程做完了自己再做一下总结和一些弯路记录因为是米粉所以不得不说小米牛逼
科研不是比赛，而是一种对未知和完美的自我追求——跟邢波（Eric Xing）面对面聊科研

编者按 6月26日 2014年国际机器学习大会 ICML 在北京国际会议中心完美落幕作为机器学习领域两大顶尖年会之一这是 ICML大会30多年来首次来到中国和远东在国内的机器学习界震动不小身为本次大会主席的卡耐基梅隆大学计算机系教授
MySQL为什么选择使用B+树作为索引的数据结构

看完到某大佬写的关于mysql索引的数据结构的文章文章写的非常详细在这里总结一下首先索引的特点是查询快排序那么首先就会想到树 1 二叉查找树 Binary Search Tree BST 二叉查找树是一种支持快速查找的数据结构
注册AppStore开发者账号以及收款设置的流程详解（2019最新版）

最近和朋友倒腾了一个APP 想在App Store上架因此就在注册个人开发者账号的过程中踩了不少坑申请App Store的开发者账号果然不是一件容易的事情并且我发现在设置收款时尤其容易踩坑期间我也看了不少分享但由于苹果对申请流程
Owl Eyes: Spotting UI Display Issues via Visual Understanding

2020年ASE的一篇文章 ASE 全称 IEEE ACM International Conference on Automated Software Engineering 是软件工程领域的顶级会议标题通过视觉理解发现UI显示问题

Owl Eyes: Spotting UI Display Issues via Visual Understanding

Owl Eyes: Spotting UI Display Issues via Visual Understanding 的相关文章

随机推荐

热门标签