机器视觉、目标检测常见应用场景

2023-11-04

机器视觉、目标检测常见应用场景

  • 人脸人体检测
  1. 智能美肤

在保持皮肤质感的同时,自动对脸部进行匀肤、去瑕疵(痘、痘印、雀斑等)操作,并对全身皮肤进行美白。

  1. 智能瘦脸

系统自动检测并分析人脸五官特征,生成脸部五官调整瘦脸后的图像。

  1. 图像人脸融合

图像人脸融合功能,可以帮助用户在获得授权的前提下,将图像中的指定的某个人脸,融合进另一人的人脸特征。

  1. 人物动漫化

生成其二次元卡通形象,返回卡通化后的结果图像。支持日漫、3D、手绘、铅笔画等风格。

  1. 人像素描风格化

输入一张人物图像,自动裁剪其头部区域,生成大头照下的素描画效果。

  1. 人脸修复增强

可对人脸进行细节增强,优化人脸图像质量。

  1. 人脸美颜

可对图像中人脸进行美颜优化,支持磨皮、去黑眼圈、法令纹、美白等多种效果。

  1. 人脸美妆

可模拟现实彩妆效果,通过添加口红,高光,整妆等彩妆素材,进一步提升人脸美化效果。用户可选择不同的美妆类型,并搭配个性化美妆素材,完成妆容。

  1. 人脸滤镜

对图像进行统一修改风格,包括向日葵、垦丁、大理等效果,还可自由调整滤镜强度,对图像整体风格调整滤镜效果。

  1. 人脸美型

对人脸五官部位进行细致调节,调节内容为:大眼、瘦脸、瘦下巴、嘴型、瘦鼻等。

  1. 人脸信息脱敏

智能识别授权图像中的人脸范围,对图像中包含的人脸范围进行模糊,输出脱敏后的图像。

  1. 人脸检测与五官定位

快速识别出授权图像中人脸数量和区域,输出数量、矩行坐标、姿态、双瞳孔中心坐标、105关键点等信息,可支持多人场景的检测。

  1. 人脸属性识别

检测授权图像中信息,输出人脸数量,概率、性别、年龄、表情(中性/微笑)、是否戴眼镜、是否佩戴口罩等多种属性,实现高性能的属性识别。

  1. 人脸属性识别

检测授权图像中信息,输出人脸数量,概率、性别、年龄、表情(中性/微笑)、是否戴眼镜、是否佩戴口罩等多种属性,实现高性能的属性识别。

  1. 表情识别

识别授权图像中的人物的表情。包括中性,高兴,惊讶,伤心,生气,厌恶,害怕等多种表情。

  1. 人脸比对1:1

基于已授权的两张图像,分别挑选两张图像中的最大人脸进行比较,判断是否为同一人。同时返回这两个人脸的矩形框坐标、比对的置信度,以及不同误识率的置信度阈值。

  1. 人脸搜索1:N

输入单张人脸图像,与人脸库中人脸图片进行对比,可应用于人脸打卡、人脸搜索等场景。

  1. 公众人物识别

检测授权图像中是否存在公众人物,支持多人检测。

  1. 明星识别

检测授权图像中是否存在知名人物,支持多人检测。

  1. 人脸活体检测

检测已授权图像中的活体对象是来自直接相机拍摄还是翻拍。需要确保待检测人脸五官清晰可见。

  1. 视频活体检测

检测输入视频中的活体对象是直接拍摄还是翻拍。当视频中出现多个人脸时,对画面中面积最大的人脸进行判断,需要确保待检测人脸五官清晰可见。

  1. 人脸核身App认证

基于活体检测、生物识别认证技术,结合权威数据源,快速对自然人真实身份进行校验。

  1. 人脸核身服务端

基于活体检测、生物识别认证技术,结合权威数据源,快速对自然人真实身份进行校验。

  1. 人体检测

检测图像中的人体,并输出图像中人体所在坐标,可同时识别图片中的复数人体。

  1. 人体结构化属性

检测图像中人体特征的属性,包括:性别,年龄,朝向,帽子,眼镜,包,衣服,颜色等信息。

  1. 线上监考

可对考生屏幕和考生状态进行检测,通过出现的人脸人体个数、人脸角度朝向、是否戴耳机,是否使用手机等判断是否有考试异常行为。

  1. 静态手势识别

静态手势识别可以识别图片中的手势动作,包含:确认、点赞、噤声、手掌等姿势。

  1. 行人区域进入检测

根据划定的区域检测视频监测周界或区域是否有人员入侵。

  1. 动作行为识别

判断输入授权图片的人体动作行为,当前可以识别的行为类别包括:举手、吃喝、吸烟、打电话、玩手机、趴桌睡觉、跌倒等动作。

  1. 人体姿势关键点

识别人体图像的关键点点检点信息,包括鼻子,眼睛,脖子,左肩,右肩等。

  1. 人体计数

识别图像中的人体数量,支持单人和多人识别。

二、文本检测识别OCR

  1. 增值税发票识别

识别增值税发票(电子发票和纸质发票)关键字段内容,包括:校验码、复核人、开票人、发票代码、收款人等。

  1. 增值税发票卷票识别

支持对卷票上包括价税合计、发票代码、发票号码、合计税额、合计金额、密码区、开票日期、税率、购买方识别号、销售方识别号等结构化识别。

  1. 定额发票识别

支持对定额发票上的发票号码、发票代码、发票金额进行结构化识别

  1. 外卖单识别

识别外卖单上的关键字段内容,输出商店名称、电话、包装费、配送费、商品合计、其他费用合计、顾客优惠合计、总件数、在线支付、订单编号、下单时间等,目前支持饿了么外卖单。

  1. 出租车发票识别

准确识别出租车发票在图像中的位置,支持出租车发票结构化识别,输出发票号码、代码、车号、日期、时间、金额,共6个关键字段信息。

  1. 火车票识别

支持火车票结构化识别,输出乘车时间、始发站、目的站、座位席别、乘车人姓名、车次号、票价、车厢及座次号,共8个关键字段信息。

  1. 营业执照识别

识别营业执照关键字段内容,包括:公司地址、营业范围、注册资本、注册日期、公司法人、公司名称、注册号、公司类型、公司营业期限日期,同时可输出营业执照上二维码、印章位置。

  1. 公章识别

识别图像中公章的位置,输出公章的机关、团体、企事业单位名称。

  1. 身份证识别

识别二代身份证关键字段内容,关键字段包括:姓名、性别、身份证号、出生日期、地址信息、有效起始时间、签发机关,同时可输出身份证区域位置和人脸位置信息。

  1. 银行卡识别

输入主流银行卡图像,输出3个信息,包括:发卡行、银行卡号、有效日期。

  1. 二维码识别

识别图像中是否含有二维码信息,输出图像中二维码包含的文本信息(每个二维码对应的url或文本),可支持图像中含有多个二维码识别。

  1. 名片识别

识别各类名片关键字段内容,关键字段包括:姓名、职位、公司、部门、座机号、手机号、地址、邮箱,共8个关键字段信息。

  1. 中国护照识别

识别中国护照关键字段内容,包括:中文姓名(带拼音)、护照号码、护照人身份ID、性别、英文姓名、出生日期、出生地(带拼音)、国籍、发证日期、结束日期、发证地址(带拼音)、MRZ码第一行、MRZ码第二行、护照类型。

  1. 户口页识别

支持户口本常住人口登记卡结构化识别,输出姓名、籍贯、性别、身份证号、出生地、出生日期、户主或户主关系、承办人签章、注册章位置、其他印章位置,共11个关键字段信息。

  1. 车牌识别

准确识别出图像中车牌位置,输出车牌位置坐标、车牌类型、车牌号码、车牌号码置信度、车牌置信度,共5个关键字段信息。

  1. 驾驶证识别

识别驾驶证首页和副页关键字段内容,包括:档案编号、姓名、有效期时长、性别、发证日期、驾驶证号、驾驶证准驾车型、有效期开始时间、地址,共9个关键字段信息。

  1. 行驶证识别

识别行驶证首页和副页关键字段内容,输出品牌型号、车辆类型、车牌号码、检验记录、核定载质量、核定载人数等21个关键字段信息

  1. 通用文字识别

识别图像中文字内容和文字区域坐标,适用于多场景图像文字识别。

  1. 视频文字识别

基于视频的通用文字识别,可以实现对输入视频的结构化处理,返回对应的文字内容、文字区域坐标及时间等信息。

  1. 门头照识别

识别已授权的门头招牌图像,包括:门头内容、logo、店铺地址、联系方式等信息。

  1. 文档结构化还原识别

对输入文档内容进行解析,输出结构化样式(html或者json)。

三、图片文字内容审核

  1. 文字暴恐内容识别

结合行为、内容,采用多维度、多模型、多检测手段,识别文本中的敏感信息,规避敏感人物姓名、敏感事件描述、敏感言论等内容风险。

  1. 文字垃圾内容识别

结合行为、内容,采用多维度、多模型、多检测手段,识别文本中的敏感信息,规避敏感人物姓名、敏感事件描述、敏感言论等内容风险。

  1. 文字广告内容识别

结合行为、内容,采用多维度、多模型、多检测手段,识别文本中的敏感信息,规避敏感人物姓名、敏感事件描述、敏感言论等内容风险。

  1. 文字敏感内容识别

结合行为、内容,采用多维度、多模型、多检测手段,识别文本中的敏感信息,规避敏感人物姓名、敏感事件描述、敏感言论等内容风险。

  1. 文字辱骂内容识别

结合行为、内容,采用多维度、多模型、多检测手段,识别文本中的敏感信息,规避敏感人物姓名、敏感事件描述、敏感言论等内容风险。

  1. 文字鉴黄内容识别

结合行为、内容,采用多维度、多模型、多检测手段,识别文本中的敏感信息,规避敏感人物姓名、敏感事件描述、敏感言论等内容风险。

  1. 文字灌水内容识别

结合行为、内容,采用多维度、多模型、多检测手段,识别文本中的敏感信息,规避敏感人物姓名、敏感事件描述、敏感言论等内容风险。

  1. 文字违禁内容识别

结合行为、内容,采用多维度、多模型、多检测手段,识别文本中的敏感信息,规避敏感人物姓名、敏感事件描述、敏感言论等内容风险。

  1. 图片智能鉴黄

结合行为、内容,采用多维度、多模型、多检测手段,识别图片中的敏感信息,规避图片中存在敏感人物照片、敏感事件等内容风险。

  1. 图片敏感内容识别

结合行为、内容,采用多维度、多模型、多检测手段,识别图片中的敏感信息,规避图片中存在敏感人物照片、敏感事件等内容风险。

  1. 图片logo识别

结合行为、内容,采用多维度、多模型、多检测手段,识别图片中的敏感信息,规避图片中存在敏感人物照片、敏感事件等内容风险。

  1. 图片风险人物识别

结合行为、内容,采用多维度、多模型、多检测手段,识别图片中的敏感信息,规避图片中存在敏感人物照片、敏感事件等内容风险。

  1. 图片垃圾广告识别

结合行为、内容,采用多维度、多模型、多检测手段,识别图片中的敏感信息,规避图片中存在敏感人物照片、敏感事件等内容风险。

  1. 图片不良场景识别

结合行为、内容,采用多维度、多模型、多检测手段,识别图片中的敏感信息,规避图片中存在敏感人物照片、敏感事件等内容风险。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

机器视觉、目标检测常见应用场景 的相关文章

随机推荐

  • 详细介绍Glib 主事件循环轻度分析与编程应用

    1 glib 事件循环概述 glib 是一个跨平台 用 C 语言编写的若干底层库的集合 编写案例最好能够结合 glib 源码 方便随时查看相关函数定义 glib 实现了完整的事件循环分发机制 有一个主循环负责处理各种事件 事件通过事件源描述
  • Linux 系统安全如何设定 log 日志记录服务器

    在网上越来越多的黑客的出现 越来越多的高手出现的情况下 如何才能确保自己可以保存一份完整的 log 呢 稍微有点概念的黑客都知道 进入系统后的第一见事情就是去清理 log 而发现入侵的最简单最直接的方法就是去看系统纪录文件 现在我们来说说如
  • 虚拟机防火墙

    查看防火墙和开通端口 查看防火状态 systemctl status firewalld service iptables status 暂时关闭防火墙 systemctl stop firewalld service iptables s
  • Ubuntu进入root用户模式

    root 用户给予你完全控制系统的能力 它可以做任何事以及使用系统的一切东西 它可以在你的 Linux 系统上访问任何文件和运行任何命令 因此 它应该被谨慎地使用 所以Ubuntu默认锁定root用户 当我们想进行一些特殊任务时需要用到ro
  • Kotlin Flow 冷流和热流

    本文主要分析了冷流 和 热流 的相关实现原理 原理逻辑长而复杂 特别是涉及热流 SharedFlow 相关实现原理时 逻辑更是抽象 理解比较困难 本文比较长 建议根据目录选择分段阅读 可以先看基础概念和冷流 再分别看热流 SharedFlo
  • 区块链学习笔记(四)——Proof of Work

    区块链学习笔记 四 Proof of Work 前言 一 PoW是什么 二 要点 1 比特币的构成 2 PoW的优缺点 三 为什么是乌托邦式的共识 前言 我们常说的共享机制有Pow PoS DPoS 而区块链采用的是谁获胜谁获奖的原则 即工
  • 遥感+python 1.5 重投影

    遥感 python 1 5 重投影 目录 遥感 python 1 5 重投影 一 重投影概念 二 代码实现 2 1 读取影像 2 2 输出影像 2 3 坐标转换 本章节 笔者主要讲述重投影的概念 原理 即代码实现 一 重投影概念 当考虑两幅
  • selector xmlns:android=“http://schemas.android.com/apk/res/android

  • Windows10 下安装mmdetection 问题之“cannot import name ‘deform_conv_cuda‘”

    最近在使用mmdetection工具箱 官方只给出Linux系统下的安装方法 自己尝试在Windows10下的安装 其中遇到过一些问题 在此记录下来 希望给小伙伴一些帮助 安装环境 VS2015 CUDA 9 0 Pytorch 1 1 t
  • centos系统ACFS-9459: ADVM/ACFS is not supported

    centos6 3系统发现acfs和advm无法使用 ASMCA图形界面的acfs和volume选项卡为灰色 这是由于acfs不支持centos系统导致的 Last login Thu Dec 14 09 33 10 2017 from 1
  • cuda Sample 功能分析(1-st 记) 0_Introduction 之 asyncAPI

    源码链接 https github com NVIDIA cuda samples blob v11 8 Samples 0 Introduction asyncAPI asyncAPI cu 首先 这个sample不是演示async co
  • C++:rand()函数和srand()函数解读

    1 srand unsigned int t 这个是设定种子 因为电脑取随机数是伪随机 只要种子一样 则取出来的数一定一样 这里用time 0 这个内函数 copy则是返回了当前的时间值 这个值是按照时间而变化的 所以 srand unsi
  • java中实现多态的机制是什么_java多态机制是什么

    java多态机制是什么 java中实现多态的机制是依靠父类或接口的引用指向子类 从而实现了一个对象多种形态的特性 其中父类的引用是在程序运行时动态的指向具体的实例 调用该引用的方法时 不是根据引用变量的类型中定义的方法来运行 而是根据具体的
  • 专治疑难系列 - 解决Ubuntu忘记root密码问题

    博客主页 Passerby Wang的博客 CSDN博客 系统运维 云计算 Linux基础领域博主 所属专栏 专治疑难系列 上期文章 专治疑难系列 解决win11中xbox开机自启问题 如觉得博主文章写的不错或对你有所帮助的话 还望大家多多
  • python多线程获取百度搜索(5.26更新)

    1 网站 输入搜索内容 获取搜索结果 进行保存 把内容整理后保存到mysql数据库 保存字段 关键字 标题 真实网址 简介 原网站名称 2 爬取结果 3 编写爬虫 爬虫使用scrapy框架编写 分布式 多线程 编写Items class B
  • Win10做系统,你自己就可以完成,不要再让别人帮你做系统啦(保姆级教学,手把手带你一步一步走!!!)你不会还不会做系统吧??快来看一看呀~

    我在这里把win10系统网址给大家放在这里啦 下载 Windows 10 microsoft com 然后下载下来之后 大家准备一个16G以上的空U盘 然后打开我们下载的这个文件 然后大家选择对应的U盘就可以啦 我的电脑是DELL 所以我就
  • 对于web代码基础了解

    快捷方式 1 基本骨架 shift 2 备注 ctrl 基本代码 1 段落标签 p p 2 换行标签 3 水平线标签 hr 4 加粗 strong strong 5 倾斜 em em 和 i i 6 容器 独占一行 div div 7 容器
  • Functions___CH_12

    12 1 Function Pointers Pointers to functions The syntax for creating a non const function pointer is one of the ugliest
  • 历时6个月, 非CS专业的我, 终于在毕业前拿到了谷歌软件工程师offer!

    本文作者 Isabel 本科就读于上海财经 研究生就读于CMU information management相关专业 在来Offer的帮助下成功 转码 入职谷歌 就在离毕业还有一个多月的时候 我收到了来自谷歌的offer 至此 心中的一块大
  • 机器视觉、目标检测常见应用场景

    机器视觉 目标检测常见应用场景 人脸人体检测 智能美肤 在保持皮肤质感的同时 自动对脸部进行匀肤 去瑕疵 痘 痘印 雀斑等 操作 并对全身皮肤进行美白 智能瘦脸 系统自动检测并分析人脸五官特征 生成脸部五官调整瘦脸后的图像 图像人脸融合 图