机器视觉、目标检测常见应用场景

2023-11-04

机器视觉、目标检测常见应用场景

人脸人体检测

智能美肤

在保持皮肤质感的同时，自动对脸部进行匀肤、去瑕疵(痘、痘印、雀斑等)操作，并对全身皮肤进行美白。

智能瘦脸

系统自动检测并分析人脸五官特征，生成脸部五官调整瘦脸后的图像。

图像人脸融合

图像人脸融合功能，可以帮助用户在获得授权的前提下，将图像中的指定的某个人脸，融合进另一人的人脸特征。

人物动漫化

生成其二次元卡通形象，返回卡通化后的结果图像。支持日漫、3D、手绘、铅笔画等风格。

人像素描风格化

输入一张人物图像，自动裁剪其头部区域，生成大头照下的素描画效果。

人脸修复增强

可对人脸进行细节增强，优化人脸图像质量。

人脸美颜

可对图像中人脸进行美颜优化，支持磨皮、去黑眼圈、法令纹、美白等多种效果。

人脸美妆

可模拟现实彩妆效果，通过添加口红，高光，整妆等彩妆素材，进一步提升人脸美化效果。用户可选择不同的美妆类型，并搭配个性化美妆素材，完成妆容。

人脸滤镜

对图像进行统一修改风格，包括向日葵、垦丁、大理等效果，还可自由调整滤镜强度，对图像整体风格调整滤镜效果。

人脸美型

对人脸五官部位进行细致调节，调节内容为：大眼、瘦脸、瘦下巴、嘴型、瘦鼻等。

人脸信息脱敏

智能识别授权图像中的人脸范围，对图像中包含的人脸范围进行模糊，输出脱敏后的图像。

人脸检测与五官定位

快速识别出授权图像中人脸数量和区域，输出数量、矩行坐标、姿态、双瞳孔中心坐标、105关键点等信息，可支持多人场景的检测。

人脸属性识别

检测授权图像中信息，输出人脸数量，概率、性别、年龄、表情（中性/微笑）、是否戴眼镜、是否佩戴口罩等多种属性，实现高性能的属性识别。

人脸属性识别

检测授权图像中信息，输出人脸数量，概率、性别、年龄、表情（中性/微笑）、是否戴眼镜、是否佩戴口罩等多种属性，实现高性能的属性识别。

表情识别

识别授权图像中的人物的表情。包括中性，高兴，惊讶，伤心，生气，厌恶，害怕等多种表情。

人脸比对1:1

基于已授权的两张图像，分别挑选两张图像中的最大人脸进行比较，判断是否为同一人。同时返回这两个人脸的矩形框坐标、比对的置信度，以及不同误识率的置信度阈值。

人脸搜索1:N

输入单张人脸图像，与人脸库中人脸图片进行对比，可应用于人脸打卡、人脸搜索等场景。

公众人物识别

检测授权图像中是否存在公众人物，支持多人检测。

明星识别

检测授权图像中是否存在知名人物，支持多人检测。

人脸活体检测

检测已授权图像中的活体对象是来自直接相机拍摄还是翻拍。需要确保待检测人脸五官清晰可见。

视频活体检测

检测输入视频中的活体对象是直接拍摄还是翻拍。当视频中出现多个人脸时，对画面中面积最大的人脸进行判断，需要确保待检测人脸五官清晰可见。

人脸核身App认证

基于活体检测、生物识别认证技术，结合权威数据源，快速对自然人真实身份进行校验。

人脸核身服务端

基于活体检测、生物识别认证技术，结合权威数据源，快速对自然人真实身份进行校验。

人体检测

检测图像中的人体，并输出图像中人体所在坐标，可同时识别图片中的复数人体。

人体结构化属性

检测图像中人体特征的属性，包括：性别，年龄，朝向，帽子，眼镜，包，衣服，颜色等信息。

线上监考

可对考生屏幕和考生状态进行检测，通过出现的人脸人体个数、人脸角度朝向、是否戴耳机，是否使用手机等判断是否有考试异常行为。

静态手势识别

静态手势识别可以识别图片中的手势动作，包含：确认、点赞、噤声、手掌等姿势。

行人区域进入检测

根据划定的区域检测视频监测周界或区域是否有人员入侵。

动作行为识别

判断输入授权图片的人体动作行为，当前可以识别的行为类别包括：举手、吃喝、吸烟、打电话、玩手机、趴桌睡觉、跌倒等动作。

人体姿势关键点

识别人体图像的关键点点检点信息，包括鼻子，眼睛，脖子，左肩，右肩等。

人体计数

识别图像中的人体数量，支持单人和多人识别。

二、文本检测识别OCR

增值税发票识别

识别增值税发票（电子发票和纸质发票）关键字段内容，包括：校验码、复核人、开票人、发票代码、收款人等。

增值税发票卷票识别

支持对卷票上包括价税合计、发票代码、发票号码、合计税额、合计金额、密码区、开票日期、税率、购买方识别号、销售方识别号等结构化识别。

定额发票识别

支持对定额发票上的发票号码、发票代码、发票金额进行结构化识别

外卖单识别

识别外卖单上的关键字段内容，输出商店名称、电话、包装费、配送费、商品合计、其他费用合计、顾客优惠合计、总件数、在线支付、订单编号、下单时间等，目前支持饿了么外卖单。

出租车发票识别

准确识别出租车发票在图像中的位置，支持出租车发票结构化识别，输出发票号码、代码、车号、日期、时间、金额，共6个关键字段信息。

火车票识别

支持火车票结构化识别，输出乘车时间、始发站、目的站、座位席别、乘车人姓名、车次号、票价、车厢及座次号，共8个关键字段信息。

营业执照识别

识别营业执照关键字段内容，包括：公司地址、营业范围、注册资本、注册日期、公司法人、公司名称、注册号、公司类型、公司营业期限日期，同时可输出营业执照上二维码、印章位置。

公章识别

识别图像中公章的位置，输出公章的机关、团体、企事业单位名称。

身份证识别

识别二代身份证关键字段内容，关键字段包括：姓名、性别、身份证号、出生日期、地址信息、有效起始时间、签发机关，同时可输出身份证区域位置和人脸位置信息。

银行卡识别

输入主流银行卡图像，输出3个信息，包括：发卡行、银行卡号、有效日期。

二维码识别

识别图像中是否含有二维码信息，输出图像中二维码包含的文本信息（每个二维码对应的url或文本），可支持图像中含有多个二维码识别。

名片识别

识别各类名片关键字段内容，关键字段包括：姓名、职位、公司、部门、座机号、手机号、地址、邮箱，共8个关键字段信息。

中国护照识别

识别中国护照关键字段内容，包括：中文姓名（带拼音）、护照号码、护照人身份ID、性别、英文姓名、出生日期、出生地（带拼音）、国籍、发证日期、结束日期、发证地址（带拼音）、MRZ码第一行、MRZ码第二行、护照类型。

户口页识别

支持户口本常住人口登记卡结构化识别，输出姓名、籍贯、性别、身份证号、出生地、出生日期、户主或户主关系、承办人签章、注册章位置、其他印章位置，共11个关键字段信息。

车牌识别

准确识别出图像中车牌位置，输出车牌位置坐标、车牌类型、车牌号码、车牌号码置信度、车牌置信度，共5个关键字段信息。

驾驶证识别

识别驾驶证首页和副页关键字段内容，包括：档案编号、姓名、有效期时长、性别、发证日期、驾驶证号、驾驶证准驾车型、有效期开始时间、地址，共9个关键字段信息。

行驶证识别

识别行驶证首页和副页关键字段内容，输出品牌型号、车辆类型、车牌号码、检验记录、核定载质量、核定载人数等21个关键字段信息

通用文字识别

识别图像中文字内容和文字区域坐标，适用于多场景图像文字识别。

视频文字识别

基于视频的通用文字识别，可以实现对输入视频的结构化处理，返回对应的文字内容、文字区域坐标及时间等信息。

门头照识别

识别已授权的门头招牌图像，包括：门头内容、logo、店铺地址、联系方式等信息。

文档结构化还原识别

对输入文档内容进行解析，输出结构化样式（html或者json）。

三、图片文字内容审核

文字暴恐内容识别