新一代视频压缩编码标准-----H.264/AVC

2023-11-01

2.数字视频

2.1.2.数字电视PCM原理

将输入的模拟信号转化为输出的数字电视信号,经过取样,量化,编码三个步骤,由A/D变换器完成。

2.1.2.1.取样

在时间轴上将连续变化的模拟信号---》转化为离散量

2.1.2.2.量化

因取样后的脉冲信号在时间上是离散的,在幅值和空间上是连续的,可能取值有无限多个,因此需要进行四舍五入。将这种信号幅值从连续量变为离散量,这个过程为量化。

2.2.2.3.PCM编码

量化信号一般为“0”,“1”,这时编码为PCM编码。

模拟电信号经过–》取样–》量化–》编码后得到的二进制序列就是数字电视信号。一般序列化后的二进制位数越多,则量化的噪音越小,数字信号越靠近模拟信号。

2.2 数字电视信号

2.2.1.1 电视信号的时间取样:

运动图像由每秒若干帧静止图形构成,假设设定电视频率为每秒20帧,这种取样即为时间取样。

2.2.1.2 电视信号的空间取样:

同一个电视信号帧当中,同一行由若干取样点构成,这种取样点为像素,这种取样为空间取样。

2.2.2.2 YUV

实现视频压缩的一种方式:因人视觉对亮度和彩色更敏感,可通过把亮度信息从色彩中分离,使得有更高的清晰度,也可显著降低带宽实现视频压缩。

2.2.4.1 量化值qp的取值大小

一般情况,每个取样值采用8个比特表示,即256个灰度级。因为太大视频粗糙,太小视频质量好,但浪费带宽过大。

2.2.4.2 取样频率

对不同的屏幕类型,取样频率不同。

2.3 视频信号的预处理

一个基本的视频处理和通信包括采集、预处理、视频编码、通信、图像处理等。
在这里插入图片描述

2.3.1 色彩插值

一般一个像素点是只能给出从白到黑的单调色调,无法给出RGB三种。对于彩色图像的获取需要借助色彩滤镜阵列

2.3.2 色彩校正

通过色彩插值得到的图像和真实场景仍会有差异,需要对图像像素值进行线性变换尽可能减少差异。

2.3.3 伽玛校正

2.3.4 图像增强

包括直方图均衡,平滑滤波,中值滤波,锐化等。可在空间域

2.3.4.1 平滑滤波

1.图像平滑主要目的:消除图像采样系统的质量因素导致的噪声,并且保持图像的细节。
2.图像平滑包括 空域法和频域法。
   2.1 空域法中常用方法:均值滤波和中值滤波。
   2.2 频域法中常用方法:低通滤波法。

2.3.4.2 加权均值滤波

方法:取n x n 窗口,取窗口内的n²个像素的加权平均值取代中心像素原来的值。(相关可查询加权算法模板)在这里插入图片描述

2.3.4.3 中值滤波
原理:把以某点(X,Y)为中心的小窗口内所有像素灰度从大-》小排序,将中间值作为(x,y)处的灰度值。一般采用排序算法

2.3.4.4 图像锐化

目的:减少图像中边界、轮廓的模糊带来的影响,使变更清晰。
图像变模糊的根本原因:受到平均/积分造成的,可进行逆运算改变。
图像锐化的两种方法:1.微分法(梯度锐化和拉普拉斯锐化)。2.高通滤波法在这里插入图片描述

2.3.4.5 直方图均衡

概念:是一种图像分析工具,描述了图像的灰度级。
直方图修复:通过灰度映射级函数S=F®,将原灰度直方图改为你希望的直方图,
直方图修复常用:直方图均衡化,即把给定图像直方图分布改为均为直方图分布。
在这里插入图片描述

2.3.4.6 白平衡

与色温有关,色温高,蓝色成分越多。色温低,红色成分越多。
自动白平衡的算法:1.全局平衡法。2.局部白平衡法
在这里插入图片描述

3.视频压缩编码原理

3.1 预测编码

3.1.1 预测编码基本概念

视频压缩编码常用方法:预测法:即压缩编码后传输的是取样的预测值与实际值之差。因为同一图像相邻像素点之间有很强的的关联性
实际操作方法:距离不同,关联性不同,以P为预测值,按与像素点X的距离给不同权值,把这些权值相加得到预测值P,再与X相减,得到差值q
在这里插入图片描述

3.1.2 帧内预测编码

3.1.2.1 一维最佳预测
3.1.2.2 二维最佳预测
3.1.2.3 预测编码增益
3.1.2.4 预测编码的量化器

一般图像中平坦区域比突变区域多,如人脸中鼻子等为突变区域。在突变部分量化误差变大即采取粗量化并不会使得人眼敏感。反之在平坦区域,应该取细量化。

3.1.3 帧间预测编码

3.1.3.1 单向预测
(1)预测原理:

利用上一帧图像经过运动矢量位移作为预测值的方法称为单向预测。即当前帧F(x,y)与帧存储区的上一帧F(x1,y1)同时输入运动参数估值器,比较运动矢量MV。将此MV输入运动补偿预测,得到预测图像F,预测图像和实际图像不可能一样,总存在误差e(x,y)。

(2)基于块匹配的运动矢量估计:

单向预测以像素为单位进行预测,除了传送帧差外,还增加了每个像素的运动矢量,编码效率下降。因此往往把一帧图像分为MXN块,以块为单位分配矢量,可降低总码率。

(3)搜索方法:

1.穷尽搜索法。
2.快速搜素法。

3.1.3.2 双向预测

1.利用前一帧和后一帧像素同时预测。
2.前向参考帧预测当前帧称为前向运动补偿,利用后向参考帧预测当前帧称为后向运动补偿,利用前后向同时预测的就称为双向预测运动补偿。
3.这种预测只针对t-1帧未暴露而t+1帧已呈现的场景

3.1.3.3 重叠块运动补偿OBMC

主要解决基于块的运动补偿带来的估计不准确的问题。采用OBMC时,一个像素的预测不仅基于他所属的MV估计,也基于相邻的MV估计。

3.1.4 运动估计

3.1.4.1 基本概念

帧间预测编码中,活动图像邻近帧存在一定相关性。因此可将活动图像分为若干块,设法搜索出每个块在临近帧图形中位置,并得出块与图形的空间位置的偏移量,得到的偏移量就是所指的 运动矢量。得到运动矢量的过程为运动估计。
优点:经过运动估计可去除帧间冗余度,使得视频传输的比特数大为减少。

3.1.4.2运动估计的方法
3.1.4.3 运动表示法
3.1.4.3.1基于块的运动表示法
3.1.4.3.2亚像素位置的内插
3.1.4.3.3 运动矢量在时空域的预测方式
  (1)运动矢量空间域预测方式:

a、运动矢量中值预测(Median Prediction)
b、空间域的上层块模式运动矢量(Uplayer Prediction)

	  (2)运动矢量在时间域预测方式

a、前帧对应块运动矢量预测(Corresponding-block Prediction)
b、时间域的邻近参考帧运动运动矢量预测(Neighboring Reference-frame Prediction)

3.1.4.3.4 匹配误差在时空域的预测方式

3.1.4.4 运动估计准则分类

运动搜索的目的就是在搜索窗内寻找与当前块最匹配的数据块,这样就存在着如何判断两个块是否匹配的问题,即如何定义一个匹配准则

3.1.4.5 运动搜索算法

主要的几种搜索算法:
①全局搜索算法:在一个预先定义的搜索区域内,把它与参考帧中所有的候选块进行比较,并且寻找具有最小匹配误差的一个。这两个块之间的位移就是所估计的MV。
②分数精度搜索算法:
③快速搜索算法:
④ 分级搜索范围(DSR)算法:
⑤混合搜索算法:

3.2 变换编码

3.2.1 基本概念

大多数图像平坦区域和内容占大部分,细节和内容突变区域占小部分,即图像中直流和低频大部分,高频小部分。这样空间域的图像变换到频域变换,会产生较小的变换系数,并可对其进行压缩编码,即变换编码。

3.2.2 K-L变换
3.2.3 离散余弦变换DCT
3.2.4 锯齿形扫描和游程编码

3.3 变换编码与预测编码的比较

①变换编码实现比较复杂,预测编码的实现相对容易,但预测编码的误差会扩散。
②预测编码的误差会向后扩散,形成区域误码。变换编码不会,其限制只影响在一个块内。

///持续更新

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

新一代视频压缩编码标准-----H.264/AVC 的相关文章

  • 解决 kali换源之后签名无效

    报错问题 apt get update 报错 更新扩展知识 kali更新源 终端输入 vi etc apt sources list 中科大 deb http mirrors ustc edu cn kali kali rolling ma
  • Linus谈优秀程序员的三种品质

    转自 http blog dyngr com blog 2013 09 26 junio c hamano interview 引言 今天我们的嘉宾 是分布式版本管理系统Git的主要维护者 同时也是 入门Git 一书的作者 滨野纯先生 而这
  • 虚拟化与网络存储技术

    虚拟化技术简介 一 常见的虚拟化技术分类 1 CPU虚拟化 CPU的虚拟化技术是一种硬件方案 支持虚拟化技术的CPU带有特别优化过的指令集来控制虚拟过程 通过这些指令集 VMM会很容易提高性能 2 服务器虚拟化 服务器虚拟化能够通过区分资源
  • 数据下载网站整理

    数据十分重要 如何找到理想的数据显得更重要了 这里记录自己经过网上查询到的数据 进行整理 如果侵权 请联系我删除 再次感谢网友大佬们提供的资料 1 中国气象站点数据 下载地址 https www resdc cn data aspx DAT
  • 故障:fork failed:Resource Temporarily Unavailable解决方案

    故障 fork failed Resource Temporarily Unavailable解决方案 在一次crontab bkapp txt导入N多定时任务时候 该用户无法执行任何命令 再ssh连报fork failed Resourc
  • App\led\led.h(6): warning: #1295-D: Deprecated declaration LED_Init - give arg types

    如图所示操作即可 如图所示操作即可 如图所示操作即可
  • BSD、Apache、MIT、GPL、LGPL几种常见的开源协议

    转载地址 https www cnblogs com Vito2008 p 4806677 html 1 BSD开源协议 original BSD license FreeBSD license Original BSD license B
  • 第二届网刃杯--部分Re

    1 freestyle ida中分析有个两个fun atoi 将字符转换为整数 得到答案为3327105 MD5加密提交 2 Re function 没有提供密码 但是在右边看到熟悉的89 50 利用winhex保存出来 得到解压密码 解压
  • 工业安全生产信息化平台的基本架构和关键功能分享

    工业安全生产信息化平台是指利用信息技术手段 将工业安全生产管理与数据采集 传输 处理相结合 实现对工业安全生产全过程的数字化 信息化 智能化管理的平台 它通过集成多种信息系统和设备 实现对重大危险源监控预警 安全风险分级管控 安全生产一张图
  • DHCP的配置(以华为eNSP为例)

    如有错误 敬请谅解 此文章仅为本人学习笔记 仅供参考 如有冒犯 请联系作者删除 基础知识介绍 络组建步骤 1 拓扑设计 2 IP地址规划 按照拓扑中划分的 络范围 规划 络位不同的IP地址 3 配置 1 配置各个节点的IP地址 2 路由 全
  • 【电机学】直流电机

    直流电机 什么是直流电机 直流电机的工作原理 直流发电机的工作原理 直流电动机的工作原理 可逆性原理 直流电机的主要结构部件 直流电机的电枢绕组 基本特点 并联支路对数 电刷的放置 一些概念 直流电机的磁场 直流电机的空载磁场 电枢电流Ia
  • GitHub Action入门简介

    1 What is GitHub Actions GItHub Actions是一个持续集成和持续交付的平台 能够让你自动化你的编译 测试和部署流程 GitHub 提供 Linux Windows 和 macOS 虚拟机来运行您的工作流程
  • Freertos 在contexM0芯片上的移植

    1 freertos源码 官网下载地址 https www freertos org 下载LTS长期支持版本 2 在工程目录下新建FreeRTOS文件夹 将FreeRTOS 的源码添加到这个文件夹中 portable 文件夹中只需要复制 k
  • FL Studio2024水果编曲软件21.2.0中文版本下载更新

    FL Studio2024是功能强大的音乐制作解决方案 使用旨在为用户提供一个友好完整的音乐创建环境 让您能够轻松创建 管理 编辑 混合具有专业品质的音乐 一切的一切都集中在一个软件中 只要您想 只要您需要 它总能满足您的音乐需求 工具方面
  • 销售人员一定要知道的6种获取电话号码的方法

    对于销售来说 电话销售是必须要知道的销售方法 也是销售生涯中的必经之路 最开始我们并不清楚这么电话是从哪里来的 也不清楚是通过哪些方法渠道获取 那么今天就来分享给各位销售人员获取客户电话号码的方法 1 打印自己的名片 在工作当中少不了接触其
  • 如何FL Studio显示中文?切换语言教程

    你是不是也在为fl studio的英文界面而苦恼 你是不是也想让你的fl studio 说中文 方便你制作音乐 你是不是也在网上找了很多教程 却发现都是复杂的 或者已经过时的 如果你的答案是肯定的 那么你来对地方了 今天 我要教你一个一步到
  • fl studio20中文内测版下载2024最新完美实现汉化

    fl studio20是一款众所周知的水果编曲软件 能够剪辑 混音 录音 它的矢量界面能更好用在4K 5K甚至8K显示器上 还可以可以编曲 剪辑 录音 混音 让你的计算机成为全功能录音室 不论是在功能上面还是用户界面上都是数一数二的 但该软
  • CSDN找到“仅我可见”内容

    有时候自己做一些笔记参考了他人的内容 所以想将文章转为 仅自己可见 仅作自用 记录一下CSDN找私密文章的方式 今天摸了好一会儿才找到哈哈哈 1 点击导航栏处的创作中心进入 2 查看更多 3 点击浏览就可以查看啦 来源 CSDN找到 仅我可
  • 直排轮滑教程1

    准备活动及站立方法 1 轮滑起源于滑冰 2 开始运动之前最好做热身运动 刺激肌肉 使身体兴奋起来 3 戴护具 顺序是头盔 护肘 护膝 鞋 护掌 脱的顺序相反 4 起身 左腿立起 两手扶腿 两手撑 左腿蹬站立 5 原地站立方法三种 跟靠拢 两
  • 公抓抓:批量获取企业工商信息的办法

    网站产生数据的作用 企业公示系统的数据 目前网络上每天都有海量数据诞生 这些数据蕴含着巨大的价值 很多时候企业和政府都需要大量的企业数据用于自身的运营 分析等 这些时候往往需要全面的数据才能得出更加客观的结论 比如金融机构在进行业务合作时

随机推荐

  • apifox测试excel文件上传,后端处理逻辑

    学习链接 api测试Excel Excel注解 任务描述 使用springboot框架与apifox测试软件以及ExcelUtil工具类完成对excel表的解析 并将数据转换为json格式 excel注解 apifox测试描述 补充说明 文
  • 详解CSS中的flex布局

    详解CSS中的flex布局 1 概念 2 容器属性 2 1 flex direction 2 2 flex wrap 2 3 flew flow 2 4 justify content 2 5 align items 2 6 align c
  • 【linux】宝塔Linux 8888 进不去

    宝塔面板安装好之后会分配一个ip和账户密码 但是用他分配的一直进不去 使用curl 127 0 0 1 8888 login也显示安全验证失败 解决方法 用自己虚拟机的ip 比如 10 13 12 25 就可以进去了 http 10 13
  • docker服务器出现/opt/n-bash: 无法为立即文档创建临时文件: 设备上没有空间问题

    服务器情况及遇到的问题 一台linux服务器 主要部署的为docker容器 出现当输入进入文件夹命令时 点击Tab 键不能自动出来文件夹名 如下 root web158 cd opt n bash 无法为立即文档创建临时文件 设备上没有空间
  • 从壹开始 [ Design Pattern ] 之二 ║ 单例模式 与 Singleton

    前言 这一篇来源我的公众号 如果你没看过 正好直接看看 如果看过了也可以再看看 我稍微修改了一些内容 今天讲解的内容如下 一 什么是单例模式 单例模式 英文名称 Singleton Pattern 这个模式很简单 一个类型只需要一个实例 他
  • python使用openai生成图像教程详解

    OpenAI 是一个人工智能的工具包 包括神经网络 遗传算法和有限状态机等 使用python可以非常便捷的操作OpenAI的API 一下是OpenAI官网列举的功能DEMO 首先使用python的pip进行openai库的安装 pip in
  • Springboot整合Nacos配置中心 多环境配置

    Nacos多环境的配置 方法一 1 在项目中的bootstrap yaml文件中配置激活指定的配置文件 spring application name gabriel cloud nacos config server addr 127 0
  • 如何申请iOS推送证书p12文件并配置极光推送平台

    编辑切换为居中 添加图片注释 不超过 140 字 可选 极光推送平台需要上传配置开发测试的iOS推送证书 开发环境 和上架到App Store的iOS推送证书 生产环境 以下是申请这两个环境的推送证书p12文件的教程 创建APP ID时勾选
  • 显卡检测工具:GPU-Z

    今天小编为大家测试了一款轻量级的GPU显卡的测试工具 可以查看GPU的详细信息 以供各位同学们学习 一 简单介绍 GPU Z是一款方便实用的软件工具 专门为用户提供视频卡和GPU的详尽信息 它具有轻巧的特点 不需要安装即可使用 并且可以一键
  • matlab中svd, svds, lansvd 函数

    首先我们看一下wiki上关于奇异值分解的理论描述 1 理论描述 假设M是一个m n阶矩阵 其中的元素全部属于域K 也就是实数域或复数域 如此则存在一个分解使得 displaystyle M U Sigma V 其中U是m m阶酉矩阵 是m
  • 小记初学android过程中遇到的小问题(android 4.4)

    在layout文件中有下面这样一个编辑框
  • List> 转 Map>

    将List转成Map结构 以下为没有水平的写法 好久之前写的土方法转换 不知道有没有优秀的解法 还希望大家提供 Map
  • 吸尘器电机拆解图解_家庭打扫全能选手-美的无线吸尘器P2G

    最近美的推出了一款轻便式家用吸尘器 一改吸尘器在心中笨大重托的形象 但具体清洁效果与实际体验如何呢 现在就让我们全方位探究一下这台美的无线吸尘器P2G 部件及功能介绍 包装小巧到我惊掉下巴 这真的就可以组装成一台吸尘器吗 打开包装 有序排列
  • JAVA多态(超详细讲解)

    目录 多态的基本介绍 实现多态的条件 1 继承 必须要有子类继承父类的继承关系 2 重写 子类需要对父类中的一些方法进行重写 然后调用方法时就会调用子类重写的方法而不是原本父类的方法 3 向上转型 在多态中需要将子类的引用赋给父类对象 只有
  • Windows下搭建nginx和rtspToWebRTC以及Windows程序添加为服务开机启动和后台运行

    1 前言 之前的rtsp转webrtc的服务很好用 https blog csdn net weixin 39510813 article details 123718363 spm 1001 2014 3001 5502 测试使用效果都很
  • Axios 企业级3封装以及常见的get和post请求写法

    简洁用法 发送get请求 第一种 适合少量参数 axios get api url 参数名1 参数值1 参数2 参数值2 then res gt res data就是后端响应的数据 catch err gt err就是错误信息 请求挂掉了
  • expected ‘=’, ‘,’, ‘;’, ‘asm’ or ‘__attribute__’ before ‘struct’

    这篇准备长期更新 1 在编译时遇到错误 错误 expected asm or attribute before struct src cli socket handle c 在函数 client login 中 这种错误第一次遇到肯定很懵逼
  • iptables的基本使用

    iptables 防火墙 防火墙的分类 Netfilter 链的概念 表的概念 表链的关系 iptables规则的匹配 iptables 的命令 查询规则 添加规则 删除规则 修改规则 保存规则 iptables的扩展模块 Tcp模块 mu
  • 基于Java设计和实现系统的自动化巡检

    系统巡检对于系统管理员并不陌生 日常工作是离不开它的 笔者记得进入运维岗位的第一天 学习的第一课就是如何系统巡检 首先远程登陆各服务器 然后通过执行命令或操作页面查看系统内存 CPU和磁盘利用率等情况 最后将相应的数值填写入系检表格 看似几
  • 新一代视频压缩编码标准-----H.264/AVC

    2 数字视频 2 1 2 数字电视PCM原理 将输入的模拟信号转化为输出的数字电视信号 经过取样 量化 编码三个步骤 由A D变换器完成 2 1 2 1 取样 在时间轴上将连续变化的模拟信号 转化为离散量 2 1 2 2 量化 因取样后的脉