【音视频基础】AVI文件格式

AVI文件采用的是RIFF文件结构方式。波形音频wave,MIDI和数字视频AVI都采用这种格式存储。
AVI文件的整体结构如下图所示
在这里插入图片描述

构造RIFF文件的基本单元叫做数据块(Chunk),每个数据块包含3个部分

  • 4字节的数据块标记(或者叫做数据块的ID)
  • 数据块大小
  • 数据

整个RIFF文件可以看成一个RIFF块。一个RIFF文件中只允许存在一个RIFF块。RIFF块中包含一系列的子块,其中有一种子块的ID为“LIST”称为LIST,LIST块中可以再包含一系列的子块,但除了LIST块外的其他所有的子块都不能再包含子块。

RIFF和LIST块分别比普通的数据块多一个被称为形式类型(Form Type)和列表类型(List Type)的数据域,其组成如下

  • 4字节的数据块标记(Chunk ID)
  • 数据块的大小
  • 4字节的形式类型或者列表类型
  • 数据
//Chunks
typedef struct {
DWORD dwFourCC
DWORD dwSize      //data
BYTE data[dwSize] // contains headers or video/audio data
} CHUNK;//Lists
typedef struct {
DWORD dwList
DWORD dwSize        //dwFourcc + data
DWORD dwFourCC
BYTE data[dwSize-4] // contains Lists and Chunks
} LIST;

整个AVI文件是一个类型码为为"AVI "的RIFF块,其主要有三个subchunk构成:

  • 信息块(“hdrl” LIST块,用于描述AVI的流数据格式)
  • 数据块(“movi” LIST块,用于保存音视频序列数据)
  • 索引块(可选的,"idxl"子块)

AVI文件的展开结构大致如下:
在这里插入图片描述

在这里插入图片描述
avih块用于描述avi文件信息

其结构如下
在这里插入图片描述

typedef struct
{FourCC fcc;                  // 必须为 avihDWORD cb;                    // 本数据结构的大小,不包括最初的8个字节(fcc和cb两个域)DWORD dwMicroSecPerFrame;    // 视频帧间隔时间(以毫秒为单位)DWORD dwMaxBytesPerSec;      // 这个AVI文件的最大数据率DWORD dwPaddingGranularity;  // 数据填充的粒度DWORD dwFlags;               // AVI文件的全局标记,比如是否含有索引块等DWORD dwTotalFrames;         // 总帧数DWORD dwInitialFrames;       // 为交互格式指定初始帧数(非交互格式应该指定为0)DWORD dwStreams;             // 本文件包含的流的个数DWORD dwSuggestedBufferSize; // 建议读取本文件的缓存大小(应能容纳最大的块)DWORD dwWidth;               // 视频图像的宽(以像素为单位)DWORD dwHeight;              // 视频图像的高(以像素为单位)DWORD dwReserved[4];         // 保留
} AVIMainHeader;

strh用于描述流的头信息

在这里插入图片描述

// AVI流头部
typedef struct
{FourCC fcc;                 // 必须为 strhDWORD cb;                   // 本数据结构的大小,不包括最初的8个字节(fcc和cb两个域)FourCC fccType;             // 流的类型: auds(音频流) vids(视频流) mids(MIDI流) txts(文字流)FourCC fccHandler;          // 指定流的处理者,对于音视频来说就是解码器DWORD dwFlags;              // 标记:是否允许这个流输出?调色板是否变化?WORD wPriority;             // 流的优先级(当有多个相同类型的流时优先级最高的为默认流)WORD wLanguage;             // 语言DWORD dwInitialFrames;      // 为交互格式指定初始帧数DWORD dwScale;              // 每帧视频大小或者音频采样大小DWORD dwRate;               // dwScale/dwRate,每秒采样率DWORD dwStart;              // 流的开始时间DWORD dwLength;             // 流的长度(单位与dwScale和dwRate的定义有关)DWORD dwSuggestedBufferSize;// 读取这个流数据建议使用的缓存大小DWORD dwQuality;            // 流数据的质量指标(0 ~ 10,000)DWORD dwSampleSize;         // Sample的大小RECT rcFrame;               // 指定这个流(视频流或文字流)在视频主窗口中的显示位置,视频主窗口由AVIMAINHEADER结构中的dwWidth和dwHeight决定
} AVIStreamHeader;

该块用于描述流的具体信息。如果是视频流(vids,由strh块得知),用一个BitmapInfo结构体表示,如果是音频流(auds),用WaveFormatEx结构体表示。

在这里插入图片描述
数据块中存储视频和音频数据流,数据可直接存于“movi LIST”中。数据块中音视频数据按不同的子块存放,其结构如下所述
音频子块
“##wb”
Wave 数据流
视频子块中存储DIB数据,又分为压缩或者未压缩DIB
“##db”
RGB数据流
“##dc”
压缩数据流
索引块包含数据块在文件中的位置索引,能提高avi文件的读写速度。这个块不是必需的。

音视频教程
整理了一些 音视频流媒体开发 学习书籍、视频资料,有需要的可以自行添加学习交流群:739729163 领取哦!!!
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/192882.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【C语言数据结构】单链表

目录 分析顺序表和链表实现单链表打印链表动态申请一个节点尾插头插尾删头删查找值函数单链表在pos位置之前插入x单链表在pos位置之后插入x删除pos位置单链表删除pos位置之后的值释放内存空间 分析顺序表和链表 如下图可以看出顺序表的优点 1.尾插尾删足够快 2.下标随机访问和修…

Git安装与常用命令

Git简介: Git是一个开源的分布式版本控制系统,用于敏捷高效地处理任何或大或小的项目。Git是Linus Torvalds为了帮助管理Linux内核开发而开发的一个开放源代码的版本控制软件。Git与常用的版本控制工具CVS、Subversion等不同,它采用了分布式…

zsh和ohmyzsh安装指南+插件推荐

文章目录 1. 安装指南2. 插件配置指南3. 参考信息 1. 安装指南 1. 安装 zsh sudo apt install zsh2. 安装 Oh My Zsh 国内访问GitHub sh -c "$(curl -fsSL https://raw.githubusercontent.com/ohmyzsh/ohmyzsh/master/tools/install.sh)"这将安装 Oh My Zsh 和所…

验证码案例 —— Kaptcha 插件介绍 后端生成验证码,前端展示并进行session验证(带完整前后端源码)

🧸欢迎来到dream_ready的博客,📜相信你对这篇博客也感兴趣o (ˉ▽ˉ;) 📜表白墙/留言墙 —— 中级SpringBoot项目,MyBatis技术栈MySQL数据库开发,练手项目前后端开发(带完整源码) 全方位全步骤手…

强烈 推荐 13 个 Web前端在线代码IDE

codesandbox.io(国外,提供免费空间) 网址:https://codesandbox.io/ CodeSandbox 专注于构建完整的 Web 应用程序,支持多种流行的前端框架和库,例如 React、Vue 和 Angular。它提供了一系列增强的功能&…

【数据预处理2】数据预处理——数据标准化

数据标准化 1. 什么是标准化?   数据标准化是一个常用的数据预处理操作,目的是将不同规格的数据转换到统一规格或不同分布的数据转换到某个特定范围,以减少规模、特征、分布差异等对模型的影响。这种操作也叫作无量纲化。   除了用作模型…

<MySQL> 如何合理的设计数据库中的表?数据表设计的三种关系

目录 一、表的设计 二、一对一关系 三、一对多关系 四、多对多关系 一、表的设计 数据库设计就是根据需要创建出符合需求的表。 首先根据需求找到体系中的关键实体对象,通常每个实体对象都会有一个表,表中包含了这个实体的相关属性。 再理清楚实体对…

Java Web——JavaScript运算符与流程语句

1. 运算符 1.1. 算数运算符 数字是用来计算的,比如:乘法 * 、除法 / 、加法 、减法 - 等等,所以经常和算术运算符一起。 算术运算符:也叫数学运算符,主要包括加、减、乘、除、取余(求模)等 …

C语言的由来与发展历程

C语言的起源可以追溯到上世纪70年代,由Dennis Ritchie在贝尔实验室开发出来。C语言的设计目标是提供一种简洁、高效、可移植的编程语言,以便于开发底层的系统软件。在那个时代,计算机技术正在迅速发展,出现了多种高级编程语言&…

神经网络反向传播的数学原理

如果能二秒内在脑袋里解出下面的问题,本文便结束了。 已知:,其中。 求:。 到这里,请耐心看完下面的公式推导,无需长久心里建设。 首先,反向传播的数学原理是“求导的链式法则” : 设f和g为x…

SpringBoot 整合 Freemarker

通过 Freemarker 模版,我们可以将数据渲染成 HTML 网页、电子邮件、配置文件以及源代码等。 Freemarker 不是面向最终用户的,而是一个 Java 类库,我们可以将之作为一个普通的组件嵌入到我们的产品中。 Freemarker 模版后缀为 .ftl(FreeMarke…

PC端使子组件的弹框关闭

子组件 <template><el-dialog title"新增部门" :visible"showDialog" close"close"> </el-dialog> </template> <script> export default {props: {showDialog: {type: Boolean,default: false,},},data() {retu…