FFmpeg读取Assets资源文件

在Android开发中我们经常把原生资源文件放在assets目录下以供需要时读取,通过API提供的resources.assets.open(filename)/openFd(filenam)方法可以非常方便获得InputStream或FileDescriptor(文件标识符),但是在使用FFmpeg读取Assets文件时却遇到了困难。主要原因在于FFmpeg读取媒体文件时是通过传入的url来判断IO协议的,也就是说如果想要使FFmpeg能够正确读取Assets文件就需要选择合适的IO协议来构造url并传入avformat_open_input(...)方法中,然而实际操作起来貌似问题多多。

AssetFileDescriptor

调用resources.assets.openFd(filename)可以返回AssetFileDescriptor,那么FFmpeg是否可以通过文件标识符(以下简称fd)来打开媒体文件呢?答案是肯定的。但是对于assets文件会存在一个问题,assets返回的AssetFileDescriptor中带有mStartOffset需要处理,也就是说实际的有效数据需要从mStartOffset处开始读取。

Stackoverflow上有同样的提问:

How to properly pass an asset FileDescriptor to FFmpeg using JNI in Android

实现方式

  1. 在native层获取实际的fd后使用pipe协议或file协议拼装url

int fd = jniGetFDFromFileDescriptor(env, fileDescriptor);
char path[20];
sprintf(path, "/proc/self/fd/%d", fd);

在调用avformat_open_input(...)方法前手动创建AVFormatContext并设置skip_initial_bytes参数。

fmtCtx = avformat_alloc_context();
fmtCtx->skip_initial_bytes = offset;
fmtCtx->iformat = av_find_input_format("mp3");

注:avformat_open_input用于打开媒体文件并获取相关的文件信息,对于该函数更详细的分析可以参考雷神的文章FFmpeg源代码简单分析:avformat_open_input()。实际上,我们也可以不指定iformat,指定了

iformat的好处是FFmpeg将不再对媒体文件的格式进行探测。

问题

当使用上述方案时,发现并不能正常的解码mp4(mov格式)视频文件,Stackoverflow上的评论也有人遇到同样的问题,比较奇怪的是虽然解码失败但是可以获取视频文件的基本信息,查看FFmpeg输出日志:
 

//这里仅贴出较为关键的日志
[FFMPEG]--:type:'ftyp' parent:'root' sz: 32 8 15677739
[FFMPEG]--:ISO: File Type Major Brand: isom
[FFMPEG]--:type:'free' parent:'root' sz: 8 40 15677739
[FFMPEG]--:type:'mdat' parent:'root' sz: 7606147 48 15677739
[FFMPEG]--:type:'moov' parent:'root' sz: 7384 7606195 15677739
....
//sample与chunk的映射关系
[FFMPEG]--:AVIndex stream 0, sample 0, offset 30, dts 0, size 83337, distance 0, keyframe 1
[FFMPEG]--:AVIndex stream 0, sample 1, offset 1494b, dts 512, size 118, distance 1, keyframe 
....
[FFMPEG]--:nal_unit_type: 7(SPS), nal_ref_idc: 3
[FFMPEG]--:nal_unit_type: 8(PPS), nal_ref_idc: 3
[FFMPEG]--:stream 0, sample 0, dts 0
[FFMPEG]--:stream 1, sample 0, dts 0
//解析NAL报错,NAL用于存储视频流(H264)数据
[FFMPEG]--:Invalid NAL unit size (1920229220 > 83333).
[FFMPEG]--:Error splitting the input into NAL units.
....

从FFmpeg的日志中我们可以发现,FFmpeg在解析mp4文件信息时并没有出错,正确的识别了ftypmdatmoov等关键atom,在后续解析中也正常的解析了sample(采样)与chunk(数据块)的映射关系(stsc),但是在解码阶段却报出明显的Invalid NAL unit size异常。

分析

assets目录下的媒体文件是否被Android特殊处理了?

上述的现象首先想到的是assets目录下的资源文件是否被Android特殊处理过,最后导致FFmpeg在通过fd读取文件解码时发生错误。从AssetFileDescriptor的官方描述中可以获知Android好像并没有对assets下的文件做特殊的处理。

File descriptor of an entry in the AssetManager. This provides your own opened FileDescriptor that can be used to read the data, as well as the offset and length of that entry's data in the file.

然而在Android音视频开发中,我们经常使用MediaCodec的setDataSource(fd)方法来向MediaCodec传递媒体数据,MediaCodec却仍然可以正常的读取assets资源文件,难道在使用Android的AssetFileDescriptor文件标识符时需要特殊的处理?

MediaCodec是如何处理AssetFileDescriptor的?
搜索源码可以查找到MediaExtractor#setDataSource所调用的native方法为NuMediaExtractor::setDataSource,该方法最后将fd封装为FileSource对象。
NuMediaExtractor.cpp
 

status_t NuMediaExtractor::setDataSource(int fd, off64_t offset, off64_t size) {...if (mImpl != NULL) {return -EINVAL;}//创建FileSourcesp<FileSource> fileSource = new FileSource(dup(fd), offset, size);...return OK;
}

FileSource中读取数据的操作就是调用普通的linux内核函数read,这一过程并没有对fd做任何特殊的处理。

FileSource.cpp

ssize_t FileSource::readAt_l(off64_t offset, void *data, size_t size) {//seek到指定的offsetoff64_t result = lseek64(mFd, offset + mOffset, SEEK_SET);if (result == -1) {ALOGE("seek to %lld failed", (long long)(offset + mOffset));return UNKNOWN_ERROR;}//seek后从fd中读取指定大小的数据到data中return ::read(mFd, data, size);
}

【免费分享】音视频学习资料包、大厂面试题、技术视频和学习路线图,资料包括(C/C++,Linux,FFmpeg webRTC rtmp hls rtsp ffplay srs 等等)有需要的可以点击788280672加群免费领取~

那么FFmpeg是如何处理AssetFileDescriptor的?是否与MediaCodec不同?

FFmpeg对应的file协议处理在libavforamt/file.c中:

//4.3.1源码,109行
static int file_read(URLContext *h, unsigned char *buf, int size)
{FileContext *c = h->priv_data;int ret;size = FFMIN(size, c->blocksize);//同样是调用的read函数ret = read(c->fd, buf, size);if (ret == 0 && c->follow)return AVERROR(EAGAIN);if (ret == 0)return AVERROR_EOF;return (ret == -1) ? AVERROR(errno) : ret;
}

比较二者处理逻辑,FFmpeg在读取数据时也是使用的read函数,不同的是file_read函数中并没有seek相关的逻辑,这是因为libavformat/file.c中封装的是最基础的IO操作,并不会写有其他无关的逻辑,FFmpeg将所有的IO协议封装为URLProtocl结构体,我们可以简单看下file协议的定义:
 

const URLProtocol ff_file_protocol = {.name                = "file",.url_open            = file_open,.url_read            = file_read,//file_read函数指针.url_write           = file_write,.url_seek            = file_seek,//seek.url_close           = file_close,.........default_whitelist   = "file,crypto,data"
};

FFmpeg与MediaCodec在读取AssetFileDescriptor时都是使用的read函数,但是我们暂时无法确定FFmpeg内部seek的逻辑是否存在问题,由此怀疑FFmpeg是不是没有正确的处理AssetFileDescriptor的startOffset。
测试AVFormatContext中的skip_initial_bytes是否存在问题

  • 我们首先测试正常情况下offset为0的fd,我们可以使用Android中的ParcelFileDescriptor来将一个本地路径转换为fd:

Android应用层:

val fd = ParcelFileDescriptor.open(File(videoPath), ParcelFileDescriptor.MODE_READ_ONLY)

Native层:

fmtCtx = avformat_alloc_context();
fmtCtx->skip_initial_bytes = 0;
fmtCtx->iformat = av_find_input_format("mp4");

结果:正常解码

  • 测试offset不为0,我们可以使用十六进制工具打开视频文件手动的在文件头部添加几个字节来模拟offset的情况

Android应用层调用与上述相同

Native层需要设置skip_initial_bytes变量:

fmtCtx = avformat_alloc_context();
fmtCtx->skip_initial_bytes = 3;//在文件头部手动添加的字节数
fmtCtx->iformat = av_find_input_format("mp4");

结果:不能正常解码,可以获取媒体文件基本信息,日志与上述“问题”中的日志相同。
(如果你不具备测试条件,可以使用我的测试分支来检验结果,clone代码后可直接运行)
通过上面一些列的分析,几乎可以确定:FFmpeg在处理mp4(mov格式)的媒体文件时,如果设置了AVFormatContextskip_initial_bytes变量,FFmpeg将不能正确的读取和解码文件。
原因
通过查阅avformat_open_input函数可以看到下述与skip_initial_bytes变量相关的代码:
 

...
if ((ret = init_input(s, filename, &tmp)) < 0)goto fail;
...
avio_skip(s->pb, s->skip_initial_bytes);
...    
if (!(s->flags&AVFMT_FLAG_PRIV_OPT) && s->iformat->read_header)if ((ret = s->iformat->read_header(s)) < 0)goto fail;
...

在调用了重要函数init_input之后,avformat_open_input调用了avio_skip(s->pb, s->skip_initial_bytes);函数,说明在正确识别IO协议和探测文件格式(如何没有设置iformat)后,avformat_open_input将文件seek到了指定的offset位置,并没有其余的处理逻辑。
随后将会调用AVInputformat中的read_header函数指针,read_header函数指针指向对应文件格式的函数,在mov格式中的read_header函数为mov_read_headermov_read_header函数非常重要,内部将会调用mov_read_default()函数以8字节为单位循环地读取数据并查找是否有与mov_default_parse_table表中相匹配的atom,当查找到trak(可以理解为视频文件的媒体流,比如视频流或音频流)时即会调用mov_build_index()函数来进一步解析stsc(上文提到的sample 与chunk的映射关系)。在后续解码阶段调用av_frame_read()函数时,mov.c将会依赖stsc中的映射关系来查找和读取指定的chunk。
 

//4.3.1版本,mov.c 
static void mov_build_index(MOVContext *mov, AVStream *st) {....//3935行AVIndexEntry *e;....e->pos = current_offset;//直接赋值了解析stsc得到的chunk位置e->timestamp = current_dts;e->size = sample_size;e->min_distance = distance;e->flags = keyframe ? AVINDEX_KEYFRAME : 0;//这里打印的是我们上述分析的日志,还记得吗?av_log(mov->fc, AV_LOG_TRACE, "AVIndex stream %d, sample %u, offset %"PRIx64", dts %"PRId64", ""size %u, distance %u, keyframe %d\n", st->index, current_sample,current_offset, current_dts, sample_size, distance, keyframe);....}//av_frame_read函数最终也会调用到相应媒体格式的read_packet函数,雷神也有分析的文章,这里不再赘述
static int mov_read_packet(AVFormatContext *s, AVPacket *pkt)
{....//7887行if (st->discard != AVDISCARD_ALL) {//这里的sample->pos为上述stsc中解析得到的pos,而且seek模式为SEEK_SETint64_t ret64 = avio_seek(sc->pb, sample->pos, SEEK_SET);....}....
}

相信熟悉mov格式或文件IO的朋友基本已经看到问题所在了,avformat_open_input虽然在read_header之前seek了指定的skip_initial_bytes,但是在read_header解析chunk的offset时并没有加上我们文件的skip_initial_bytes,而mov.c在后续read_packet操作时又是根据read_header解析到的位置重新seek,最终导致从av_read_frame获得的AVPacket中的数据是错误的数据,所以给到编码器也就无法正常解码。

解决

解决方案比较简单,因为在mov.c解析atom时只传递了AVIOContext,所以我在AVIOContext中添加了同样的

skip_initial_bytes字段,当调用mov_build_index并在AVIndexEntry(采样映射关系的结构体)赋值pos时加上相应的skip_initial_bytes。我已将这种方案提交到了Github上,并详细说明了修改的文件,同时我也基于WhatTheCodec工程编写了新的demo,经过我最近的测试,并没有发现其他的问题。如有其他问题,欢迎大家交流并互相学习。
Github: github.com/YiChaoLove/…
Demo: github.com/YiChaoLove/…

pipe协议

在上述Stackoverflow的提问的回答中有提到使用pipe协议,实际上,这种方式也是可行的,但是我在实现的过程中发现了几个需要注意的问题,由于篇幅有限,我在这里便直接描述问题。

使用pipe协议需要注意缓冲区大小

pipe协议通常用于linux进程间通讯,但是pipe缓冲区是有大小限制的,在《深入理解Linux内核》一书中有提到其大小为16个页,每个页大小为4KB,那么按照LInux系统的规则来计算则为64KB,Android是基于LInux的操作系统,所以在Android中使用pipe协议来传递数据时也需要遵循pipe的调用规范来使用。我们可以在应用层新建单独的线程来向pipe的一端写入数据,而FFmpeg是读的一端。
为了更具有通用性,我在native层手动创建了pipe,把pipe的输出端fd给到FFmpeg,输入端fd由应用层持有并在IO线程中写入数据,这样,我们便可以利用pipe协议非常灵活的写入数据,甚至可以把内存中的视频数据直接传入FFmpeg中。详细代码见MediaFileBuilder.kt中的from(inputStream: InputStream, shortFormatName: String) 方法。

pipe协议对于某些视频(mov格式)文件无效?

当使用pipe时你有可能会遇到有些视频并不能正确的读取和解码,下面是一个类似的报错日志:

....
[FFMPEG]--:Before avformat_find_stream_info() pos: 7613571 bytes read:7613571 seeks:0 nb_streams:2
....
[FFMPEG]--:format: start_time: 0 duration: 7.234 (estimate from stream) bitrate=0 kb/s
[FFMPEG]--:Could not find codec parameters for stream 0 (Video: h264 (avc1 / 0x31637661), none, 720x960, 8285 kb/s): unspecified pixel format
[FFMPEG]--:Could not find codec parameters for stream 1 (Audio: aac (mp4a / 0x6134706D), 44100 Hz, 2 channels, 128 kb/s): unspecified sample format
[FFMPEG]--:After avformat_find_stream_info() pos: 7613571 bytes read:7613571 seeks:0 frames:0
....

日志报错在avformat_find_stream_info函数不能正确的找到编码器参数,经过对这些视频文件的分析和比较,我发现,对于moovmdat之后的视频文件,使用pipe协议将无法正常读取和解码,使用faststart参数将moov调整到mdat之前便可以正常读取和解码。
 

ffmpeg -i video.mp4 -c copy -movflags +faststart output.mp4

faststart参数多用于流媒体优化,mdat为实际存储视频数据的atom,moov用于存储视频信息,如果

moov在其之后,那么播放器在播放视频时就需要一直向后查找搜索moov。将moov放在文件头部(ftyp之后)有利于播放器快速获取视频信息,moov放在尾部那么播放器将不得不先read之前所有的数据,以FFmpeg为例,这一过程将会发生在上文提到的:

mov_read_header函数非常重要,内部将会调用mov_read_default()函数以8字节为单位循环地读取数据并查找是否有与mov_default_parse_table表中相匹配的atom

说到这里,你可能已经明白原因了,使用pipe协议为半双工单向通讯,如果视频文件的moovmdat之后,那么在avforamt_open_input读取完视频信息后,实际上FFmpeg已经read到了数据的结尾,而且pipe协议不支持seek,数据从缓冲区中读取后无法再次读取,所以这种情况下将不能够正确读取和解码视频文件。

总结

本文着重的分析了在使用AssetFileDescriptor向FFmpeg传递数据时遇到的问题,这一问题实际为FFmpeg在解析mov格式文件时不能正确处理skip_initial_bytes所致。最后我分享了在使用pipe协议时遇到的问题与解决方案。上述这两个问题的解决可能会大大方便FFmpeg在Android上的使用,虽然MediaCodec在音视频开发(Android)的部分场景中已经渐渐的取代了FFmpeg,但是FFmpeg的通用性、稳定性和兼容性使之仍然可能在未来的Android音视频开发中长期存在。
上述文章观点或心得仅代表个人,也可能有错误之处,如果你对文章中提及的内容有问题或质疑,欢迎issues。如果你觉得这篇文章对你的开发或学习有帮助,欢迎在FFmpegForAndroidAssetFileDescriptor上star。文中有提到mov格式,可以参考:

  • docs.fileformat.com/video/mov/
  • developer.apple.com/library/arc…



作者:Good_Boy
原文链接 FFmpeg读取Assets资源文件 - 掘金

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/326685.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

腾讯云优惠券如何免费获取?

腾讯云作为国内领先的云计算服务提供商&#xff0c;常常会提供各种优惠券以吸引更多的用户使用其服务。这些优惠券可以大大降低用户的云服务费用&#xff0c;但许多用户可能不知道如何免费获取这些优惠券。本文将为大家介绍几种免费获取腾讯云优惠券的方法。 一、腾讯云官网活动…

软件测试|docker ps命令 管理和监视容器的利器

简介 Docker是一种流行的容器化平台&#xff0c;用于构建、分发和运行应用程序。Docker提供了许多命令行工具&#xff0c;其中之一是docker ps命令。本文将深入介绍docker ps命令&#xff0c;解释其用途、参数和功能&#xff0c;以及如何使用该命令来管理和监视运行中的Docker…

AI动作冒险电影《加勒比海盗:失落的宝藏》(下)

AI动作冒险电影《加勒比海盗&#xff1a;失落的宝藏》&#xff08;下&#xff09; 在宝藏岛屿的探险中&#xff0c;杰克船长不断遭遇铁钩胡克的追击&#xff0c;并陷入了一系列生死危机中。然而&#xff0c;当杰克终于找到宝藏所在的洞穴时&#xff0c;却发现了一个令人震惊的事…

微服务-dubbo工程案例搭建

基础案例搭建 1 依赖 父工程POM <dependencyManagement><dependencies><dependency><groupId>com.alibaba.cloud</groupId><artifactId>spring-cloud-alibaba-dependencies</artifactId><version>${com.alibaba.cloud.vers…

书生·浦语大模型实战营第一次课堂笔记

书生浦语大模型全链路开源体系。大模型是发展通用人工智能的重要途径,是人工通用人工智能的一个重要途径。书生浦语大模型覆盖轻量级、重量级、重量级的三种不同大小模型,可用于智能客服、个人助手等领域。还介绍了书生浦语大模型的性能在多个数据集上全面超过了相似量级或相近…

交换机04_远程连接

通过远程管理方式连接交换机 1、telnet简介 telnet 是应用层协议 基于传输层TCP协议的&#xff0c;默认端口&#xff1a;23 采用的是明文密码方式 不是很安全&#xff0c;一般用于内网管理。 2、ssh协议简介 ssh 是应用层的协议&#xff0c;基于传输层的TCP协议&#x…

C# 自定义配置文件序列化生成+文件格式错误自动回档

文章目录 前言选择Xml简单的Xml使用测试用例简单的写简单的读简单的生成配置修改配置类测试用例运行结果对比 代码逻辑封装逻辑示意封装好的代码测试生成配置文件格式错误测试使用默认值覆盖来解决问题 配置文件人为修改错误如何解决解决方案代码测试用例运行结果 代码封装总结…

Hadoop集群三节点搭建(二)

一、克隆三台主机&#xff08;hadoop102 hadoop103 hadoop104&#xff09; 以master为样板机克隆三台出来&#xff0c;克隆前先把master关机 按照上面的步骤克隆其他两个就可以了&#xff0c;记得修改ip和hostname 二、编写集群同步脚本 在/home/attest/ 创建bin目录&…

一个H3C交换机周期性断网并自动恢复的排查案例

一个朋友发我一个H3C日志&#xff0c;这个交换机是汇聚层交换机&#xff0c;1和2口是trunk口&#xff0c;其它接口是access接口&#xff0c;17-21口据说接的都是监控、终端。日志里面看到大量的拓朴改变&#xff0c;好几个网口up、down的日志&#xff0c;怀疑是环路&#xff0c…

Adboost算法

1描述 AdaBoost算法每次都是使用全部的样本进行训练&#xff0c;每一轮训练结束后&#xff0c;得到一个基学习器&#xff0c;并计算该基学习器在训练样本的预测误差率&#xff0c;然后根据这个误差率来更新下一轮训练时训练集合样本的权重系数和本轮基学习器的投票权重&#x…

Spring Boot实现数据加密脱敏:注解 + 反射 + AOP

文章目录 1. 引言2. 数据加密和脱敏的需求3. Spring Boot项目初始化4. 敏感数据加密注解设计5. 实现加密和脱敏的工具类6. 实体类和加密脱敏注解的使用7. 利用AOP实现加密和脱敏8. 完善AOP切面9. 测试10. 拓展功能与未来展望10.1 加密算法的选择10.2 动态注解配置 11. 总结 &am…