如何混合（合并）视频和音频，以便音频在输出视频中循环，以防持续时间太短？

2023-12-28

背景

我需要将视频文件和音频文件合并为一个视频文件，以便：

输出视频文件的持续时间与输入视频文件的持续时间相同
输出文件中的音频将仅是输入音频文件的音频。如果太短，则会循环到最后（如果需要可以在最后停止）。这意味着一旦音频播放完毕而视频尚未播放，我应该一次又一次地播放它，直到视频结束（音频的串联）。

正如我所读到的，这种合并操作的技术术语称为“混合”。

举个例子，假设我们有一个 10 秒的输入视频和一个 4 秒的音频文件，输出视频将是 10 秒（始终与输入视频相同），音频将播放 2.5 次（前 2 次）覆盖前 8 秒，然后是其余 4 秒中的 2 秒）。

存在的问题

虽然我找到了如何混合视频和音频的解决方案（here https://stackoverflow.com/a/31591485/878126），我遇到了多个问题：

我不知道如何在需要时循环写入音频内容。无论我如何尝试，它总是给我一个错误
输入文件必须是特定的文件格式。否则，它可能会引发异常，或者（在极少数情况下）更糟糕：创建包含黑色内容的视频文件。更重要的是：有时“.mkv”文件（例如）可能没问题，有时则不会被接受（并且两者都可以在视频播放器应用程序上播放）。
当前代码处理缓冲区而不是实际持续时间。这意味着在许多情况下，我可能会停止混合音频，即使我不应该这样做，并且输出视频文件的音频内容将比原始文件更短，即使视频足够长。

我尝试过的

我尝试使音频的 MediaExtractor 在每次到达结尾时都转到开头，方法是：

        if (audioBufferInfo.size < 0) {
            Log.d("AppLog", "reached end of audio, looping...")
            audioExtractor.seekTo(0, MediaExtractor.SEEK_TO_CLOSEST_SYNC)
            audioBufferInfo.size = audioExtractor.readSampleData(audioBuf, 0)
        }

为了检查文件的类型，我尝试使用MediaMetadataRetriever然后检查 mime 类型。我认为受支持的可以在文档中找到（here https://developer.android.com/guide/topics/media/media-formats）如那些标有“编码器”的。对此不太确定。我也不知道其中提到的哑剧类型属于哪种类型。
我还尝试重新初始化与音频相关的所有内容，但也不起作用。

这是我当前的多路复用本身代码（完整的示例项目可用here https://github.com/AndroidDeveloperLB/VideoAndAudioMux) :

object VideoAndAudioMuxer {
    //   based on:  https://stackoverflow.com/a/31591485/878126
    @WorkerThread
    fun joinVideoAndAudio(videoFile: File, audioFile: File, outputFile: File): Boolean {
        try {
            //            val videoMediaMetadataRetriever = MediaMetadataRetriever()
            //            videoMediaMetadataRetriever.setDataSource(videoFile.absolutePath)
            //            val videoDurationInMs =
            //                videoMediaMetadataRetriever.extractMetadata(MediaMetadataRetriever.METADATA_KEY_DURATION).toLong()
            //            val videoMimeType =
            //                videoMediaMetadataRetriever.extractMetadata(MediaMetadataRetriever.METADATA_KEY_MIMETYPE)
            //            val audioMediaMetadataRetriever = MediaMetadataRetriever()
            //            audioMediaMetadataRetriever.setDataSource(audioFile.absolutePath)
            //            val audioDurationInMs =
            //                audioMediaMetadataRetriever.extractMetadata(MediaMetadataRetriever.METADATA_KEY_DURATION).toLong()
            //            val audioMimeType =
            //                audioMediaMetadataRetriever.extractMetadata(MediaMetadataRetriever.METADATA_KEY_MIMETYPE)
            //            Log.d(
            //                "AppLog",
            //                "videoDuration:$videoDurationInMs audioDuration:$audioDurationInMs videoMimeType:$videoMimeType audioMimeType:$audioMimeType"
            //            )
            //            videoMediaMetadataRetriever.release()
            //            audioMediaMetadataRetriever.release()
            outputFile.delete()
            outputFile.createNewFile()
            val muxer = MediaMuxer(outputFile.absolutePath, MediaMuxer.OutputFormat.MUXER_OUTPUT_MPEG_4)
            val sampleSize = 256 * 1024
            //video
            val videoExtractor = MediaExtractor()
            videoExtractor.setDataSource(videoFile.absolutePath)
            videoExtractor.selectTrack(0)
            videoExtractor.seekTo(0, MediaExtractor.SEEK_TO_CLOSEST_SYNC)
            val videoFormat = videoExtractor.getTrackFormat(0)
            val videoTrack = muxer.addTrack(videoFormat)
            val videoBuf = ByteBuffer.allocate(sampleSize)
            val videoBufferInfo = MediaCodec.BufferInfo()
//            Log.d("AppLog", "Video Format $videoFormat")
            //audio
            val audioExtractor = MediaExtractor()
            audioExtractor.setDataSource(audioFile.absolutePath)
            audioExtractor.selectTrack(0)
            audioExtractor.seekTo(0, MediaExtractor.SEEK_TO_CLOSEST_SYNC)
            val audioFormat = audioExtractor.getTrackFormat(0)
            val audioTrack = muxer.addTrack(audioFormat)
            val audioBuf = ByteBuffer.allocate(sampleSize)
            val audioBufferInfo = MediaCodec.BufferInfo()
//            Log.d("AppLog", "Audio Format $audioFormat")
            //
            muxer.start()
//            Log.d("AppLog", "muxing video&audio...")
            //            val minimalDurationInMs = Math.min(videoDurationInMs, audioDurationInMs)
            while (true) {
                videoBufferInfo.size = videoExtractor.readSampleData(videoBuf, 0)
                audioBufferInfo.size = audioExtractor.readSampleData(audioBuf, 0)
                if (audioBufferInfo.size < 0) {
                    //                    Log.d("AppLog", "reached end of audio, looping...")
                    //TODO somehow start from beginning of the audio again, for looping till the video ends
                    //                    audioExtractor.seekTo(0, MediaExtractor.SEEK_TO_CLOSEST_SYNC)
                    //                    audioBufferInfo.size = audioExtractor.readSampleData(audioBuf, 0)
                }
                if (videoBufferInfo.size < 0 || audioBufferInfo.size < 0) {
//                    Log.d("AppLog", "reached end of video")
                    videoBufferInfo.size = 0
                    audioBufferInfo.size = 0
                    break
                } else {
                    //                    val donePercentage = videoExtractor.sampleTime / minimalDurationInMs / 10L
                    //                    Log.d("AppLog", "$donePercentage")
                    // video muxing
                    videoBufferInfo.presentationTimeUs = videoExtractor.sampleTime
                    videoBufferInfo.flags = videoExtractor.sampleFlags
                    muxer.writeSampleData(videoTrack, videoBuf, videoBufferInfo)
                    videoExtractor.advance()
                    // audio muxing
                    audioBufferInfo.presentationTimeUs = audioExtractor.sampleTime
                    audioBufferInfo.flags = audioExtractor.sampleFlags
                    muxer.writeSampleData(audioTrack, audioBuf, audioBufferInfo)
                    audioExtractor.advance()
                }
            }
            muxer.stop()
            muxer.release()
//            Log.d("AppLog", "success")
            return true
        } catch (e: Exception) {
            e.printStackTrace()
//            Log.d("AppLog", "Error " + e.message)
        }
        return false
    }
}

我也尝试过使用 FFMPEG 库（here https://superuser.com/a/1319950/152400 and here https://github.com/umair13adil/KotlinFFMpeg/issues/11) ，看看如何做。它工作得很好，但有一些可能的问题：该库似乎占用了大量空间，烦人的许可条款，并且由于某种原因，示例无法播放我必须创建的输出文件，除非我删除了文件中的某些内容。命令将使转换速度慢得多。我真的更喜欢使用内置的 API，而不是使用这个库，即使它是一个非常强大的库...另外，似乎对于某些输入文件，它没有循环...

问题

如何混合视频和音频文件，以便在音频比视频短（持续时间）的情况下音频会循环播放？
我怎样才能做到这一点，以便在视频结束时精确地剪切音频（视频和音频上都没有剩余）？
在调用此函数之前如何检查当前设备是否可以处理给定的输入文件并实际复用它们？有没有一种方法可以在运行时检查此类操作支持哪些内容，而不是依赖将来可能会更改的文档列表？

我也有同样的场景。

1: When audioBufferInfo.sizepresentationTimeUs.
2：获取视频时长，当音频循环到时长时（使用presentationTimeUs也），切。
3：音频文件需要MediaFormat.MIMETYPE_AUDIO_AMR_NB or MediaFormat.MIMETYPE_AUDIO_AMR_WB or MediaFormat.MIMETYPE_AUDIO_AAC。在我的测试机器上，它运行良好。

这是代码：

private fun muxing(musicName: String) {
    val saveFile = File(DirUtils.getPublicMediaPath(), "$saveName.mp4")
    if (saveFile.exists()) {
        saveFile.delete()
        PhotoHelper.sendMediaScannerBroadcast(saveFile)
    }
    try {
        // get the video file duration in microseconds
        val duration = getVideoDuration(mSaveFile!!.absolutePath)

        saveFile.createNewFile()

        val videoExtractor = MediaExtractor()
        videoExtractor.setDataSource(mSaveFile!!.absolutePath)

        val audioExtractor = MediaExtractor()
        val afdd = MucangConfig.getContext().assets.openFd(musicName)
        audioExtractor.setDataSource(afdd.fileDescriptor, afdd.startOffset, afdd.length)

        val muxer = MediaMuxer(saveFile.absolutePath, MediaMuxer.OutputFormat.MUXER_OUTPUT_MPEG_4)

        videoExtractor.selectTrack(0)
        val videoFormat = videoExtractor.getTrackFormat(0)
        val videoTrack = muxer.addTrack(videoFormat)

        audioExtractor.selectTrack(0)
        val audioFormat = audioExtractor.getTrackFormat(0)
        val audioTrack = muxer.addTrack(audioFormat)

        var sawEOS = false
        val offset = 100
        val sampleSize = 1000 * 1024
        val videoBuf = ByteBuffer.allocate(sampleSize)
        val audioBuf = ByteBuffer.allocate(sampleSize)
        val videoBufferInfo = MediaCodec.BufferInfo()
        val audioBufferInfo = MediaCodec.BufferInfo()

        videoExtractor.seekTo(0, MediaExtractor.SEEK_TO_CLOSEST_SYNC)
        audioExtractor.seekTo(0, MediaExtractor.SEEK_TO_CLOSEST_SYNC)

        muxer.start()

        val frameRate = videoFormat.getInteger(MediaFormat.KEY_FRAME_RATE)
        val videoSampleTime = 1000 * 1000 / frameRate

        while (!sawEOS) {
            videoBufferInfo.offset = offset
            videoBufferInfo.size = videoExtractor.readSampleData(videoBuf, offset)

            if (videoBufferInfo.size < 0) {
                sawEOS = true
                videoBufferInfo.size = 0

            } else {
                videoBufferInfo.presentationTimeUs += videoSampleTime
                videoBufferInfo.flags = videoExtractor.sampleFlags
                muxer.writeSampleData(videoTrack, videoBuf, videoBufferInfo)
                videoExtractor.advance()
            }
        }

        var sawEOS2 = false
        var sampleTime = 0L
        while (!sawEOS2) {

            audioBufferInfo.offset = offset
            audioBufferInfo.size = audioExtractor.readSampleData(audioBuf, offset)

            if (audioBufferInfo.presentationTimeUs >= duration) {
                sawEOS2 = true
                audioBufferInfo.size = 0
            } else {
                if (audioBufferInfo.size < 0) {
                    sampleTime = audioBufferInfo.presentationTimeUs
                    audioExtractor.seekTo(0, MediaExtractor.SEEK_TO_CLOSEST_SYNC)
                    continue
                }
            }
            audioBufferInfo.presentationTimeUs = audioExtractor.sampleTime + sampleTime
            audioBufferInfo.flags = audioExtractor.sampleFlags
            muxer.writeSampleData(audioTrack, audioBuf, audioBufferInfo)
            audioExtractor.advance()
        }

        muxer.stop()
        muxer.release()
        videoExtractor.release()
        audioExtractor.release()
        afdd.close()
    } catch (e: Exception) {
        LogUtils.e(TAG, "Mixer Error:" + e.message)
    }
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Android

Audio

video

MediaMuxer

如何混合（合并）视频和音频，以便音频在输出视频中循环，以防持续时间太短？的相关文章

Android 中多个蓝牙连接的自定义 UUID

我有一个 Android 设备作为服务器连接到多个蓝牙 Android 客户端我了解 UUID 的概念以及它的独特之处我的问题是我可以为连接到我的服务器的所有客户端使用相同的 UUID 吗如果没有我如何以编程方式为我的客户端生成
Android短音的正确播放方法？

我正在创建一个应用程序屏幕上将有多个图像这些图像将是按钮点击时会播放短促的声音我对此进行了研究只能找到我当前用来播放声音的方法这似乎根本没有响应我希望声音能够快速播放并且能够响应多次快速点击我不确定这在 Android 中是
Android Studio：XML 布局中的“包装在容器中”

编辑 XML 布局文件时 Eclipse 有一项称为包裹在容器中的功能重新格式化 gt Android gt 可让您选择一个或多个视图并在其周围包裹您选择的布局 Android Studio中有类似的东西吗目前正在实施中问题 69
如何正确释放Android MediaPlayer

我正在尝试向我的 Android 应用程序添加一个按钮当点击该按钮时它会播放 MP3 我已经让它工作了但没有办法释放 mediaPlayer 对象因此即使在我离开活动后它仍然会继续播放如果我在react 方法之外初始化MediaPl
按下按钮时应用不同的样式

有没有办法在按下按钮时将样式应用于按钮如果我有一种风格样式 xml
如何在我现有的 Android 应用程序中使用 Telegram API（包括聊天应用程序）？

我想使用 telegram API 在我现有的 Android 应用程序中开发聊天功能我不知道如何实施我认为看看Telegram 数据库库测试版从这里TDLib https core telegram org tdlib 俄语但
自定义首选项中的android首选项水平分隔线？

我创建了自己的自定义首选项对象来扩展首选项我创建它们只是因为这些自定义数据类型没有首选项一切正常但我的自定义首选项没有相同的外观因为它们缺少系统首选项对象具有的水平分隔线我已经查找了创建水平分隔线的代码但我找不到它是在哪里完成的
以编程方式将文本颜色设置为主要 Android 文本视图

如何设置我的文本颜色TextView to android textColorPrimary以编程方式我已经尝试了下面的代码但它将 textColorPrimary 和 textColorPrimary Inverse 的文本颜色始终设
Android：后台Activity可以执行代码吗？

后台的活动是否被视为正在运行并且可以执行代码还是处于挂起状态他们暂停了活动生命周期 http developer android com reference android app Activity html ActivityLi
从 BroadcastReceiver 类调用活动方法

我知道我可以做一个内部接收器类来调用接收器中的任何方法但我的主要活动太大了要做的事情也很多因此我需要一个扩展广播接收器的类但它不是内部类并且可以从我的主要活动中调用一种方法我不知道是否可能但我的活动是家庭活动和 single
Android - AudioRecord类不读取数据，audioData和fftArray返回零

我是 Android 新手一直在开发音调分析器应用程序最低 SDK 8 我读了很多关于如何实现 Audiorecord 类的文章但我想知道为什么它在我录制时不读取任何数据我尝试显示 audioData 和 fftArray 的值但
使用片段时应用程序崩溃

我正在处理碎片和我的代码中有一个我找不到的问题 logcat 指向我的一个片段中的这段代码 Override public View onCreateView LayoutInflater inflater ViewGroup conta
okhttp 获取失败响应

我已经在我的 android 客户端中实现了 okhttp 来进行网络调用当我收到失败响应时我会收到失败代码以及与该代码相关的文本作为消息但我没有收到服务器发送给我的自定义失败响应在我实施的代码中的失败响应中我收到的消息只是错误
Android 2.3 模拟器在更新位置时崩溃

我正在使用 Eclipse 编写和调试 Android 应用程序我需要做的事情之一是更新设备的位置因此我尝试使用模拟器控制窗口中的位置控制面板在手动选项卡上我选择十进制输入有效的纬度和经度然后单击发送不幸的是接下来发
Dagger 2 没有生成我的组件类

我正在使用 Dagger 2 创建我的依赖注入几个小时前它还在工作但现在不再生成组件这是我创建组件的地方 public class App extends Application CacheComponent mCacheCompon
通过电子邮件发送文本文件附件

我正在尝试附加一个文本文件以便通过电子邮件发送但每当我打开电子邮件应用程序时它都会说该文件不存在请帮助 Intent i new Intent Intent ACTION SEND i setType text plain i put
Dagger 2 中“HasFragmentInjector”的实际用法是什么

我之前已经实现了 dagger2 v2 2 但现在他们也添加了 dagger android 部分所以我正在用它创建示例项目我知道旧的方法论 Provide and Modules and 成分等注释但从 Dagger 2 8 开始
发布的 Android apk 出现错误“包文件未正确签名”

我最近将我的应用程序上传到 Android 市场但是由于错误下载时它拒绝运行包文件未正确签名我首先使用 eclipse 发布了数据包右键单击导出创建密钥库然后发布但它拒绝工作然后我下载了 keytool 和 jarsigne
Android 屏幕方向错误

我使用的是 Android HTC HERO 2 1 版本我写的活动
Git 实验分支还是单独的实验存储库？

我正在开发一个 Android 应用程序并且在整个开发周期中一直使用 Git 现在我想构建并发布实验性功能供人们尝试和安装同时仍将原始的稳定的应用程序安装在他们的设备上现在这意味着我需要使用不同的包名称这会更改开发项目中的一

随机推荐

R - Riverplot 包使用 - 桑基图

我尝试使用绘制桑基图河图包 http logfc wordpress com 2014 02 27 riverplot 到一月然而我的案例非常复杂我还没有找到修复图表的方法所以我发布了这个问题希望这有助于找到我的问题的答案或改进包
在Python中查找两个给定路径之间的公共文件的有效方法

我编写了代码来查找两个给定文件夹路径之间的通用文件说明所有级别的子文件夹如果存在请建议是否有更有效的方法如果给出具有多层子文件夹的文件夹则花费的时间太长 def findCommonDeep self path1 path2
For 循环不能在同一个文件描述符上工作两次[重复]

这个问题在这里已经有答案了该代码没有进入第二个 for 循环我没有在任何地方修改文件描述符为什么会发生这种情况 import os import re path home ajay Desktop practice ajay txt
Jquery脚本删除表单集合中的所有项目

我有一张桌子 table class Products tr th ProductId th th Productname th th Quantity th th UnitPrice th tr tr td td tr table
我无法让 Netbeans C++ 工作，我做错了什么？

我最近下载了 Netbeans 但无法让 C 组件正常工作当我尝试编译示例程序时出现以下错误 c Users Documents NetBeansProjects Welcome 1 C Program Files x86 MinGW
遵循 C 中的符号链接

我正在编写一个 C 程序给定符号链接的名称该程序将打印链接指向的文件或目录的名称关于如何开始有什么建议吗 The readlink 已经提到的功能是答案的一部分但是您应该注意它可怕的接口它不会以 null 终止响应字符串您可能
Gradle 未使用 ext:pom 导入依赖项

我想要导入库 org geotools 添加原料compile group org geotools name geotools version 16 1 or compile group org geotools name geotool
如何将 HTML 字符串绑定到 Android 应用程序中的 Web 视图？

我目前有一个 android TextView 它绑定到一个可能包含或不包含 HTML 的字符串
如何使异步 Dart 调用同步？

我正在为一家德国公司评估 Dart 将各种 Java 程序移植到 Dart 中并对结果进行比较和分析在浏览器中 Dart 轻而易举地获胜对于服务器软件性能似乎是一个严重的问题参见我的这个问题 https stackoverflow
如何根据支持 bean 条件有条件地显示 p:dialog

有什么方法或正确的方法有条件的根据支持 bean 条件在 primefaces 上显示对话框代码如下所示
如何将 1400-1500 转换为下午 2 点至下午 3 点？

我正在从服务接收表示时隙的数据作为字符串格式如下 1500 1600 这意味着下午 3 点到 4 点我将列出这些内容例如 1200 1300 1300 1400 1400 1500 我必须在用户界面中将其表示为中午 12 点至下午
`format()` 和 `str()` 有什么区别？

gt gt gt format sys stdout lt io TextIOWrapper name
'=' sp_executesql 附近的语法不正确

我需要delete all rows在一些table where值是空字符串我有多个名称相似的表我尝试执行字符串中的sql语句 DECLARE sql AS NVARCHAR MAX DECLARE emptyValue AS NVAR
如何使ajax请求异步？

我想让一些ajax请求异步比如两个Ajax 第一个Ajax不需要完成第二个请求就可以发生 ajax url urlone async true complete function console log 1 type post data
创建静态库并使用 premake 链接到它

我目前正在尝试学习如何使用 premake 4 以便将其应用到 OpenGLsdk http www opengl org sdk 我目前正在尝试制作一个 Visual Studio 2010 解决方案该解决方案构建 2 个项目一个是静
如何触发 Tab 键事件？

How do we fire a tab key pressed event deliberately in Java I also want to know how to fire a Shift tab key pressed even
使用 Angular 7 上传文件时，表单数据并不总是在 Chrome 中发送

当我的 Angular 7 应用程序使用 Angular file 上传文件时表单数据并不总是通过 Chrome macOS 发送我使用 Firefox 或 Safari 没有任何问题至少上次发生这种情况时刷新 Chrome F5
java中的try/catch与null检查

有时我面临必须编写一段这样的代码通常它有更多嵌套的 if 和更复杂的结构但对于示例来说就足够了 public void printIt Object1 a if a null SubObject b a getB if b null S
视频在回溯时卡住 (C++) (QT) (libvlc)

我正在使用 libvlc 使用 QT 4 在我的 GUI 应用程序上播放视频当我向前搜索视频时它工作正常但是当我向后搜索视频时它会卡住我的意思是帧不会改变而我的回调函数是 videopostrender没有接到任何电话 void
如何混合（合并）视频和音频，以便音频在输出视频中循环，以防持续时间太短？

背景我需要将视频文件和音频文件合并为一个视频文件以便输出视频文件的持续时间与输入视频文件的持续时间相同输出文件中的音频将仅是输入音频文件的音频如果太短则会循环到最后如果需要可以在最后停止这意味着一旦音频播放完毕而视频尚未播放

如何混合（合并）视频和音频，以便音频在输出视频中循环，以防持续时间太短？

背景

存在的问题

我尝试过的

问题

如何混合（合并）视频和音频，以便音频在输出视频中循环，以防持续时间太短？ 的相关文章

随机推荐

热门标签

如何混合（合并）视频和音频，以便音频在输出视频中循环，以防持续时间太短？的相关文章