使用CamerX android进行视频录制时使用语音识别器API

2024-03-28

我目前正在使用cameraX 来录制带有音频的视频，并且工作得很好，但是现在我必须在录制视频时使用SpeechRecognizer 并获取用户所说内容的转录。

UPDATE:

我尝试从视频中提取音频，然后将其作为额外内容提供给意图，但它不起作用。因此，我考虑直接从 SpeechRecognizer 意图获取音频，但这是一个死胡同，因为文档中的任何地方都没有提到 uri 或临时文件。我现在尝试在语音识别器开始监听时启动媒体记录器，但这仅在第一次监听时有效。

我基本上已经尝试了一切，但进展为零，有人有新想法吗？

    private fun doWhileRecording(state:UiState){
    when(state){
     UiState.IDLE -> {
            
                    }
                    UiState.RECORDING -> {
                        tts!!.stop()
                        startSpeechToText()
             
                    }
                    UiState.FINALIZED -> {
                       
                    }
    }
    
    private fun startSpeechToText() {
            val speechRecognizer = SpeechRecognizer.createSpeechRecognizer(this.requireContext())
            val speechRecognizerIntent = Intent(RecognizerIntent.EXTRA_AUDIO_INJECT_SOURCE)
            speechRecognizerIntent.putExtra(
                RecognizerIntent.EXTRA_LANGUAGE_MODEL,
                RecognizerIntent.LANGUAGE_MODEL_FREE_FORM
            )
            speechRecognizerIntent.putExtra(RecognizerIntent.EXTRA_LANGUAGE, Locale.getDefault())
    
            speechRecognizer.setRecognitionListener(object : RecognitionListener {
                override fun onReadyForSpeech(bundle: Bundle?) {
                    Log.i("STT","ready")
                }
                override fun onBeginningOfSpeech() {
                    Log.i("STT","begin")
                   startRecordingAudio()
                }
                override fun onRmsChanged(v: Float) {}
                override fun onBufferReceived(bytes: ByteArray?) {}
                override fun onEndOfSpeech() {}
                override fun onError(i: Int) {}
    
                override fun onResults(bundle: Bundle) {
                    val result = bundle.getStringArrayList(SpeechRecognizer.RESULTS_RECOGNITION)
                    if (result != null) {
                        // result[0] will give the output of speech
                        Log.i("STT","you said: ${result[0]}")
                      stopAudioRecording()
                    }else{
                        Log.i("STT","results null boo")
                    }
                }
                override fun onPartialResults(bundle: Bundle) {}
                override fun onEvent(i: Int, bundle: Bundle?) {}
            })
            // starts listening ...
            speechRecognizer.startListening(speechRecognizerIntent)
        }

 private fun startRecordingAudio() {
    
            // below method is used to initialize
            // the media recorder clss
            mRecorder = MediaRecorder()

            // below method is used to set the audio
            // source which we are using a mic.
            mRecorder.setAudioSource(MediaRecorder.AudioSource.VOICE_RECOGNITION)
            mRecorder.setOutputFormat(MediaRecorder.OutputFormat.THREE_GPP)

            mRecorder.setAudioEncoder(MediaRecorder.AudioEncoder.AMR_NB)

            mRecorder.setOutputFile(audioFileRecorded.path)
            try {

                mRecorder.prepare()
            } catch (e: IOException) {
                Log.e("TAG", "prepare() failed")
            }
            // start method will start
            // the audio recording.
            mRecorder.start()


    }
private fun stopAudioRecording(){
        mRecorder.stop();

        // below method will release
        // the media recorder class.
        mRecorder.release()

}

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Android

SpeechRecognition

androidcamerax

androidspeechapi

使用CamerX android进行视频录制时使用语音识别器API 的相关文章

使用workmanager时Firestore脱机持久性错误

我正在使用一个WorkManger定期从我的中检索信息Firestore当应用程序处于后台和前台时的数据库此信息用于根据状态更新 UI 因此不同的状态会添加或删除 UI 的不同部分第一次运行时效果很好但是一旦应用程序处于后台并且Wo
React Native 从 JavaScript 代码内部访问 strings.xml

有没有办法访问当前值android app src main res values strings xml从 JavaScript 代码内部我想为每个构建放置不同的端点 URL 但我什至无法检测到反应本机代码内的构建类型而不必求助于 D
StrictMode 策略违规：我的应用程序中存在 android.os.strictmode.LeakedClosableViolation？

Android 开发新手第一次在我的应用程序上尝试 StrictMode 我注意到以下内容并想知道这是否是我的应用程序或库中的问题我不太清楚谢谢你 D StrictMode StrictMode policy violation a
Sqlite数据库生命周期？关闭应用程序后它会被删除吗？

我正在遵循一个简单的教程该教程创建一个从 SQLiteOpenHelper 扩展的类并创建一个包含一个表和 5 行的数据库好的但我需要更多地了解 android Sqlite 数据库例如如果应用程序关闭或手机关机会发生什么数据
Android - 从资产中解析巨大（超大）JSON 文件的最佳方法

我正在尝试从资产文件夹中解析一些巨大的 JSON 文件我如何加载并添加到 RecyclerView 我想知道解析这种大文件大约 6MB 的最佳方法是什么以及您是否知道可以帮助我处理此文件的良好 API 我建议您使用GSON lib h
Android 30+ 中的视频捕获意图 - 只有所有者才能与待处理项目交互

我正在尝试在我的应用程序上捕获视频它可以在 android API 30 以下运行但不能在 30 以上运行似乎在 sdk 30 之后 android 不允许完全读取外部存储作用域存储我目前遇到这个错误 java lang Ille
CardView 圆角获得意想不到的白色

When using rounded corner in CardView shows a white border in rounded area which is mostly visible in dark environment F
如何在android中获取Camera2 API的当前曝光

In android hardware Camera旧的我使用下面的代码获取当前曝光并获取它Camera Camera Parameters param mCamera getParameters currentExposure para
计数物体和更好的填充孔的方法

我是 OpenCV 新手正在尝试计算物体的数量在图像中我在使用 MATLAB 图像处理工具箱之前已经完成了此操作并在 OpenCV Android 中也采用了相同的方法第一步是将图像转换为灰度然后对其进行阈值计算然后计算斑点的数
当文本输入聚焦在 React Native for Android 的底部工作表上时，视图移出屏幕

我正在使用图书馆 https github com osdnk react native reanimated bottom sheet https github com osdnk react native reanimated bott
Android 模拟器插件无法初始化后端 EGL 显示

我在 Cloudbees 上设置了 Jenkins 作业并且可以在那里成功签出并编译我的 Android 项目现在我想在 android 模拟器中运行一些 JUnit 测试并添加 Android 模拟器插件我将显示模拟器窗口选项设
是否必须删除 Intent extra？

这可能是一个愚蠢的问题但是是否有一条规则规定消费活动必须显式删除 Intent 额外内容或者只有在回收 Intent 对象时才如此换句话说如果我总是通过执行以下操作来链接到下一个活动 Intent i new Intent MyCu
带有 EditText 和 Spinner 的对话框

我有一个按钮单击后会弹出一个对话框我希望对话框有一个EditText and a Spinner对话框内我不知道如何设置它的视图我有一个代码AlertDialog它有效只是EditText and Spinner我需要将其放入其中
发布android后更改应用内购买项目的价格

在 Google Play 上发布后是否可以更改应用内购买商品的价格我假设该应用程序也已发布完整的在线文档位于http developer android com http developer android com也http sup
获取当前 android.intent.category.LAUNCHER 活动的实例

我创建了一个库项目并在多个应用程序之间共享我实现了一个简单的会话过期功能该功能将在一段时间后将用户踢回到登录屏幕登录屏幕活动是我的主要活动因此在清单中它看起来像这样
如何发布Android .aar源以使Android Studio自动找到它们？

我正在将库发布到内部 Sonatype Nexus 存储库 Android Studio 有一个功能可以自动查找通过 gradle 引用的库的正确源我将 aar 的源代码作为单独的 jar 发布到 Nexus 但 Android Stu
.isProviderEnabled(LocationManager.NETWORK_PROVIDER) 在 Android 中始终为 true

我不知道为什么但我的变量isNetowrkEnabled总是返回 true 我的设备上是否启用互联网并不重要这是我的GPSTracker class public class GPSTracker extends Service imp
如何在Xamarin中删除ViewTreeObserver？

假设我需要获取并设置视图的高度在 Android 中众所周知只有在绘制视图之后才能获取视图高度如果您使用 Java 有很多答案最著名的方法之一如下取自这个答案 https stackoverflow com a 24035591
Crashlytics 出现 Android Studio 构建错误

我正在尝试将 CrashLytics 与 Android Studio 和 gradle 一起使用但出现一个令人困惑的错误 java lang NoSuchMethodError 我的 build gradle 是 buildscript
强制 Listview 不重复使用视图（复选框）

我做了一个定制Listview 没有覆盖getView 方法 Listview 中的每个项目都具有以下布局联系布局 xml

随机推荐

当我运行“gatsbydevelopment”时，安装“sharp”模块出现错误，显示错误

gatsby develop success openly and validate gatsby configs 0 005 s error Something went wrong installing the sharp module
无法在 go 中用作赋值类型

当我编译代码时收到以下错误消息不知道为什么会发生有人可以帮我指出为什么吗先感谢您不能使用 px InitializePaxosInstance val 类型 PaxosInstance 作为在赋值中输入 PaxosInstanc
Laravel 5.2 队列忽略 .env

我有一个 Laravel 5 2 应用程序当用户购买产品时它会发送几封电子邮件电子邮件视图包含对一些图像的引用如下所示 img src 这在我拥有的所有 3 个环境中都运行良好本地登台和生产 asset 使用每个环境中配置的 AP
验证码解码

我见过一些验证码使用 javascript php 等进行解码他们是如何做到的比如很受欢迎的超级上传 site s 验证码也已被解码 http herecomethelizards co uk mu captcha 我是一名图像处理专家
自定义按钮的前景色（ControlPresenter）

我正在尝试在 App xaml 中定义全局按钮样式它基本上按我的预期工作但是我只是不知道如何让前台正常工作无论我做什么我都会获得默认 TextBlock 的样式它将颜色设置为白色
带有多个子视图参数的 ui-sref 不起作用

我在我的应用程序上使用 Angular 的 ui router 来尝试路由到主视图的子视图主进程和子进程都有自己的关联 ID 目前我可以导航到父级但我到子级的链接不起作用在我的 Application js 中 stateProvid
C#：在运行时获取类型参数以传递给通用方法[重复]

这个问题在这里已经有答案了通用方法是 public void PrintGeneric2
在 AlertDialog 中设置单选按钮和文本的样式

I want to show a radio list inside an AlertDialog with custom styling something like 因此我创建了一个自定义主题并将其作为参数提供给 AlertDialo
Kotlin 协程 - 使用协程作用域/上下文的不同选项？

我是 Kotlin Coroutines 的新手我注意到有两种不同的使用方式CoroutineScope 在任何函数中选项 1 如下 CoroutineScope Dispatchers Default launch expensive
PHP - 纯文本电子邮件

如何将其转换为纯文本电子邮件 bound text md5 uniqid time headers MIME Version 1 0 r n Content Type multipart mixed boundary PHP mixed b
如何在网络连接以及用户登录时接收事件

我有一项正在运行的服务并且我希望在以下情况下收到通知 a 网络已连接 b 当用户登录到机器时我怎样才能做到这一点 C NET 2 0 using Microsoft Win32 using System Net NetworkInfor
将数组转换为 IEnumerable

假设你有基本的Employee类如下 class Employee public string Name public int Years public string Department 然后在一个单独的类中我有以下代码片段我想我理
如何判断 Vim 会话当前使用哪种颜色方案

You can setVim 配色方案通过发布 colorscheme SCHEME NAME 但是奇怪的是您无法通过发出来获取当前使用的方案 colorscheme 因为这导致 E471 Argument required 我也没有看
删除 Jqplot 堆积条形图上的零值点标签

我在删除 Jqplot 堆积条形图中的零点标签时遇到问题我尝试了 hideZero 但它根本不起作用我尝试了不同的事情不知道出了什么问题我导入了以下包 jqplot barRenderer min js jqplot canva
是否可以在 Snowflake Snowpark 中的 Python UDF 中编写 SQL 查询？

我正在尝试在雪花中创建一个新的 UDF 函数在此 UDF 中我需要编写一个 SQL 查询来返回表列表然后我需要围绕它执行一些 Python 代码如下例所示 create or replace function SnowparkPri
Android：如何使用 WhatsApp、微信以编程方式发送消息？

如何在 Android 应用程序中使用消息传递WhatsApp and WeChat 实际上要求是使用 WhatsApp 和微信免费短信发送短信我得到了解决方案在这里我发布答案以便它可以帮助其他可能有同样疑问的人通过任何应用程序
使用 .NET Native 工具链构建会导致动态对象中缺少属性的错误

我有一段代码可以获取 JSON 响应并检查是否有 error 字段 dynamic jsonResponse JsonConvert DeserializeObject responseString if jsonResponse erro
COM 返回未实现任何接口的类型

我需要通过 NET 4 0 应用程序自动执行 Adob e InDesign CS3 中的一些任务我已使用 Visual Studio 中的添加引用对话框添加了对 InDesign 类型库的引用它生成一个互操作程序集该程序集正确包
在不重新查询数据库的情况下重新排序 Rails 中的活动记录？

例如假设我有一个名为 Products 的模型并且在 Products 控制器中我有以下用于 Product list 视图的代码来显示排序的产品 products Product order params order by 想象一下
使用CamerX android进行视频录制时使用语音识别器API

我目前正在使用cameraX 来录制带有音频的视频并且工作得很好但是现在我必须在录制视频时使用SpeechRecognizer 并获取用户所说内容的转录 UPDATE 我尝试从视频中提取音频然后将其作为额外内容提供给意图但它不起作用

使用CamerX android进行视频录制时使用语音识别器API

使用CamerX android进行视频录制时使用语音识别器API 的相关文章

随机推荐

热门标签