esp32 完整开发指南_【安信可ESP32语音开发板专题①】ESP32-A1S音频开发板之离线语音识别控制LED灯

2023-11-14

本博客学习由 安信可开源团队 潜心编写，做ESP32-A1S离线语音初步入门技术交流分享。如有不完善之处，请留言，本团队及时更改。 一、前言

离线语音，顾名思义：在不连网络的状态下，产品能识别语音指令并执行相应的控制输出。
安信可基于乐鑫ESP32芯片开发的ESP32-A1S开发板智能语音助手，可支持唤醒词引擎（WakeNet），离线语音命令识别引擎（MultiNet）和前端声学算法。 ESP32-A1S 将 ESP32 与人工智能（AI）语音识别相结合，是安信可完整的 AIoT 解决方案的一部分。下面使用我的开发笔记，将讲解如何使用ESP32-A1S开发板轻松的实现离线语音控制LED灯。

二、离线语音框架
2.1 算法模型 WakeNet 和识别模型 MultiNet

既然是语音唤醒，本地识别，就离不开算法模型和识别模型，而ESP32-A1S是基于乐鑫一个仓库esp_sr为基础的。而 esp_sr 提供语音识别相关方向算法模型，目前主要包括三个模块：

唤醒词识别模型 WakeNet
语音命令识别模型 MultiNet
声学算法：集成了回声消除 AEC(Acoustic Echo Cancellation)，自动增益调节 AGC(automatic_gain_control)，噪声抑制 NS(Noise Suppression)，语音活动检测 VAD(Voice Activity Detection) 和麦克风阵列算法(Mic Array Processing)。

2.2 唤醒词识别

唤醒词模型 WakeNet，致力于提供一个低资源消耗的的高性能模型，支持类似“Alexa”，“天猫精灵”，“小爱同学”等唤醒词的识别。

目前，ESP32的唤醒词仅仅开放了如下几个：“Hi，乐鑫”，“你好小智”，“你好小鑫”，“hi，Jeson”等唤醒词。

2.3.2 语音命令识别

命令词识别模型 MultiNet ，致力于提供一个灵活的离线语音命词识别框架。用户可方便根据需求自定义语音命令，无需重新训练模型。

目前模型支持类似“打开空调”&

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

esp32 完整开发指南_【安信可ESP32语音开发板专题①】ESP32-A1S音频开发板之离线语音识别控制LED灯的相关文章

RunTime.getRunTime().addShutdownHook的用法

RunTime getRunTime addShutdownHook的用法常识的Blog的博客 CSDN博客
图的五种最短路径算法

本文总结了图的几种最短路径算法的实现深度或广度优先搜索算法费罗伊德算法迪杰斯特拉算法 Bellman Ford 算法 1 深度或广度优先搜索算法解决单源最短路径从起点开始访问所有深度遍历路径或广度优先路径则到达终点节点的路径有多
VLC 不能识别带空格的URL

转自 http blog csdn net pizicai105 article details 5414944 7 VLC无法识别URL带空格需要进行转义转义符为 2B 空格转义符为或 20 转义符为 2F 转义符为 3F 转义符
Regular Expressions --正则表达式官方教程

http docs oracle com javase tutorial essential regex index html This lesson explains how to use the java util regex API
（11）DataFrame索引和切片

内容访问对列进行访问对行进行访问对元素进行访问切片 import numpy as np import pandas as pd from pandas import Series DataFrame arr np random
HikariPool连接池的使用

HikariDataSource datasource new HikariDataSource xxxx Connection cn datasource getConnection try cn doXXX finnally conne
三、ElasticSerach-映射操作

上一章学习了Es的文档操作 ElasticSerach 文档操作本章我们来学习索引中映射的操作 1 创建映射可以在创建索引的时候就创建可以参考一 ElsaticSerach 索引操作创建索引的时候没有添加映射可以后面添加创建索引
牛客网-网易2018笔试第7题 -合唱（DP问题）

题目描述小Q和牛博士合唱一首歌曲这首歌曲由n个音调组成每个音调由一个正整数表示对于每个音调要么由小Q演唱要么由牛博士演唱对于一系列音调演唱的难度等于所有相邻音调变化幅度之和例如一个音调序列是8 8 13 12 那么它的难度等于
gganimate:构建R语言可视化gif动图

gganimate简介 gganimate是一款基于ggplot2的动态可视化扩展包简单就是将ggplot2绘图对象转为gif动图的形式这对于一些统计分析原理和可视化展示尤为重要可以让抽象的数理理论更加形象化也便于理解和方便课堂教学
什么是SSC(时钟扩频)，为什么要时钟扩频

SSC全称Spread Spectrum Clocking 即扩频时钟由于信号的辐射主要是由于信号的能量过于集中在其载波频率位置导致信号的能量在某一频点位置处的产生过大的辐射发射因此为了进一步有效的降低EMI辐射芯片厂家在设计芯片时
Vijava 学习笔记之VirtualMachine(基础配置信息{VirtualMachineConfigSummary})

Vijava 代码 package com vmware client import com vmware util Session import com vmware vim25 VirtualMachineConfigSummary i
Docker搭建kafka集群

Docker搭建kafka集群集群规划镜像版本 kafka为什么需要依赖zookeeper 创建docker网络搭建zk集群新建文件docker compose zk yml 启动搭建kafka集群新建三个挂载文件挂载原因挂
TIA博途S7-1200学习笔记——数据类型

目录一概述二基本数据类型 1 二进制数 1 1 BOOL 位 1 2 BYTE 1 3 WORD 1 4 DWORD 1 5 LWORD 2 整数 2 1 SINT 2 2 USINT 2 3 INT 2 4 UINT 2 5 DI
注解@TableName、@TableField

目录 TableName value 当数据库名与实体类名不一致或不符合驼峰命名时需要在此注解指定表名不加这个注解默认将实体类的小写形式在db中寻找 TableField 字段注解该注解用于标识非主键的字段将数据库列与 JavaBe
幂函数与指数函数的区别

a表示底数 n表示指数 a n叫做幂幂就是一个数和它自己相乘的积二个乘是二次幂三个乘是三次幂四个乘是四次幂象三五这样的幂是奇次幂二四是偶次幂负数乘负数是正数负数乘正数是负幂函数与指数函数的区别指数函数自变量 x 在指
关于欧拉角的问题

一简单介绍自己主要做一个知识记录想着学了还是要写点东西的首先我们可以把欧拉角看成是描述方位的一种方法我们可以用欧拉角来表示旋转也可以用四元数以及用矩阵来表示旋转欧拉角是一种常用的描述方位的方法在这里简单的介绍下方向和方位的
阿里巴巴“三板斧”管理到底是什么？

阿里巴巴从最初的以马老师为首的18罗汉创始员工发展至今拥有4万员工从杭州的湖畔花园起家到去美国纽约证券交易所上市敲钟阿里巴巴如何走到现在它背后的管理机制是怎样的我们到底向它学什么阿里巴巴管理总纲阿里巴巴九板斧中层能力三板斧
哈希表与树的介绍

前言该篇文章主要带我们认识什么哈希表和树为我们在研究各个数据结构的实现及扩展算法有个基本的认识哈希表特点数组寻址容易数据连续存储空间链表插入与删除容易放在堆内存中对象存储并不连续哈希表寻址容易插入删除也容易的
多模态机器翻译

摘录自机器翻译基础与模型东北大学文章目录 1 背景 2 机器翻译需要更多的上下文 3 图像翻译 4 基于图像增强的文本翻译 4 1 基于特征融合的方法 4 2 基于联合模型的方法 5 参考文献 1 背景基于上下文的翻译是机器翻译的

随机推荐

js实例学习笔记
Elasticsearch ILM (index lifecycle management): logstash vs fluentd

ILM Elasticsearch在升级到7 x之后推出了一项新功能ILM 用于管理被大家诟病已久的index lifecycle management问题只需要在kibana内简单配置就可以管理以前我们不得不设置cronjob去删除
C#比较运算符及解析

文章目录博主写作不容易孩子需要您鼓励万水千山总是情先点个赞行不行比较运算符得出的结果是逻辑型 bool 即 True 或 False 比较运算符又称关系运算符我们可以把它理解为一种判断判断的结果是真或者是假关系表达式的返回值
Android 权限大全-转载

Android 权限大全转自博客园博客园链接 Key android permission ACCESS CHECKIN PROPERTIES Title 访问检入属性 Memo 允许对检入服务上传的属性进行读写访问普通应用程序不能
初入HTML

1 HTML语言用来做什么 html语言专门用来描述网页它属于一种标记语言它是由一组标签构成 2 HTML元素一个HTML元素是包含了开始标签和结束标签当然还有一些是单标签例如 p 段落标签 p 双标签 br 换行标签单标签
openlayers地图坐标coordinate转换为屏幕像素坐标pixel

openlayers地图坐标coordinate转换为屏幕像素坐标pixel 网上查资料试了很多人的方法需要各种转换但没成功后来发现openlayers的map对象自带该方法记录下来希望帮助到大家方法说明获取坐标的像素坐标这将
随机森林补充缺失值

导入必要的库 import numpy as np import pandas as pd from sklearn ensemble import RandomForestRegressor 读取数据 data data all1 找出所
3D数学基础——向量与矩阵变换

向量相乘 1 点乘两个向量的点乘等于他们的数乘结果乘以两个向量之间家教的余弦值 v k v k cos cos v k v k 通过点乘的结果计算两个非单位向量的夹角 2 叉乘叉乘只在3d空间中有定义他需要两个不平行向量作为输入生成
nvm install node没反应_LINUX使用nvm安装node，nrm的使用

为什么要使用nvm来安装node 我们在开发过程中特别是协作开发时通常会对具体的node的版本有限制我们使用nvm可以轻松解决这个问题 nvm安装node的好处就是可以切换node版本用起来方便所以介绍下如何使用nvm安装node
【Vs Code 学习笔记】

Vs Code 远程连接服务器详细教程默认你已经安装好了Vs Code 1 如果没有请参考官网链接 https code visualstudio com 直接安装就可以了 2 打开VsCode 你可以看到如下界面然后在按照如下操作下
Java的Properties属性集、获取项目路径的3种方式（干货满满）

属性集介绍集合家族中有个成员java util Properties 它继承于Hashtable Properties是使用键值结构存储数据的但它最大的特点是具有持久化功能持久化内存 gt 硬盘持久化的过程必须依赖于IO流对IO
MyBatis执行器与新增返回主键问题

前提在写需求时碰到一个问题在新增加一条数据时需要返回主键并进行后续操作发现当前项目并不能返回主键正常返回主键代码 1
PTA C 7-3 计算职工工资

给定N个职员的信息包括姓名基本工资浮动工资和支出要求编写程序顺序输出每位职员的姓名和实发工资实发工资基本工资浮动工资支出输入格式输入在一行中给出正整数N 随后N行每行给出一位职员的信息格式为姓名基本工资浮动工资
C++继承

继承的概念继承 inheritance 机制是面向对象程序设计使代码可以复用的重要的手段它允许程序员在保持原有类特性的基础上进行扩展增加功能这样产生新的类称为派生类继承呈现了面向对象程序设计的层次结构体现了由简单到复杂的认知过
maven 报错Failed to execute goal org.apache.maven.pluginsmaven-archetype-plugin3.2

新手走过各种各样的坑 idea中maven基础配置中总是出现各种各样的错误在网上找了一些资料发现并没有找到切入主题的解决方法走过的坑总是记忆尤新 idea第一次配置maven 提示如下所示错误仔细检查了一个maven的配置文件发现
正态分布函数_从微积分角度证明“正态分布密度函数”

本篇我们来证明一个常见的优美的积分等式聪明你是否看出如下等式曾在哪里出现过呢没错如下和正态分布中概率密度函数很像但我们仅从积分学的角度来分析正面它证明它灵活的数学技巧你准备好了吗因为e x 2是关于x的偶函数所以我们明显可以想
安装SAS可能遇到的各种问题

近日为了提升数据分析的效率准备开始学习SAS相关内容结合自身已经掌握的Python 希望在数据分析挖掘方向走的越来越远下面来分享下我安装SAS过程中遇到的各种问题真是一个一个坑走过来的系统环境 Windows 10 安装版本
在对话框中实现预览图形文件的功能

一使用 acdbDisplayPreviewFromDwg 函数 1 引用说明此功能获取由指定的图形的预览图像如果有 pszDwgfilename 将其显示在由HWND参数pPreviewWnd标识的窗口中图像尺寸最大变化不超过25
Anaconda3最新换国内源教程，中科大源或者清华源

环境 ubuntu16 04 anaconda python 3 7 中科大源 conda config add channels https mirrors ustc edu cn anaconda pkgs main conda con
esp32 完整开发指南_【安信可ESP32语音开发板专题①】ESP32-A1S音频开发板之离线语音识别控制LED灯

本博客学习由安信可开源团队潜心编写做ESP32 A1S离线语音初步入门技术交流分享如有不完善之处请留言本团队及时更改一前言离线语音顾名思义在不连网络的状态下产品能识别语音指令并执行相应的控制输出安信可基于乐鑫ESP

esp32 完整开发指南_【安信可ESP32语音开发板专题①】ESP32-A1S音频开发板之离线语音识别控制LED灯

esp32 完整开发指南_【安信可ESP32语音开发板专题①】ESP32-A1S音频开发板之离线语音识别控制LED灯 的相关文章

随机推荐

热门标签

esp32 完整开发指南_【安信可ESP32语音开发板专题①】ESP32-A1S音频开发板之离线语音识别控制LED灯的相关文章