• 介绍了一种以ARM为核心的嵌入式语音识别模块的设计与实现。模块的核心处理单元选用ST公司的基于ARMCortex-M3内核的32位处理器STM32F103C8T6。本模块以对话管理单元为中心,通过以LD3320芯片为核心的硬件单元实现语音识别功能,采用嵌入式操作系统μC/OS-II来实现统一的任务调度和外围设备管理。经过大量的实验数据验证,本文设计的语音识别模块具有高实时性、高识别率、高稳定性的优点。 语音识别电路 图3为语音识别部分原理图,参照了ICRoute发布的LD3320数据手册进行设计。L
  • 介绍了一种以ARM为核心的嵌入式语音识别模块的设计与实现。模块的核心处理单元选用ST公司的基于ARMCortex-M3内核的32位处理器STM32F103C8T6。本模块以对话管理单元为中心,通过以LD3320芯片为核心的硬件单元实现语音识别功能,采用嵌入式操作系统μC/OS-II来实现统一的任务调度和外围设备管理。经过大量的实验数据验证,本文设计的语音识别模块具有高实时性、高识别率、高稳定性的优点。 语音识别电路 图3为语音识别部分原理图,参照了ICRoute发布的LD3320数据手册进行设计。L >>
  • 来源:wang1jin.cepark.com/article/id/31069
  • 语音合成技术原理 2. 语音识别技术 我国语音识别研究工作起步于五十年代,但近年来发展很快。研究水平也从实验室逐步走向实用。从1987年开始执行国家863计划后,国家863智能计算机专家组为语音识别技术研究专门立项,每两年滚动一次。我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上有自己的特点与优势,并达到国际先进水平。目前我国中文大词汇量连续语音识别技术国际领先,在语音输入搜索交互领域突破实用门槛,说话人识别和语种识别技术荣获NIST测试冠军,并在信息安全应用中屡获战果。  语音识别
  • 语音合成技术原理 2. 语音识别技术 我国语音识别研究工作起步于五十年代,但近年来发展很快。研究水平也从实验室逐步走向实用。从1987年开始执行国家863计划后,国家863智能计算机专家组为语音识别技术研究专门立项,每两年滚动一次。我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上有自己的特点与优势,并达到国际先进水平。目前我国中文大词汇量连续语音识别技术国际领先,在语音输入搜索交互领域突破实用门槛,说话人识别和语种识别技术荣获NIST测试冠军,并在信息安全应用中屡获战果。 语音识别 >>
  • 来源:www.siac.org.cn/?s=/Index/article_detail/id/46
  • 月初我们参与了一个电商讲座活动,这个活动主要关注实际操作当中的电商分销商的一些工具和点子,可以改善他们的业务,他们也提供了一些对于新的可能影响电商行业的创新的一些远见。微软欧洲方面的一个宣讲师Frank Fuchs,也是远近闻名的搜索牛人,做了一个幻灯片,他演讲的第二天,微软发布他们针对Siri和Google Now的Cortana,同时也是Windows Phone 8.
  • 月初我们参与了一个电商讲座活动,这个活动主要关注实际操作当中的电商分销商的一些工具和点子,可以改善他们的业务,他们也提供了一些对于新的可能影响电商行业的创新的一些远见。微软欧洲方面的一个宣讲师Frank Fuchs,也是远近闻名的搜索牛人,做了一个幻灯片,他演讲的第二天,微软发布他们针对Siri和Google Now的Cortana,同时也是Windows Phone 8. >>
  • 来源:www.tuicool.com/articles/YBV3M3
  •   语音识别单元采用ATmega168作为MCU,负责控制LD3320完成所有和语音识别相关的工作,并将识别结果通过串口上传至Arduinomega2560控制器。对LD3320芯片的各种操作,都必须通过寄存器的操作来完成,寄存器读写操作有2种方式(标准并行方式和串行SPI方式)。在此采用并行方式,将LD3320的数据端口与MCU的I/O口相连。其硬件连接图如图3所示。
  •   语音识别单元采用ATmega168作为MCU,负责控制LD3320完成所有和语音识别相关的工作,并将识别结果通过串口上传至Arduinomega2560控制器。对LD3320芯片的各种操作,都必须通过寄存器的操作来完成,寄存器读写操作有2种方式(标准并行方式和串行SPI方式)。在此采用并行方式,将LD3320的数据端口与MCU的I/O口相连。其硬件连接图如图3所示。 >>
  • 来源:ee.ofweek.com/2014-03/ART-11000-2805-28792865_2.html
  • 按照上图的说法,语音识别是由语言模型和声学模型构成的。下面我就根据图上的流程说下。 一 特征提取 现在主流的特征是mfcc。具体mfcc的步骤,在我前面转的博客里也有。地址:语音信号处理之(四)梅尔频率倒谱系数(MFCC)。这里我引有知乎里的一个人的说法: 首先说一下作为输入的时域波形。我们知道声音实际上是一种波。常见的mp3、wmv等格式都是压缩格式,必须转成非压缩的纯波形文件,比如Windows PCM文件,即wav文件来处理。wav文件里存储的除了一个文件头以外,就是声
  • 按照上图的说法,语音识别是由语言模型和声学模型构成的。下面我就根据图上的流程说下。 一 特征提取 现在主流的特征是mfcc。具体mfcc的步骤,在我前面转的博客里也有。地址:语音信号处理之(四)梅尔频率倒谱系数(MFCC)。这里我引有知乎里的一个人的说法: 首先说一下作为输入的时域波形。我们知道声音实际上是一种波。常见的mp3、wmv等格式都是压缩格式,必须转成非压缩的纯波形文件,比如Windows PCM文件,即wav文件来处理。wav文件里存储的除了一个文件头以外,就是声 >>
  • 来源:www.lxway.com/4466552466.htm
  • 看了几天了,结合之前看kaldi里的训练,现在我觉得可以稍微清楚的解释这个训练过程,后面的时间赶紧看解码部分。希望你可以有所收获。 这次我们从头开始,虽然mfcc特征大家都知道,但是为了完整性还是说下吧。希望这是最后一次写训练的过程。 1.数据准备我就不说了,直接说提特征,一般来说提mfcc特征。当然在gmm-hmm中一般都是mfcc特征。mfcc特征的具体流程,这里贴一张图,大家可以参考。htk或者kaldi里都有提特征的脚本,也有源码,相信这个应该都不算难事了。  这个过程也比较清楚,这里就不多说了。
  • 看了几天了,结合之前看kaldi里的训练,现在我觉得可以稍微清楚的解释这个训练过程,后面的时间赶紧看解码部分。希望你可以有所收获。 这次我们从头开始,虽然mfcc特征大家都知道,但是为了完整性还是说下吧。希望这是最后一次写训练的过程。 1.数据准备我就不说了,直接说提特征,一般来说提mfcc特征。当然在gmm-hmm中一般都是mfcc特征。mfcc特征的具体流程,这里贴一张图,大家可以参考。htk或者kaldi里都有提特征的脚本,也有源码,相信这个应该都不算难事了。 这个过程也比较清楚,这里就不多说了。 >>
  • 来源:www.lxway.com/4492260626.htm
  • 昨天Facebook收购语音识别初创公司Wit.ai,又引发了大家对语音识别技术的关注。华尔街日报指出,该公司的技术有助于Facebook获得更多信息用于定向广告。不过其实在语音识别这个市场上竞争已经十分激烈,苹果有 Siri,微软有 Cortana,谷歌有 Google Now,这三家 IT 巨头已经分别推出了各自的语音助手产品。下面来看看这些知名的大公司都收购过什么样的语音识别公司吧: Facebook收购Wit.
  • 昨天Facebook收购语音识别初创公司Wit.ai,又引发了大家对语音识别技术的关注。华尔街日报指出,该公司的技术有助于Facebook获得更多信息用于定向广告。不过其实在语音识别这个市场上竞争已经十分激烈,苹果有 Siri,微软有 Cortana,谷歌有 Google Now,这三家 IT 巨头已经分别推出了各自的语音助手产品。下面来看看这些知名的大公司都收购过什么样的语音识别公司吧: Facebook收购Wit. >>
  • 来源:www.cyzone.cn/a/20150107/268092.html
  • 语音合成技术原理 2. 语音识别技术 我国语音识别研究工作起步于五十年代,但近年来发展很快。研究水平也从实验室逐步走向实用。从1987年开始执行国家863计划后,国家863智能计算机专家组为语音识别技术研究专门立项,每两年滚动一次。我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上有自己的特点与优势,并达到国际先进水平。目前我国中文大词汇量连续语音识别技术国际领先,在语音输入搜索交互领域突破实用门槛,说话人识别和语种识别技术荣获NIST测试冠军,并在信息安全应用中屡获战果。  语音识别
  • 语音合成技术原理 2. 语音识别技术 我国语音识别研究工作起步于五十年代,但近年来发展很快。研究水平也从实验室逐步走向实用。从1987年开始执行国家863计划后,国家863智能计算机专家组为语音识别技术研究专门立项,每两年滚动一次。我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上有自己的特点与优势,并达到国际先进水平。目前我国中文大词汇量连续语音识别技术国际领先,在语音输入搜索交互领域突破实用门槛,说话人识别和语种识别技术荣获NIST测试冠军,并在信息安全应用中屡获战果。 语音识别 >>
  • 来源:www.siac.org.cn/?s=/Index/article_detail/id/46
  • 语音是人类交流最自然、最方便的手段,因而也必然成为人机交互最自然、最方便的手段之一。语音识别技术,就是让计算机能够从人的语音中提取文字信息,让机器能够听懂人说的话,让人的语音能够转换成机器可以理解的文字的技术。从广义上来说,语音识别技术还包括声纹识别(VPR)技术,它是根据语音中所蕴涵的说话人特有的DNA信息,自动识别说话人身份的技术。 近年来,语音识别技术取得了长足的进步,云知声是其中的佼佼者,其语音识别系统是针对日益丰富多样的市场需求而推出的,为构建高价值自助语音服务提供强大、稳定、易用的核心动力引擎
  • 语音是人类交流最自然、最方便的手段,因而也必然成为人机交互最自然、最方便的手段之一。语音识别技术,就是让计算机能够从人的语音中提取文字信息,让机器能够听懂人说的话,让人的语音能够转换成机器可以理解的文字的技术。从广义上来说,语音识别技术还包括声纹识别(VPR)技术,它是根据语音中所蕴涵的说话人特有的DNA信息,自动识别说话人身份的技术。 近年来,语音识别技术取得了长足的进步,云知声是其中的佼佼者,其语音识别系统是针对日益丰富多样的市场需求而推出的,为构建高价值自助语音服务提供强大、稳定、易用的核心动力引擎 >>
  • 来源:miit.ccidnet.com/zt/2013/0218yzs/
  • LG的Whisen空调   NFC是Near Field Communication缩写,即近距离无线通讯技术。有了它,我们到家后,就可以用智能手机启动空调设置,调控到自己适宜的温度。   再有就是语音控制功能,有了它,我们的声音就可以直接给空调以语音指令,提高或降低温度。LG的语音识别技术,在这方面可以体现出最大的价值。   在不久的将来,我们将看到更多这样的产品,可能不仅限于温度控制。可能将来的智能家庭中,智能手机才会是家里的钥匙,语音识别会代替原有的家电设置操控。
  • LG的Whisen空调   NFC是Near Field Communication缩写,即近距离无线通讯技术。有了它,我们到家后,就可以用智能手机启动空调设置,调控到自己适宜的温度。   再有就是语音控制功能,有了它,我们的声音就可以直接给空调以语音指令,提高或降低温度。LG的语音识别技术,在这方面可以体现出最大的价值。   在不久的将来,我们将看到更多这样的产品,可能不仅限于温度控制。可能将来的智能家庭中,智能手机才会是家里的钥匙,语音识别会代替原有的家电设置操控。 >>
  • 来源:nt.shejis.com/xpxx/201301/article_38937.html
  • 语音识别技术可以把人的语音自动转换成文字,是人机交互的关键技术之一。该技术可以使得不同国籍的人在任何地方,任何时间,对任何事都能够通过自然语音的方式与机器进行交互,使人们能够更加方便地获取信息资源和现代化服务。中科院声学所与首都信息发展股份有限公司合作,研制的语音识别引擎已成功运用于奥运多语言信息服务系统中。 图片1:奥运网站语音导航系统,可用语音命令浏览奥运官方网站信息  图片2:奥运多语言信息服务系统,通过电话网络可用语音自动查询信息  图片3:奥运信息查询系统,可用语音命令查询赛事、交通、天气、景点
  • 语音识别技术可以把人的语音自动转换成文字,是人机交互的关键技术之一。该技术可以使得不同国籍的人在任何地方,任何时间,对任何事都能够通过自然语音的方式与机器进行交互,使人们能够更加方便地获取信息资源和现代化服务。中科院声学所与首都信息发展股份有限公司合作,研制的语音识别引擎已成功运用于奥运多语言信息服务系统中。 图片1:奥运网站语音导航系统,可用语音命令浏览奥运官方网站信息 图片2:奥运多语言信息服务系统,通过电话网络可用语音自动查询信息 图片3:奥运信息查询系统,可用语音命令查询赛事、交通、天气、景点 >>
  • 来源:www.ioa.cas.cn/kxcb/kpwz/201009/t20100909_2957403.html
  • 最近看到一个ASR的课程,很不错吧。网址:http://www.inf.ed.ac.uk/teaching/courses/asr/。大家有时间可以去看下 接下来就开始说dnn-hmm系统吧。所谓的这个就是把之前gmm这部分换成dnn,基于这个我们可以认为,深度学习模型可以更好的去模拟我们的语音信号吧。先上个总图吧:  看到这个图大家应该都可以很清楚地去理解了。下面分开介绍: 1.
  • 最近看到一个ASR的课程,很不错吧。网址:http://www.inf.ed.ac.uk/teaching/courses/asr/。大家有时间可以去看下 接下来就开始说dnn-hmm系统吧。所谓的这个就是把之前gmm这部分换成dnn,基于这个我们可以认为,深度学习模型可以更好的去模拟我们的语音信号吧。先上个总图吧: 看到这个图大家应该都可以很清楚地去理解了。下面分开介绍: 1. >>
  • 来源:www.lxway.com/4492264416.htm
  • (Galaxy Trend Duos)受到极大的关注,外观上,该机可以看作三星 Galaxy S3的mini版,圆滑的线条设计,拥有陶瓷质感,即高档又美观,同时支持GSM+WCDMA网络,对双卡用户来说是一大福音,12月9日该机在亚赛西部手机网售价1540元,这个价位相信都在大家的承受范围内,喜欢的朋友不妨关注一下。  三星S7562智能手机有着圆滑的线条,外壳有陶瓷质感,整体给人优雅大方的感觉,整体上是三星旗舰Galaxy S III的缩小版。显示屏幕为4英寸WVGA分辨率的TFT材质,机身尺寸为121
  • (Galaxy Trend Duos)受到极大的关注,外观上,该机可以看作三星 Galaxy S3的mini版,圆滑的线条设计,拥有陶瓷质感,即高档又美观,同时支持GSM+WCDMA网络,对双卡用户来说是一大福音,12月9日该机在亚赛西部手机网售价1540元,这个价位相信都在大家的承受范围内,喜欢的朋友不妨关注一下。 三星S7562智能手机有着圆滑的线条,外壳有陶瓷质感,整体给人优雅大方的感觉,整体上是三星旗舰Galaxy S III的缩小版。显示屏幕为4英寸WVGA分辨率的TFT材质,机身尺寸为121 >>
  • 来源:www.51yasai.com/view/7602.html
  • 系统上电后必须先给AP7003-01发清除指令Clear Word以清除12个存储体内的内容,然后发出一个存储指令(Store Word1~Store Word12之一)将目标词录入芯片相应的存储体内。当LED1有效时,表示芯片准备好录入目标词。通过指令Set R_Mode1或Set R_Mode2可选择两种识别模式:Set R_Mode1为单词识别模式,该模式下识别操作完成后,芯片进入省电状态以等待表的指令;Set R_Mode2为连词识别模式,该模式下识别操作完成后芯片返回语音录入状态。 进入语音识别
  • 系统上电后必须先给AP7003-01发清除指令Clear Word以清除12个存储体内的内容,然后发出一个存储指令(Store Word1~Store Word12之一)将目标词录入芯片相应的存储体内。当LED1有效时,表示芯片准备好录入目标词。通过指令Set R_Mode1或Set R_Mode2可选择两种识别模式:Set R_Mode1为单词识别模式,该模式下识别操作完成后,芯片进入省电状态以等待表的指令;Set R_Mode2为连词识别模式,该模式下识别操作完成后芯片返回语音录入状态。 进入语音识别 >>
  • 来源:www.ic37.com/htm_tech/2005-1/37962_71410.htm
  • AT&T的第一个API将集中在七个不同的领域:网路搜索、本地商业搜索,Q&A,语音邮件文本( voice mail to text),SMS,AT&T的U-verse视频节目指南和通用听写的API。AT&T公司发现,语音识别效果最好集中在特定的类别,这些类别有助于Watson了解期待什么类型的话。这个并不奇怪,例如,AT&T的信息视频(含下文)侧重建设Watson-enabled的U-verse节目指南。所以你可以告诉它你要找的频道,电影演员,或者其他你要找的。虽
  • AT&T的第一个API将集中在七个不同的领域:网路搜索、本地商业搜索,Q&A,语音邮件文本( voice mail to text),SMS,AT&T的U-verse视频节目指南和通用听写的API。AT&T公司发现,语音识别效果最好集中在特定的类别,这些类别有助于Watson了解期待什么类型的话。这个并不奇怪,例如,AT&T的信息视频(含下文)侧重建设Watson-enabled的U-verse节目指南。所以你可以告诉它你要找的频道,电影演员,或者其他你要找的。虽 >>
  • 来源:www.csdn.net/article/2012-04-20/2804808?bsh_bid=90322
  • 购买此模块的用户需要一定的单片机基础才行,程序是C语言的。初次使用单片机的用户,推荐开发板,不建议只购买模块。同时别忘了需要3.3V单片机来控制哦! LD3320语音识别模块和SYN6288语音交互模块可实现免录语音交互.两模块功能互补,即可识别语音,又可以进行语音合成,以及MP3播放,是开发新一代语音控制产品的理想方案.
  • 购买此模块的用户需要一定的单片机基础才行,程序是C语言的。初次使用单片机的用户,推荐开发板,不建议只购买模块。同时别忘了需要3.3V单片机来控制哦! LD3320语音识别模块和SYN6288语音交互模块可实现免录语音交互.两模块功能互补,即可识别语音,又可以进行语音合成,以及MP3播放,是开发新一代语音控制产品的理想方案. >>
  • 来源:www.218dz.com/ViewProduct/101570
  • Fil Alleva和黄学东 坐在俯瞰华盛顿贝尔维尤市中心的办公室里,微软的 Fil Alleva 正聊起包括他在内的专家们在语音识别探索过程中走过的漫长而艰辛的道路  从 20 世纪 70 年代的早期研究一直聊到了技术的现状。现在,你只需转过头对电脑说:  小娜,我想来张披萨饼  ,接下来你就可以等着吃了。 随着谈话逐步深入, Alleva 也聊到了实现上述情境背后的技术。接着, Alleva 停顿了一下。  现在出现在我们脑海里的  无论我们是否说出来  肯定是 C-3PO 他笑着
  • Fil Alleva和黄学东 坐在俯瞰华盛顿贝尔维尤市中心的办公室里,微软的 Fil Alleva 正聊起包括他在内的专家们在语音识别探索过程中走过的漫长而艰辛的道路 从 20 世纪 70 年代的早期研究一直聊到了技术的现状。现在,你只需转过头对电脑说: 小娜,我想来张披萨饼 ,接下来你就可以等着吃了。 随着谈话逐步深入, Alleva 也聊到了实现上述情境背后的技术。接着, Alleva 停顿了一下。 现在出现在我们脑海里的 无论我们是否说出来 肯定是 C-3PO 他笑着 >>
  • 来源:www.open-open.com/news/view/47edf