语音合成与识别技术在C#中的应用

2016-02-19 17:07 12 1 收藏

想不想get新技能酷炫一下,今天图老师小编就跟大家分享个简单的语音合成与识别技术在C#中的应用教程,一起来看看吧!超容易上手~

【 tulaoshi.com - 编程语言 】

  在.net中,对英文语音有较好的支持,但是对中文语音的支持还没有加入进来,我们要想实现中文发音或中文语音识别,必需先安装微软的Speech Application SDK(SASDK),它的最新版本是 SAPI 5.1 他能够识别中、日、英三种语言,你可以在这里下载:http://www.microsoft.com/speech/download/sdk51/,需要安装这两个文件Speech SDK 5.1和5.1 Language Pack,其中5.1 Language Pack可以选择安装支持的语言。

  安装好以后,我们就可以开始进行语音程序的开发了,当然,在这之前我们需要把SAPI.dll通过如下图所示添加到引用中

  下面我们设计一个能够朗读中英文混合语言的类:

  我们将用单例模式实现该类,类的代码如下,我们将详细解释:

  

public class Speach{ private static Speach _Instance = null ; private SpeechLib.SpVoiceClass voice =null; private Speach() {  BuildSpeach() ; }public static Speach instance(){ if (_Instance == null)  _Instance = new Speach() ;  return _Instance ;}private void SetChinaVoice(){ voice.Voice = voice.GetVoices(string.Empty,string.Empty).Item(0) ;}private void SetEnglishVoice(){ voice.Voice = voice.GetVoices(string.Empty,string.Empty).Item(1) ;}private void SpeakChina(string strSpeak){ SetChinaVoice() ; Speak(strSpeak) ;}private void SpeakEnglishi(string strSpeak){ SetEnglishVoice() ; Speak(strSpeak) ;}public void AnalyseSpeak(string strSpeak){ int iCbeg = 0 ; int iEbeg = 0 ; bool IsChina = true ; for(int i=0;istrSpeak.Length;i++) {  char chr = strSpeak[i] ;  if (IsChina)  {   if (chr=122&&chr=65)   {    int iLen = i - iCbeg ;    string strValue = strSpeak.Substring(iCbeg,iLen) ;    SpeakChina(strValue) ;    iEbeg = i ;    IsChina = false ;   }  }  else  {   if (chr122||chr65)   {    int iLen = i - iEbeg ;    string strValue = strSpeak.Substring(iEbeg,iLen) ;    this.SpeakEnglishi(strValue) ;    iCbeg = i ;    IsChina = true ;   }  } }//end for if (IsChina) {  int iLen = strSpeak.Length - iCbeg ;  string strValue = strSpeak.Substring(iCbeg,iLen) ;  SpeakChina(strValue) ; } else {  int iLen = strSpeak.Length - iEbeg ;  string strValue = strSpeak.Substring(iEbeg,iLen) ;  SpeakEnglishi(strValue) ; }}private void BuildSpeach(){ if (voice == null)  voice = new SpVoiceClass() ;}public int Volume{ get {  return voice.Volume ; } set {  voice.SetVolume((ushort)(value)) ; }}public int Rate{ get {  return voice.Rate ; } set {  voice.SetRate(value) ; }}private void Speak(string strSpeack){ try {  voice.Speak(strSpeack,SpeechVoiceSpeakFlags.SVSFlagsAsync) ; } catch(Exception err) {  throw(new Exception("发生一个错误:"+err.Message)) ; }}public void Stop(){ voice.Speak(string.Empty,SpeechLib.SpeechVoiceSpeakFlags.SVSFPurgeBeforeSpeak) ;}public void Pause(){ voice.Pause() ;}public void Continue(){ voice.Resume() ;}}//end class

  在 private SpeechLib.SpVoiceClass voice =null;这里,我们定义个一个用来发音的类,并且在第一次调用该类时,对它用BuildSpeach方法进行了初始化。

  我们还定义了两个属性Volume和Rate,能够设置音量和语速。

(本文来源于图老师网站,更多请访问https://www.tulaoshi.com/bianchengyuyan/)

  我们知道,SpVoiceClass 有一个Speak方法,我们发音主要就是给他传递一个字符串,它负责读出该字符串,如下所示。

(本文来源于图老师网站,更多请访问https://www.tulaoshi.com/bianchengyuyan/)

  

private void Speak(string strSpeack){  try {  voice.Speak(strSpeack,SpeechVoiceSpeakFlags.SVSFlagsAsync) ; } catch(Exception err) {  throw(new Exception("发生一个错误:"+err.Message)) ; }}

  其中SpeechVoiceSpeakFlags.SVSFlagsAsync表示异步发音。

  但是,这个方法本身并不知道你给的字符串是什么语言,所以需要我们它这个字符串用什么语言读出。SpVoiceClass 类的Voice 属性就是用来设置语种的,我们可以通过SpVoiceClass 的GetVoices方法得到所有的语种列表,然后在根据参数选择相应的语种,比如设置语种为汉语如下所示:

  

private void SetChinaVoice(){ voice.Voice = voice.GetVoices(string.Empty,string.Empty).Item(0) ;}

  0表示是汉用,1234都表示英语,就是口音不同。

  这样,我们就设置了语种,如果结合发音方法,我们就可以设计出一个只发汉语语音的方法

  

private void SpeakChina(string strSpeak){ SetChinaVoice() ; Speak(strSpeak) ;}

  只发英语语音的方法也是类似的,上面程序里有。

  对于一段中英文混合的语言,我们让程序读出混合语音的方法就是:编程把这段语言的中英文分开,对于中文调用SpeakChina方法,英文调用SpeakEnglishi方法;至于怎样判断一个字符是英文还是中文,我采用的是判断asc码的方法,具体的类方法是通过AnalyseSpeak实现的。

  这样,对于一段中英文混合文字,我们只需把它作为参数传递给AnalyseSpeak就可以了,他能够完成中英文的混合发音。

  当然,对于发音的暂定、继续、停止等操作,上面也给出了简单的方法调用,很容易明白。

  下面简单介绍一下中文语音识别的方法:

  先把该语音识别的类源代码贴在下面,然后再做说明:

  

public class SpRecognition{ private static SpRecognition _Instance = null ; private SpeechLib.ISpeechRecoGrammar isrg ; private SpeechLib.SpSharedRecoContextClass ssrContex =null; private System.Windows.Forms.Control cDisplay ; private SpRecognition() {  ssrContex = new SpSharedRecoContextClass() ;  isrg = ssrContex.CreateGrammar(1) ;  SpeechLib._ISpeechRecoContextEvents_RecognitionEventHandler recHandle = new _ISpeechRecoContextEvents_RecognitionEventHandler(ContexRecognition) ;  ssrContex.Recognition += recHandle ; } public void BeginRec(Control tbResult) {  isrg.DictationSetState(SpeechRuleState.SGDSActive) ;  cDisplay = tbResult ; } public static SpRecognition instance() {  if (_Instance == null)   _Instance = new SpRecognition() ;   return _Instance ; } public void CloseRec() {  isrg.DictationSetState(SpeechRuleState.SGDSInactive) ; } private void ContexRecognition(int iIndex,object obj,SpeechLib.SpeechRecognitionType type,SpeechLib.ISpeechRecoResult result) {  cDisplay.Text += result.PhraseInfo.GetText(0,-1,true) ; }}

  我们定义了ssrContex 和isrg为语音识别的上下文和语法,通过设置isrg的DictationSetState方法,我们可以开始或结束识别,在上面的程序中是BeginRec和CloseRec方法。cDisplay 是我们用来输出识别结果的地方,为了能够在大部分控件上都可以显示结果,我用了一个Control 类来定义它。当然,每次语音识别后都会触发ISpeechRecoContextEvents_RecognitionEventHandler 事件,我们定义了一个这样的方法ContexRecognition来响应事件,并且在这个方法里输出识别结果。

  这样,中文语音处理的一些最基本的问题就有了一个简单的解决方法,当然,这种方法还有很多不完善的地方,希望大家多提出批评意见,共同提高。

来源:https://www.tulaoshi.com/n/20160219/1614246.html

延伸阅读
Java 5之后提供优秀的并发库util.concurrent,.Net中缺乏类似的功能。由于硬件体系发生了变化,多核时代来临,.NET中缺乏并发类库显然不合时宜。缓解这一矛盾的其中一个办法就是在往 C# 中移植java的 util.concurrent 。 java中的util.concurrent包中提供了一个类LockSupport,util.concurrent包很多关键实现需要调用LockSupport。...
interface用来声明接口1.只提供一些方法规约,不提供方法主体 如 public interface IPerson { void getName();//不包含方法主体 }2.方法不能用public abstract等修饰,无字段变量,无构造函数。3.方法可包含参数 如 public interface IPerson { void getAge(string s); } 一个例子(例1): public interface IPerson { IPerson(); //错误 strin...
本文目录 类与结构的实例比较 类与结构的差别 如何选择结构还是类 一.类与结构的示例比较: 结构示例: public struct Person { string Name; int height; int weight public bool overWeight() { //implement something } } 类示例: public class T...
flash player是以一个com+组件的形式插入到C#应用程序中的. 加入的方法和普通com+控件一样.这是我今年2月做的一个小试验。事实上我上半年做的项目一直跟这方面有关,所以对这方面还是有一些经验的。现在由于公司项目的启动,所以要对这个熟悉一下,然后整以成熟的方法,使它们之间的接口更有通用性。这方面有一个开源项目flashCsharp做得还不...
    装箱和拆箱:任何值类型、引用类型可以和object(对象)类型之间进行转换。装箱转换是指将一个值类型隐式或显式地转换成一个object类型,或者把这个值类型转换成一个被该值类型应用的接口类型(interface-type)。把一个值类型的值装箱,就是创建一个object实例并将这个值复制给这个object,装箱后的object对象中的数据位于...

经验教程

986

收藏

83
微博分享 QQ分享 QQ空间 手机页面 收藏网站 回到头部