语音合成与识别技术在C#中的应用

2016-02-19 17:07 12 1 收藏

想不想get新技能酷炫一下，今天图老师小编就跟大家分享个简单的语音合成与识别技术在C#中的应用教程，一起来看看吧！超容易上手~

【 tulaoshi.com - 编程语言】

　　在.net中,对英文语音有较好的支持，但是对中文语音的支持还没有加入进来，我们要想实现中文发音或中文语音识别，必需先安装微软的Speech Application SDK（SASDK），它的最新版本是 SAPI 5.1 他能够识别中、日、英三种语言，你可以在这里下载：http://www.microsoft.com/speech/download/sdk51/,需要安装这两个文件Speech SDK 5.1和5.1 Language Pack，其中5.1 Language Pack可以选择安装支持的语言。

　　安装好以后，我们就可以开始进行语音程序的开发了，当然，在这之前我们需要把SAPI.dll通过如下图所示添加到引用中

　　下面我们设计一个能够朗读中英文混合语言的类：

　　我们将用单例模式实现该类，类的代码如下，我们将详细解释：

public class Speach{　private static Speach _Instance = null ;　private SpeechLib.SpVoiceClass voice =null;　private Speach()　{　　BuildSpeach() ;　}public static Speach instance(){　if (_Instance == null)　　_Instance = new Speach() ;　　return _Instance ;}private void SetChinaVoice(){　voice.Voice = voice.GetVoices(string.Empty,string.Empty).Item(0) ;}private void SetEnglishVoice(){　voice.Voice = voice.GetVoices(string.Empty,string.Empty).Item(1) ;}private void SpeakChina(string strSpeak){　SetChinaVoice() ;　Speak(strSpeak) ;}private void SpeakEnglishi(string strSpeak){　SetEnglishVoice() ;　Speak(strSpeak) ;}public void AnalyseSpeak(string strSpeak){　int iCbeg = 0 ;　int iEbeg = 0 ;　bool IsChina = true ;　for(int i=0;istrSpeak.Length;i++)　{　　char chr = strSpeak[i] ;　　if (IsChina)　　{　　　if (chr=122&&chr=65)　　　{　　　　int iLen = i - iCbeg ;　　　　string strValue = strSpeak.Substring(iCbeg,iLen) ;　　　　SpeakChina(strValue) ;　　　　iEbeg = i ;　　　　IsChina = false ;　　　}　　}　　else　　{　　　if (chr122||chr65)　　　{　　　　int iLen = i - iEbeg ;　　　　string strValue = strSpeak.Substring(iEbeg,iLen) ;　　　　this.SpeakEnglishi(strValue) ;　　　　iCbeg = i ;　　　　IsChina = true ;　　　}　　}　}//end for　if (IsChina)　{　　int iLen = strSpeak.Length - iCbeg ;　　string strValue = strSpeak.Substring(iCbeg,iLen) ;　　SpeakChina(strValue) ;　}　else　{　　int iLen = strSpeak.Length - iEbeg ;　　string strValue = strSpeak.Substring(iEbeg,iLen) ;　　SpeakEnglishi(strValue) ;　}}private void BuildSpeach(){　if (voice == null)　　voice = new SpVoiceClass() ;}public int Volume{　get　{　　return voice.Volume ;　}　set　{　　voice.SetVolume((ushort)(value)) ;　}}public int Rate{　get　{　　return voice.Rate ;　}　set　{　　voice.SetRate(value) ;　}}private void Speak(string strSpeack){　try　{　　voice.Speak(strSpeack,SpeechVoiceSpeakFlags.SVSFlagsAsync) ;　}　catch(Exception err)　{　　throw(new Exception("发生一个错误："+err.Message)) ;　}}public void Stop(){　voice.Speak(string.Empty,SpeechLib.SpeechVoiceSpeakFlags.SVSFPurgeBeforeSpeak) ;}public void Pause(){　voice.Pause() ;}public void Continue(){　voice.Resume() ;}}//end class

　　在 private SpeechLib.SpVoiceClass voice =null;这里，我们定义个一个用来发音的类，并且在第一次调用该类时，对它用BuildSpeach方法进行了初始化。

　　我们还定义了两个属性Volume和Rate，能够设置音量和语速。

　　我们知道，SpVoiceClass 有一个Speak方法，我们发音主要就是给他传递一个字符串，它负责读出该字符串，如下所示。

private void Speak(string strSpeack){ 　try　{　　voice.Speak(strSpeack,SpeechVoiceSpeakFlags.SVSFlagsAsync) ;　}　catch(Exception err)　{　　throw(new Exception("发生一个错误："+err.Message)) ;　}}

　　其中SpeechVoiceSpeakFlags.SVSFlagsAsync表示异步发音。

　　但是，这个方法本身并不知道你给的字符串是什么语言，所以需要我们它这个字符串用什么语言读出。SpVoiceClass 类的Voice 属性就是用来设置语种的，我们可以通过SpVoiceClass 的GetVoices方法得到所有的语种列表，然后在根据参数选择相应的语种，比如设置语种为汉语如下所示：

private void SetChinaVoice(){　voice.Voice = voice.GetVoices(string.Empty,string.Empty).Item(0) ;}

　　0表示是汉用，1234都表示英语，就是口音不同。

　　这样，我们就设置了语种，如果结合发音方法，我们就可以设计出一个只发汉语语音的方法

private void SpeakChina(string strSpeak){　SetChinaVoice() ;　Speak(strSpeak) ;}

　　只发英语语音的方法也是类似的，上面程序里有。

　　对于一段中英文混合的语言，我们让程序读出混合语音的方法就是：编程把这段语言的中英文分开，对于中文调用SpeakChina方法，英文调用SpeakEnglishi方法；至于怎样判断一个字符是英文还是中文，我采用的是判断asc码的方法，具体的类方法是通过AnalyseSpeak实现的。

　　这样，对于一段中英文混合文字，我们只需把它作为参数传递给AnalyseSpeak就可以了，他能够完成中英文的混合发音。

　　当然，对于发音的暂定、继续、停止等操作，上面也给出了简单的方法调用，很容易明白。

　　下面简单介绍一下中文语音识别的方法：

　　先把该语音识别的类源代码贴在下面，然后再做说明：

public class SpRecognition{　private static SpRecognition _Instance = null ;　private SpeechLib.ISpeechRecoGrammar isrg ;　private SpeechLib.SpSharedRecoContextClass ssrContex =null;　private System.Windows.Forms.Control cDisplay ;　private SpRecognition()　{　　ssrContex = new SpSharedRecoContextClass() ;　　isrg = ssrContex.CreateGrammar(1) ;　　SpeechLib._ISpeechRecoContextEvents_RecognitionEventHandler recHandle = new _ISpeechRecoContextEvents_RecognitionEventHandler(ContexRecognition) ;　　ssrContex.Recognition += recHandle ;　}　public void BeginRec(Control tbResult)　{　　isrg.DictationSetState(SpeechRuleState.SGDSActive) ;　　cDisplay = tbResult ;　}　public static SpRecognition instance()　{　　if (_Instance == null)　　　_Instance = new SpRecognition() ;　　　return _Instance ;　}　public void CloseRec()　{　　isrg.DictationSetState(SpeechRuleState.SGDSInactive) ;　}　private void ContexRecognition(int iIndex,object obj,SpeechLib.SpeechRecognitionType type,SpeechLib.ISpeechRecoResult result)　{　　cDisplay.Text += result.PhraseInfo.GetText(0,-1,true) ;　}}

　　我们定义了ssrContex 和isrg为语音识别的上下文和语法，通过设置isrg的DictationSetState方法，我们可以开始或结束识别，在上面的程序中是BeginRec和CloseRec方法。cDisplay 是我们用来输出识别结果的地方，为了能够在大部分控件上都可以显示结果，我用了一个Control 类来定义它。当然，每次语音识别后都会触发ISpeechRecoContextEvents_RecognitionEventHandler 事件，我们定义了一个这样的方法ContexRecognition来响应事件，并且在这个方法里输出识别结果。

　　这样，中文语音处理的一些最基本的问题就有了一个简单的解决方法，当然，这种方法还有很多不完善的地方，希望大家多提出批评意见，共同提高。

来源:https://www.tulaoshi.com/n/20160219/1614246.html

上一篇：让窗体飘动起来--C＃中Timer组件用法
下一篇：站长注意网站中网页使用框架结构的弊病

看过《语音合成与识别技术在C#中的应用》的人还看了以下文章更多>>

Java 中LockSupport类在C#中的实现

标签：编程语言网络编程

Java 5之后提供优秀的并发库util.concurrent，.Net中缺乏类似的功能。由于硬件体系发生了变化，多核时代来临，.NET中缺乏并发类库显然不合时宜。缓解这一矛盾的其中一个办法就是在往 C# 中移植java的 util.concurrent 。 java中的util.concurrent包中提供了一个类LockSupport，util.concurrent包很多关键实现需要调用LockSupport。...

c#中的interface abstract与virtual

interface用来声明接口1.只提供一些方法规约，不提供方法主体如 public interface IPerson { void getName();//不包含方法主体 }2.方法不能用public abstract等修饰,无字段变量，无构造函数。3.方法可包含参数如 public interface IPerson { void getAge(string s); } 一个例子(例1)： public interface IPerson { IPerson(); //错误 strin...

C#中结构与类的区别

本文目录类与结构的实例比较类与结构的差别如何选择结构还是类一．类与结构的示例比较：结构示例： public struct Person { string Name; int height; int weight public bool overWeight() { //implement something } } 类示例： public class T...

flash内嵌于C#程序中的应用

flash player是以一个com+组件的形式插入到C#应用程序中的. 加入的方法和普通com+控件一样.这是我今年2月做的一个小试验。事实上我上半年做的项目一直跟这方面有关，所以对这方面还是有一些经验的。现在由于公司项目的启动，所以要对这个熟悉一下，然后整以成熟的方法，使它们之间的接口更有通用性。这方面有一个开源项目flashCsharp做得还不...

C＃中的“装箱”与“拆箱”

装箱和拆箱：任何值类型、引用类型可以和object（对象）类型之间进行转换。装箱转换是指将一个值类型隐式或显式地转换成一个object类型，或者把这个值类型转换成一个被该值类型应用的接口类型（interface-type）。把一个值类型的值装箱，就是创建一个object实例并将这个值复制给这个object，装箱后的object对象中的数据位于...

查看更多精彩>>