1 概述
语音技术包括语音识别(speech recognition)、语音合成(speech synthesis)及文字转发音TTS(Text-To-Speech)。目前,语音合成技术不管是在研究方面,还是在应用方面,都处在一个成熟的发展期,有的已经投入了实际的应用。以TTS技术为例,这种技术及相关产品得到了很多厂商的推广,如Microsoft推出的纯软件性质的TTS处理软件包(即SAPI SDK软件包);华邦电子推出的语音处理芯片WTS70l及ISD系列语音处理产品等。
SD771D是台湾翔音科技公司推出的单芯片实时变音处理器,以真人发音为样本,可将输出的语音进行实时变调处理(如升高、降低),还可实时地将男女声的语音相互转换。利用它可以制作多样化的虚拟人物、创造多变的声讯环境、更好的娱乐效果。
2 SD771的特点及工作原理
2.1 SD771的特点
◇内建麦克风放大电路;
◇内建32Ω喇叭驱动电路;
◇内建数字音量控制(15 levels)电路;
◇可选择数字或模拟输入模式来改变音调;
◇数字输入模式为15种音调变化;
◇模拟输入模式为180种音调变化;
◇内建16位△-∑A/D及D/A转换器;
◇工作电压范围为DC+3.6~+6.0V;
◇工作电流为25MA;
◇能立即将说话者的声音转换成不同的声调输出(如音调变高、变低,男声与女声的相互转换)。
图l是S13771D的内部结构原理,BPF(Band Pass FILTER)和LPF(Low Pass Fiilter)是抗噪声数字滤波器。图1中GAIN_TNC是音量调高按钮,GAIN_DEC是音量调低按钮,PITCH_INC是音调升调按钮,PITCH_DEC音调降调按钮,ORIC是还原音调按钮,RESET是复位按钮。以上介绍的所有这些按钮均为低电平有效,每个键按下的持续时间必须大于10ms,前后两个不同按钮按下的时间间隔必须大于60ms,如图2所示。PITCH_VR是类比模式改变音调的输入端,XI和XO用于连接系统晶振电路的输人。
2.2 SD771D工作原理及典型应用电路
(1)改变声音定调的等级
从麦克风输入的声音经过SD771D处理后由DAC发送出去。SD771D同时发出两路信号,一路为数字信号,另一路为模拟信号,并用来改变声音定调的等级。当PITCH—VR的电平小于0.1V时,即接通数字信号通道,断开模拟信号通道。数字信号通道和模拟信号通道声音定调等级的调控是相互独立的。
(2)数字信号通道
数字信号通道是由PITCH—INC音调的升调按钮)或PITCH_DEC(音调的降调按钮)来控制的.当PITCH_VR的电平小于0.1V时,声音定调的等级就由PITCH_INC或PITCH_DEC控制。此时SD771D会反复检查PITCH_INC和PITCH—DEC的状态。当这两个按钮中的一个按钮有一个低电平脉冲出现时,SD771D马上会改变声音定调的等级。声音定调的等级有升调档和降调档各7等级,包括无键按下时的正常声调等级,共15级,如表1所列。
(3)模拟信号通道
SD771D内部有一个8位的模数转换器(ADC),输入的模拟信号电压通常由PITCH_VR端来进行声音定调的等级控制。如果PITCH_VR上的电压在0.3~2.2V之间,那么,这个电压范围的值会被分成180个级别,并且每一个级别对应一个音调的比率。
图3是SD771D的典型应用电路。