|
知识路径: > 计算机系统综合知识 > 计算机应用 > 多媒体压缩、编码与存储技术 > 多媒体基础知识 > 音频数据 >
|
相关知识点:2个
|
|
|
|
声音的三个要素是音强、音调和音色。音强是声音的强度,取决于声间的振幅;音调与声音的频率有关,频率高则声音高,频率低则声音低;音色是由混入基音的泛音决定的,每个基音又都有固有的频率和不同音强的泛音,从而使得每个声音都具有特殊的音色效果。
|
|
|
音频技术包括音频采集(模拟音转换为计算机识别的数字信号)、语音解码/编码、文字一声音的转换、音乐合成、语音识别与理解、音频数据传输、音频视频同步、音频效果与编辑等。通常实现计算机语音输出有两种方法,分别是录音/重放和文字一声音转换。
|
|
|
(1)录音/重放:可获得高音质声音,并能够保留特定人或乐器的音色,但存储量会随时长呈线性增长。
|
|
|
(2)文字一声音转换:需预先建立语音参数数据库、发音规则库,然后通过计算机自动合成。虽然语音参数库的大小不会随时长增加而增大,但发音规则库的大小会随着语音质量的要求提高而增大。
|
|
|
语音合成技术可以分为发音参数合成、声音模型参数合成和波形编辑合成三种。合成策略包括频谱逼近和波形逼近。
|
|
|