网站建设力度,如果网站打开非常缓慢,怎么做企业推广,运动鞋网页ui设计思考与练习
练习2.1
语音信号在产生的过程中#xff0c;以及被感知的过程中#xff0c;分别要经过人体的哪些器官#xff1f;
1.产生过程#xff1a; 肺部空气 → \rightarrow →冲击声带 → \rightarrow →通过声道#xff08;可以调节#xff09; → \rightarrow →…思考与练习
练习2.1
语音信号在产生的过程中以及被感知的过程中分别要经过人体的哪些器官
1.产生过程 肺部空气 → \rightarrow →冲击声带 → \rightarrow →通过声道可以调节 → \rightarrow →发出不同声音 2.感知过程 空气传播 → \rightarrow →进入人耳 → \rightarrow →鼓膜震动 → \rightarrow →听小骨 → \rightarrow →耳蜗 → \rightarrow →电信号 → \rightarrow →中枢听觉系统
练习2.2
汉语拼音的声调对应的是语音信号的哪种特征 1.基频一段信号有10Hz和100Hz叠加而成那么基频就是10Hz如图1所示。
图1 基频为10Hz的正弦波 2.基音轨迹 信号以横轴为时间纵轴为基频得到的曲线。汉语拼音四声如图2所示 1 ^1 1。 图2 普通话声调的基音轨迹 练习2.3
人耳听觉的非线性是由哪些因素造成的 人耳构造非线性 1.外耳耳翼、外耳道、鼓膜外耳道看似一条管道有许多共振频率对某些频率的声音进行放大。 2.中耳通过三块听小骨传到内耳在一定声强范围内传递是线性的超出一定范围这种传递变成非线性的保护内耳 3.内耳耳蜗依靠毛细胞将机械振动耳蜗中流体速度变化转化电信号耳蜗不同位置的毛细胞对应不同频率声音分布大致按频率对数分布。 非线性体现在两方面对频率感知的非线性对声强感知的非线性。 图3 耳的构造 练习2.4
动圈式麦克风的工作原理是什么与电容式麦克风相比动圈式麦克风有哪些优缺点
图4 动圈式麦克风 1.工作原理当声波使膜片振动时连接在膜片上的线圈随着一起振动产生感应电流电信号通过信号放大器并从扬声器发出声音。 2.优缺点优点有不需要直流工作电压缺点包括灵敏度低。
练习2.5
编写一段程序利用μ-law 变换的公式将16 位线性脉冲编码格式存储的音频转换为8 位非线性脉冲编码格式并比较转换前后音频的声音质量及文件大小。
sox input.wav -e mu-law -b 8 output.wav
sox input.wav -e mu-law output1.wavoutput.wav和output1.wav一样大小均为input.wav一半。上面两行代码一直表示 μ − law \mu-\text{law} μ−law默认为8位 μ − law \mu-\text{law} μ−law公式为 f ( x ) sgn ( x ) ln ( 1 μ ∣ x ∣ ) ln ( 1 μ ) f(x) \text{sgn}(x)\frac{\text{ln}(1\mu|x|)}{\text{ln}(1\mu)} f(x)sgn(x)ln(1μ)ln(1μ∣x∣)
图5 练习2.6
窗函数的作用是什么有哪些常见的窗函数 作用 1.吉布斯现象Gibbs phenomenon在不连续点出产生高频分量导致傅里叶变换后的频谱出现局部峰值。 2.频谱泄露周期信号在分帧过程中被截断导致频谱在整个频带内发生拖尾现象。 常见的窗函数 1.汉宁窗 α 0.5 \alpha0.5 α0.5 2.汉明窗 α 0.46 \alpha0.46 α0.46 ω [ n ] ( 1 − α ) − α c o s 2 π n N − 1 \omega[n](1-\alpha)-\alpha cos\frac{2\pi n}{N-1} ω[n](1−α)−αcosN−12πn
图6 汉明窗和汉宁窗 练习2.7
编写一段程序用以计算一段有限离散信号的离散傅里叶变换。
import scipy
import matplotlib.pyplot as plt
import numpy as np# 读取音频文件
rate, data scipy.io.wavfile.read(resampled.wav)# 计算 STFT
f, t, Z scipy.signal.stft(data, fsrate, windowhann, nperseg400, noverlap240,nfftNone, detrendFalse, return_onesidedTrue,boundaryzeros, paddedTrue, axis-1
)# 绘制音频波形
plt.figure(figsize(12, 6))
plt.subplot(2, 1, 1)
plt.plot(data)
plt.title(Audio Waveform)
plt.xlabel(Sample)
plt.ylabel(Amplitude)# 绘制频谱
plt.subplot(2, 1, 2)
plt.pcolormesh(t, f, 10 * np.log10(np.abs(Z)), shadingauto)
plt.title(Spectrogram)
plt.xlabel(Time (s))
plt.ylabel(Frequency (Hz))
plt.colorbar()
plt.tight_layout()
plt.show()图7 声波图及频谱图 练习2.8
感知线性预测与梅尔倒谱系数在设计与实现上有哪些相同点与不同点 1.相同点频域转换使用SIFT最终系数都采用IDFT 2.不同点 1 ^{1} 1PLP通过对功率谱进行巴克刻度变换再与临界频带滤波器组卷积结果通过等响度曲线预加重而MFCC在第一步先进行预加重。 2 ^{2} 2频率校正PLP系数通过巴克刻度、临界频带 3 ^{3} 3声强校正PLP采用 y x 1 3 yx^\frac{1}{3} yx31,MFCC采用 y log x y\text{log}x ylogx
练习2.9
除了LibROSA还有一些基于Python 语言的音频特征提取工具库。下载并熟悉pyAudioAnalysis 与python_speech_features 工具库利用其从音频中提取特征并进行可视化。pyAudioAnalysis教程python_speech_features教程
参考文献
宋刚 姚艳红. 用于汉语拼音单音节声调识别的基频轨迹拟合方法[J]. 计算机工程与应用 2008 4429239-240.