如何编写共振峰模型函数模型及其应用

查看: 172|回复: 0|关注: 0
如何编写共振峰模型函数?
<h1 style="color:# 麦片财富积分
新手, 积分 5, 距离下一级还需 45 积分
《语音信号处理实验教程》一书,要求根据共振峰合成发声函数?matlab里有共振峰模型的函数吗?有的话,在哪?没有的话,怎么写?
站长推荐 /1
MATLAB中文论坛是全球最大的 MATLAB & Simulink 中文社区。用户免费注册会员后,即可下载代码,讨论问题,请教资深用户及结识书籍作者。立即注册加入我们吧!
MATLAB官方社交平台
MATLAB中文论坛微社区和“共振峰”相关的论文
该文从实验语音学的角度出发,利用"维吾尔语语音声学参数库",选择其中包含浊塞音b、d、g的466个单音节及多音节词,对其声学参数进行统计分析,归纳了其共振峰、音强、时长、嗓音起始时间和无声段的分布模式。根据语音学的规律对各浊塞音的声学特点进行了深入研究,通过分别对浊塞音发生清化和保持原来浊特点时的特征参数同其对立清塞音相应的特征参数进行对比,探讨了浊塞音的清化现象。该文用实验数据证明了浊塞音清化时会表现出清塞音特征,并获得了区分浊塞音的诸多声学参数。
通过对腭裂语音发声模型进行研究,提出基于激励、声道、辐射模型特征参数的腭裂语音高鼻音等级自动识别算法。通过对基于激励模型的基音频率、基于声道模型的共振峰参数、基于综合发声模型的短时能量和M el倒频谱系数等表征高鼻音特性的参数进行分析和改进,以K‐最近邻算法为模式识别分类器,得出应用4种特征参数的高鼻音等级自动识别结果。实验结果表明, M el倒频谱系数与腭裂语音临床生理特征相关性最大,对不同等级高鼻音识别率最高。
目的:探讨上气道多平面扩容术对重度阻塞性睡眠呼吸暂停低通气综合征(OSAHS)患者嗓音的影响。方法:对26例重度OSAHS患者于上气道多平面扩容术前后,分别应用针对嗓音相关的主观调查问卷和嗓音频谱分析软件进行客观统计学分析。结果:主观调查问卷结果显示,26例患者上气道多平面扩容术后4例(15.4%)出现短时间的轻度腭咽闭合功能不全所致的鼻腔反流现象,均于术后1周内消失;3例(11.5%)术后发声有轻度鼻音增高,尤以术后1周内较明显而后逐渐消失;2例(7.7%)扁桃体Ⅲ度肥大者诉发声清晰度较前提高,原有轻微含糖音消失;总体评价是嗓音障碍指数量表、嗓音相关生活质量量表评分手术前后均无明显变化(P〉0.05)。嗓音客观参数基频F0和F1、F2、F3及F4共振峰频率手术前后均无统计学差异。结论:上气道多平面扩容术能够解除重度OSAHS患者上气道的阻塞性因素,同时进行鼻腔和咽腔的塑形,在一定程度上改变了声道共鸣腔,但对重度OSAHS患者嗓音的主观心理听觉评估无明显变化,嗓音客观参数基频F0和F1、F2、F3及F4四个共振峰频率均无明显的变化。
提出了一种利用加权Mel倒谱提取语音信号共振峰的算法.首先对短时语音信号进行加权Mel倒谱分析,获得包含频谱主要成分的加权Mel倒谱系数;然后利用离散余弦平滑算法,从加权Mel倒谱系数获得谱包络,并从谱包络的峰值位置获得候选共振峰;最后根据共振峰的连续性约束条件和频率范围,从候选共振峰筛选得到共振峰的估计值.实验结果表明,本算法比倒谱法提取的共振峰误差更小,在噪声环境下具有较好的鲁棒性.
针对藏语读音首先看后加字,然后根据元音的位置关系决定读音,而且元音比辅音携带更多听觉感知信息的特点,提出了一种改进的 HTK系统藏语孤立词语音识别技术.在识别特征参数中,增加更能表征元音特征的共振峰参数提高语音识别的正确性,通过循环迭代方法提高语音训练速度,利用藏文字母拉丁转写方法解决藏文和语音识别系统编码不一致的问题.在二次开发的H T K平台进行实验,正确率达到92.83%,实验结果表明元音特征在藏语音识别中起到重要作用.
广义旁瓣抵消器自适应波束形成算法对受固定干扰源影响的目标语音有良好的消噪效果,但在自适应抵消模块不可避免地存在语音泄漏,使目标语音受到一定损失,且残留部分背景噪声.文中先对传统的GSC结构自适应波束形成算法进行研究,分析语音泄漏的原因,并提出一种多通道语音补偿方法对GSC结构消噪后的语音进行补偿.对不同频段的噪声帧和语音帧做针对性处理,同时在对语音进行分割时保护共振峰,防止其发生偏移和变形,仿真实验与测试结果表明,该方法可以有效地补偿语音泄漏,消除残留噪声,提高语音可懂度.
表面等离激元是贵金属纳米粒子与光相互作用时,纳米粒子表现出的一种光学性质。表面等离激元在化学分析传感、生物成像、表面增强光谱等领域都展现出了重要应用价值。纳米粒子耦合是调控表面等离激元性质的一种有效方式。然而如何将各种贵金属纳米粒子在有效耦合的距离尺度(〈5 nm)内形成功能协同的新颖纳米结构仍然是目前面临的科学挑战。
个子越高的人声音越低沉,这一结论于我们来说并不陌生。不过,或许你从未意识到,你甚至可以从声音判断具体身高。一项最新研究表明,盲人仅仅通过听人说话就能判断他们的身高。研究人员认为,或许人类具备这项技能已有数千年之久。来自苏克塞斯大学的心理学家卡塔日娜与她的同事一起,研究了盲人在听音辨高能力上的差异。
语音情感识别与分析是目前人工智能、情感计算的主要研究方向之一,其研究成果能直接影响人与计算机的交互方式.语音情感识别的基础是语音情感特征值的确定、提取及分析,这将直接决定语音情感识别的准确程度.情感语音数据库的创建及选择成为语音情感特征值提取与分析的前提.本文实验所采用的情感语音库为北京航空航天大学电子信息工程学院毛峡教授课程组建立的,对于不同情感的同一样本语句进行能量分析、基频分析及共振峰分析,以确定不同特征值对于喜悦、愤怒、悲伤、平静等情感的区别度.这为进一步研究人类情感语音特征值的确定与提取、分析提供了一定的参考.
语音吸引力是个体吸引力的重要组成部分。为探索言语吸引力影响因素,以汉语词汇为材料,设计实验分析语音基频、共振峰等物理属性以及词义、声音受喜欢程度和语音性别等社会属性对语音吸引力的影响。结果表明:分析物理属性,基频、共振峰等并未能预测语音吸引力;分析社会属性,较之词语意义,声音本身具有的吸引力水平对言语吸引力评价影响更大;而男性和女性对两种性别言语吸引力评价差异不显著。言语吸引力评价在男性和女性间具有一致性:"好声音"比"会说话"更加容易被认为具有吸引力。
金月芽期刊网 2017查看: 4874|回复: 22
请教 fft与AR模型功率谱的区别
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
才可以下载或查看,没有帐号?
书上说,AR模型(现代谱估计)比周期图(经典谱估计)在方差和分辨率上好!!!
我的问题是:
1.AR模型功率谱估计方差性能好具体有什么意义?是不是说纵坐标的功率值更接近理论值?
2.对同样的数据,直接周期图,分辨率为fs/N,而AR模型求得的功率谱横坐标间隔不也是fs/N吗?
3.通过计算,我的感觉就是AR模型比周期图平滑,但分辨率好没体现出来,这是什么原因?
4.我做的是建筑物的振动分析,除了通过功率谱分析物体主频外,最好也能分析出振动的相对位移,通过AR模型的功率谱怎么求振幅--频率图???
希望高手解答
1.方差性能好应该就是谱线比较光滑,波动小;
2.fs/N是频率分辨率,还有一种关于频率分辨率的说法就是指谱峰尖锐与否,如果谱峰太宽,那么就说它分辨率比较低;
3.时间序列建模,模型阶数选择比较重要。
在已知p个AR系数后,功率谱的数学表达式如下式,其中ω可以取任意值,也就是ω可以是一个连续值,这要比fs/N的分辨率高多了。关于AR谱的分辨率,可参看胡广书 “数字信号处理-理论、算法与实现”一书,12.3.1节中介绍了这方面的知识。
回复 3楼 的帖子
宋老师说得对,呵呵
胡广书 “数字信号处理-理论、算法与实现”一书,12.2节中说:
ω=2π/N,然后公式就可以用FFT计算,3楼说ω是连续的值,那么是不是可以这样理解,用FFt计算时,N可以取大于原时间序列的值,因为只有N变大了,df=fs/N才会变小,分辨率才提高啊,不然如果式中的N还是跟以前一样,ar模型的分辨率不是和周期图的一样吗?
这里不是很明白,MATLAB里的公式pburg计算出来的结果,频率轴的间隔是和周期图的一样,就是不明白ar谱分析分辨率高是怎么体现出来的,麻烦智者解惑下。
原帖由 puddinggzq 于
15:56 发表
胡广书 “数字信号处理-理论、算法与实现”一书,12.2节中说:
ω=2π/N,然后公式就可以用FFT计算,3楼说ω是连续的值,那么是不是可以这样理解,用FFt计算时,N可以取大于原时间序列的值,因为只有N变大了,df=fs/N才会变小,分辨率才提高啊,不然如果式中的N还是跟以前一样,ar模型的分辨率不是和周期图的一样吗?
这里不是很明白,MATLAB里的公式pburg计算出来的结果,频率轴的间隔是和周期图的一样,就是不明白ar谱分析分辨率高是怎么体现出来的,麻烦智者解惑下。
对的,在已知AR系数后求频谱时,N不拘于原数据的长度,它实际上是p个AR系数,补上N-p个零作FFT分析,与原 数据的长度完全无关,即N可以是原数据长,也可以不是。当然,当N为原数据长时,其分辨率和周期图一样了。
附录中附上了lpcar2pf和rfft(把后缀txt改为m),是在已知AR系数求功率谱密度的MATLAB函数。可以先用burg法求出AR系数,再调用lpcar2pf求出功率谱密度。
[ 本帖最后由 songzy41 于
18:18 编辑 ]
18:16 上传
点击文件名下载附件
1.4 KB, 下载次数: 153
18:18 上传
点击文件名下载附件
1.48 KB, 下载次数: 131
感谢7楼的答疑解惑,现在感觉明白多了,不知道能否留个QQ或邮箱,碰到疑难可以直接请教!
还有一个新问题:
都说现代功率谱方差性能好,方差性能好在图上表现为平滑,带一般用功率谱分析,都是分析横坐标,即分析频率,很少分析纵坐标,我的问题是,纵坐标的方差小,具体有什么好处?
我的理解是由于功率谱的曲线和横坐标(频率)围成的面积是均方差的平方,是不是谱越平滑,在特定的频率段内求得的均方差就越接近理论值?
看看:loveliness::loveliness:
对于一数组的一列傅立叶变换
菜鸟请教!!
对于一数组的一列A进行傅立叶变换
y=fft(A,n);????
f=(0:n/2-1)*fs/n;????
plot(f,Y(1:257));
对于变换后得到的Y和f的关系不太理解,当plot的命令执行后,得到幅度-频率的关系,f与Y是一一对应的关系,f是频率的增加一直到255fs/512可以理解,数组中的元素A1,A2........An,变换后再取绝对值得到A1',A2'........An' , plot是不是f0(0)对应 A1',f1(1*)对应A2',f2(2*)对应 A3'............这样配对打出来图的呢???本人刚刚接触信号处理,请高手赐教!!谢谢!!
想用AR谱估计得到频率
我只知道用AR谱估计在峰值处能得到频率,但究竟怎么得到频率的就不甚明白;
还有能从AR谱估计反推出频率的公式吗?
谢谢前辈能给以指点!!
原帖由 531 于
12:48 发表
想用AR谱估计得到频率
我只知道用AR谱估计在峰值处能得到频率,但究竟怎么得到频率的就不甚明白;
还有能从AR谱估计反推出频率的公式吗?
谢谢前辈能给以指点!!
实际上AR谱是从以前帖子给的公式推算出来的,而若想从AR模型中求出共振峰频率,可以这样求:AR模型的传递函数(Z变换)如下式,则求分母的极点,就能解求出该模型的共振峰频率。
有用!呵呵,正在学这个!
Powered by

我要回帖

更多关于 函数模型 的文章

 

随机推荐