语音信号的分形特征研究,挺有意思的一个方向。1998 年那篇《汉语语音信号的分形特征》里,不只是讲了分形这个概念,还深入到了混沌动力学、分维数计算这些硬核操作。用的是改进过的 Box-Counting 算法,比传统方法快不少,准确率也靠谱。适合搞语音识别或者做语音特征提取的朋友参考一下。

改进后的计算方法用起来比较丝滑,尤其适合批量语音数据,比如说你在做方言识别或情绪识别那类应用,分维数统计一上来,基本的信号特征就摸个八九不离十了。

配套资源也蛮全的,像 MATLAB 实现频谱图绘制滤波器设计语音信号读取这些都能找到现成的代码,用起来省心不少。是想试试 相空间重构 的,直接套用相关的代码链接就能跑。

如果你正在研究 语音信号的时域/频域特征,或者想试试 BP 神经网络 做语音分类,那这套资源还蛮适合你,思路也清晰。想深入了解的话,可以看看下面这些工具类链接哦:

如果你平时用 Matlab 做信号,这些资源可以说友好了,直接拿来改一改就能上手。