近期,机器人与智能技术研究团队学生吕荣闯、王姚易迪的两篇学术论文《SASEGAN-TCN: Speech enhancement algorithm based on self-attention generative adversarial network and temporal convolutional network》,《DLPformer: A Hybrid Mathematical Model for State of Charge Prediction in Electric Vehicles Using Machine Learning Approaches》分别在SCI期刊《Mathematical Biosciences and Engineering》(工程技术类4区)、《Mathematics》(JCR1区, 中科院3区, IF=2.4)上发表。
1 《SASEGAN-TCN: Speech enhancement algorithm based on self-attention generative adversarial network and temporal convolutional network》,论文针对语音处理中特征信息不聚合等问题,提出了一种SASEGAN-TCN模型来提高语音信号的质量和可懂度,并有效达到语音降噪目的。

链接地址:https://www.aimspress.com/article/doi/10.3934/mbe.2024172
传统的无监督语音增强模型往往存在输入特征信息不聚合等问题,在训练过程中产生的额外噪声会降低语音信号的质量。为此,团队分析了输入语音特征信息不聚合等问题对语音性能的影响。并引入时间卷积神经网络,提出了一种SASEGAN-TCN语音增强模型,通过捕获局部特征信息和聚合全局特征信息来提高模型效果和训练稳定性。仿真实验结果表明,该模型在Valentini数据集上的语音质量(PESQ)得分和短时客观可懂度(STOI)的感知评价分别达到2.1636和92.78%,在THCHS30数据集上分别达到1.8077和83.54%。此外,将增强的语音数据用于声学模型,语音识别错误率降低了17.4%,与基线模型实验结果相比有显著提高。本研究为基于机器学习理论在噪声环境下的语音识别应用做了有效的探索。

模型结构图

实验结果图
2 《DLPformer: A Hybrid Mathematical Model for State of Charge Prediction in Electric Vehicles Using Machine Learning Approaches》,该论文是团队与阿里巴巴集团控股有限公司共同研究,提出了一种新颖的电池状态(SOC)估计框架以及一个基于Transformer的预测模型,命名为DLPformer。

电动汽车SOC的估计框架

预测模型DLPformer的结构
这项研究提出了一种新的框架和预测模型,该模型可以提高电池SOC预测的准确性和稳健性,从而有助于提高电池利用效率和确保电池的安全性能。此外,该研究还使用了时间序列Transformer(TSTs)的方法,为电动汽车的SOC预测提供了新的思路和方法。这项研究为电动汽车的发展提供了重要的理论和技术支持,具有重要的意义。

论文发表刊物

链接地址:https://www.mdpi.com/2227-7390/11/22/4635