开云(中国)Kaiyun·官方网站

当前位置：网站首页 > 科学研究 > 科研成果 > 正文

张巧灵副教授和张维维副教授联合发表的期刊论文Graph modeling for vocal melody extraction from polyphonic music 近日被 Applied Acoustics（中科院二区）杂志接收

【来源： | 发布日期：2023-09-29 | 点击数：】

论文题目：Graph modeling for vocal melody extraction from polyphonic music

第一作者：WeiweiZhang

通讯作者：WeiweiZhang，QiaolingZhang

收录期刊：Applied Acoustics

期刊级别：中科院二区

论文概述：

声乐旋律提取一直是音乐信息检索领域的热点和难点。针对这一难点问题，本文提出了一种基于图建模的声乐旋律提取方法。首先，对混合音频信号进行恒Q变换。然后，将几个相邻帧的幅度谱连接在一起以构建输入特征。然后，构造一个无向图来建模旋律提取问题，并通过图卷积网络（GCN）估计逐帧旋律音高，其中音高估计问题被视为一个多类分类问题。频率点被视为节点，频率点的底层连接关系被定义为边。最后，根据在基于GCN估计的音高的平滑旋律轨迹的特定范围处定义的显著性函数，对量化的逐帧音高进行微调。所提出的方法根据不同频率点的潜在连接关系来定义GCN的边，以一种可解释的方式解决了声乐旋律提取问题。实验结果表明，该方法在轻量级参数情况下取得了良好的性能。