登 录 返 回 旧 网
当前位置: 网站首页 > 科学研究 > 科研成果 > 正文

张巧灵副教授和张维维副教授联合发表的期刊论文Graph modeling for vocal melody extraction from polyphonic music 近日被 Applied Acoustics(中科院二区)杂志接收

【来源: | 发布日期:2023-09-29 | 点击数:

      论文题目:Graph modeling for vocal melody extraction from polyphonic music

      第一作者:WeiweiZhang

      通讯作者WeiweiZhang,QiaolingZhang

      收录期刊:Applied Acoustics

      期刊级别:中科院二区

      论文概述:

      声乐旋律提取一直是音乐信息检索领域的热点和难点。针对这一难点问题,本文提出了一种基于图建模的声乐旋律提取方法。首先,对混合音频信号进行恒Q变换。然后,将几个相邻帧的幅度谱连接在一起以构建输入特征。然后,构造一个无向图来建模旋律提取问题,并通过图卷积网络(GCN)估计逐帧旋律音高,其中音高估计问题被视为一个多类分类问题。频率点被视为节点,频率点的底层连接关系被定义为边。最后,根据在基于GCN估计的音高的平滑旋律轨迹的特定范围处定义的显著性函数,对量化的逐帧音高进行微调。所提出的方法根据不同频率点的潜在连接关系来定义GCN的边,以一种可解释的方式解决了声乐旋律提取问题。实验结果表明,该方法在轻量级参数情况下取得了良好的性能。