一个可以预测活页乐谱中和目标录音匹配度最高的的位置的AI系统-电子发烧友网

音乐AI技术正在快速发展。

在预印平台Arxiv.org上发布的一项研究中，约翰内斯·开普勒大学林茨计算感知研究所和奥地利人工智能研究所的研究人员介绍了一个可以预测活页乐谱中和目标录音匹配度最高的的位置的AI系统。表面上，其对齐精度高于当前基于图像的最新乐谱追踪器。

乐谱追踪技术是很多应用程序的基础。这些应用包括自动伴奏、翻页以及将现场表演与可视化图像同步等等。现有的系统要么依赖于固定长短的小片段乐谱图像，要么需要光学音乐识别技术所提取出的计算机可读的乐谱。但是这些研究人员的AI系统可以以独特的方式观察整页乐谱，从而从头到尾地追踪任意长度的音乐表演。

这个研究团队将乐谱追踪当作一种图像分割任务。根据特定时间的某个音乐表演，他们的系统针对当前正在播放的音乐相对应的乐谱预测分段蒙版（即小片段）。研究人员说，仅仅利用固定大小音频输入的乐谱追踪器无法在超过特定环境的情况下区分重复的音符，然而他们提出的AI系统在处理较长时间的乐谱时都不会有问题。

在实验过程中，研究人员们从多模型乐谱数据集（MSMD）中获取了一些复音钢琴样本，其中包括巴赫、莫扎特、贝多芬等多个作曲家的作品。在手动识别并且纠正一些对齐上的错误后，他们通过353对乐谱和MIDI音频信息训练了AI系统。

该AI系统的另一位作者说，除了最高的门槛以外（没搞懂highest threshold是啥），他们的系统拥有比基准线更高的性能，并能在时间差方面得出更精确的结果（即对于更严格的容错率，百分比更高）。它偶尔也会产生一些错误，研究人员将其归因于系统可能会在图像纸上 “大幅跳跃”。但是他们断言，种种试验结果都表明这个AI系统在大多数情况下都是“非常精确的”。

“未来的工作会需要对扫描图像或照片进行测试，以评估该AI系统在视觉领域的泛化能力。”研究人员写道，“成就功能更强大的系统的下一步是显式或隐式地结合某种机制来处理乐谱和演奏中重复的音符。尽管我们也怀疑其性能会很大程度上取决于迄今为止音频的隐式编码。举例来说，循环网络中能够存储多大的听觉环境将成为很重要的一个因素，但我们相信，我们所提出的方法能够从合适的（经受过训练的）的数据中很自然地获得这种功能。”

音乐AI技术正在快速发展。OpenAI最近发布了一款叫做Jukebox的机器学习框架，它可以生成包括基本歌曲在内的音乐作为各种音乐类型和音乐风格的原始音频。在2018年末，Google Brain的“Project Magenta”项目致力于“探索机器学习在创作过程中的作用”，提出了一个叫做“Musical Transformer”的模型。该模型能够生成可识别的重复性歌曲。不仅如此，去年三月，谷歌发布了一种算法“Google Doodle”，让用户能够创造向巴赫致敬的旋律。

责任编辑：lq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

音频

音频

+关注

关注
29

文章
2883

浏览量
81639
数据集

数据集

+关注

关注
4

文章
1208

浏览量
24727
ai技术

ai技术

+关注

关注
1

文章
1280

浏览量
24343

原文标题：研究人员的AI技术能够实时匹配活页乐谱与MIDI音频

文章出处：【微信号：livevideostack，微信公众号：LiveVideoStack】欢迎添加关注！文章转载请注明出处。

电位对中和反应的影响

电位对中和反应具有显著的影响，主要体现在以下几个方面：一、驱动电子转移在酸碱中和反应中，电子的转移是由电位差驱动的。电位是反映一个电化学

发表于 12-28 14:10 •141次阅读

AI模型部署边缘设备的奇妙之旅：目标检测模型

的是百度的Picodet模型，它是一种基于深度卷积网络（DNN）的轻量级目标检测模型，具有非常高的检测精度，可以在低算力设备进行实时的端到端推理检测。 2.1 Picodet模型介绍

发表于 12-19 14:33

2025年1000亿！Arm立了一个小目标！

立下的一个小目标：到2025年底，全球将有超过1,000亿台具备AI能力的Arm设备。这个1000亿目标

发表于 12-17 16:43 •365次阅读

录音笔芯片方案：NVF04M-SOP16高品质录音IC，捕捉每一个音节

概述录音笔从最初的模拟录音，到如今的数字高清录音，再到集高清录音、录音转文字、同声传译、云端存储等功能于

发表于 10-25 16:07 •294次阅读

能耗在线监测系统助推碳达峰碳中和

0引言能耗数据在线监测是实现碳达峰、碳中和目标不可或缺的基石。我国正积极构建并推广重点用能单位的能耗在线监测系统，作为响应双碳目标的重要举措。当前，大部分地区已成功将关键用能单位

发表于 10-23 18:07 •186次阅读

中华电信携手爱立信技术,共推碳中和目标

10月17日，中国台湾地区的主要电信运营商中华电信宣布，将引入爱立信的最新5G技术，以加速实现净零排放（即碳中和）目标。　　据悉，中华电信近日已通过SBTi验证，承诺在2045年实现净零排放，这比全球普遍设定的2050年净零目标

发表于 10-17 16:48 •612次阅读

请问同一块芯片上的两个THS3202级间需要匹配吗？

上的传输线匹配吗？在频率比较低的时候认为是短线条件下，可以直接把第一个运放输出加到第二级输入吗？另外电流运放的ft由Rf决定，那么只要综合一下选择Rf使得没有频响过冲是不是意味着相位

发表于 09-13 07:50

物联网如何助力实现碳中和

碳达峰碳中和“1+N”政策体系的构建实施推动下，更多企业高管们专注于企业可持续发展管理并设定目标，实现碳中和意味着公司从大气中清除的碳排放量至少与其产生的碳排放量相同。一些企业通过物联

发表于 09-06 09:51 •651次阅读

电磁轨迹预测分析系统设计方案

智慧华盛恒辉电磁轨迹预测分析系统的设计方案是一个综合性的项目，它结合了电磁学、运动学、数据分析以及可能的人工智能或机器学习技术，以实现对电磁运动轨迹的精确

发表于 07-15 16:22 •412次阅读

基于 FPGA 的目标跟踪电磁炮系统

第一部分设计概论 1.1设计目的视觉目标跟踪是计算机视觉中的一个重要，有着广泛的应用，如：视频监控、人机交互，无人驾驶等。电磁炮是利用电磁发射技术制成的

发表于 06-24 19:19

苹果iOS18将新增多款AI功能

语音备忘录转录：苹果将在“语音备忘录”应用中增加一个大录音按钮，用户只需按下即可开始录音，随后系统内建的

发表于 05-27 11:04 •553次阅读

苹果iOS 18备忘录将搭载AI升级功能，新增语音转文字和文本摘要功能

其中，针对语音备忘录，苹果将在该应用中加入一个较大的录音按键，据称将占据应用界面的显著位置。用户只需轻按此键即可开始录音，随后，

发表于 05-11 10:50 •820次阅读

百度副总裁、小度CEO李莹正式发布了小度新一代操作系统DuerOS X

4月16日，以“创造未来”为主题的2024百度Create AI开发者大会在深圳举办。百度集团副总裁、小度科技CEO李莹正式发布了小度新

发表于 04-18 09:27 •692次阅读

开发者手机 AI - 目标识别 demo

功能简介该应用是在Openharmony 4.0系统上开发的一个目标识别的AI应用，旨在从上到下打通Openharmony

发表于 04-11 16:14

LabVIEW模板匹配位置信息导出

大家好，我在利用ni vision assistant生成的模板匹配界面时，想要将每一个匹配物体的位置信息导出到word或者Excel，但是他这个匹

发表于 03-11 20:22

搜索历史

一个可以预测活页乐谱中和目标录音匹配度最高的的位置的AI系统

评论

电位对中和反应的影响

AI模型部署边缘设备的奇妙之旅：目标检测模型

2025年1000亿！Arm立了一个小目标！

录音笔芯片方案：NVF04M-SOP16高品质录音IC，捕捉每一个音节

能耗在线监测系统助推碳达峰碳中和

中华电信携手爱立信技术,共推碳中和目标

请问同一块芯片上的两个THS3202级间需要匹配吗？

物联网如何助力实现碳中和

电磁轨迹预测分析系统设计方案

基于 FPGA 的目标跟踪电磁炮系统

苹果iOS18将新增多款AI功能

苹果iOS 18备忘录将搭载AI升级功能，新增语音转文字和文本摘要功能

百度副总裁、小度CEO李莹正式发布了小度新一代操作系统DuerOS X

开发者手机 AI - 目标识别 demo

LabVIEW模板匹配位置信息导出