我的位置: 上观号 > > 文章详情

跳出“唯参数论”,浦东牵头破困局,推动新一代音视频主观评价体系革新

转自: 2026-07-03 21:36:26


当前,全球音视频产业加速向超高清、沉浸式、智能化方向迭代升级。产业技术快速革新之下,仅依靠单一客观参数的传统评测模式短板愈发突出。如何破解行业评测瓶颈?7月3日下午,新一代音视频技术主观评价体系交流会在张江举行。来自产学研用各方的行业专家齐聚一堂,围绕新型视听评价标准革新展开研讨,探索一套兼顾技术指标、听觉审美、落地实操的全新主观评价体系。


会上,行业各界达成三项核心共识,共同推动音视频行业摆脱“唯参数论”。

评价重心转向空间沉浸感、场景交互体验

随着技术的飞速发展,国内超高清创新标准已形成完整体系,在产业链端到端落地,逐渐成为主流的超高清内容生态。AI产品层出不穷,智能终端应用百花齐放,在此背景下,行业亟需厘清新一代音视频产品优劣的判定逻辑,搭建一套全新评价标准。

上海音乐学院于阳教授长期深耕人工智能时代音乐与科技的融合研究。2025东方卫视跨年晚会中,他担任AI音乐艺术总监,联合字节跳动等机构,运用音乐人工智能大模型创作了歌曲《超City》。

在AI大模型普及应用的背景下,创作者可快速完成作曲、编曲、混音、风格复刻全流程创作,极大提升音乐内容产出效率。不过,于阳教授指出,在享受“科技红利”的同时,AI仅作为创作辅助工具,所有技术开发需以人主观听觉审美为核心,平衡技术工具性与音乐人文表达。

在消费端,智能终端、VR/AR(虚拟现实、增强现实沉浸式视听交互技术)、车载沉浸式音频的全面普及,听觉需求也正从“听清音质”升级为“置身场景”。

“传统评价只关注声音本身,数字声景、空间音频的核心是构建人与环境的听觉关系,我认为评价重心应转向空间沉浸感、场景交互体验,为沉浸式视听新业态提供全新评测思路。”上海音乐学院数字媒体艺术学院副院长、戴维一副教授建议,评价应从“听见声音”到“进入场景”,“特别是目前的数字声音景观创作中,体验建构与感知非常重要。”

对此,苏州大学朱梦尧教授也深有同感。他认为,在VR/AR、实时交互场景下,人体动作、空间位移会改变听觉感受,传统静态试听方式失效,新一代评价体系必须纳入动态交互、人体感知维度,适配智能化多模态视听产品。

在浦东达成三项核心共识 推动建立标准化评测范式

“AI+音视频”产业正迎来风口,其中空间音频是产业迭代升级核心赛道,AI音乐则是内容创新核心引擎,两大赛道同步迎来规模化爆发。

浦东企业上海自由量级智能科技CTO(首席技术官)姜涛聚焦AI音乐质量评价痛点,解读《以主观为尺:AI音乐质量评价的新范式与客观指标的融合》。他分析,传统客观指标仅能表征数据差异,无法评判音乐感染力、层次感、流畅度等核心体验,且极易被AI模型针对性优化刷分,参考价值有限。对此,他建议,行业应建立四层评价金字塔,将大众盲听对比体验仲裁置于顶层,进一步确立主观体验在AI音乐质量评价中的核心地位。

5G、人工智能与物联网技术的深度融合,推动音频产业进入“AI+”的全新发展阶段。记者了解到,在浦东,已经集聚了众多音频产业链上下游企业。特别是在硬件领域,据不完全统计,晶晨半导体、泰凌微电子、瑶芯微电子、山景集成电路等一大批音频集成电路企业已经占张江集成电路产业三成左右。

与此同时,音频技术正加速与智能家居、智能座舱、智能眼镜等领域深度融合,张江AI创新小镇等产业载体,也孵化出一批新锐企业与全新应用场景。

经过多维度深度研讨,本次交流会率先在行业内达成三大核心共识:摒弃单一客观参数判定质量的旧模式,客观指标仅用于研发筛查、模型训练,成品音质最终依靠分层主观盲听评判;建立“神经美学预筛—专业MOS(Mean Opinion Score,平均主观意见评分)评测—大众盲听对比”完整标准化评价链路,适配AI音频、专业声卡、沉浸式声场全赛道;统一跨领域听觉评价语言,打通音乐创作、硬件研发、AI技术团队的评价标准,消除产学研沟通壁垒。

“空间音频、AI生成音乐、交互声场等产品的核心体验依靠人耳主观感知,行业亟需摆脱‘唯参数论’,建立‘主观优先、客观辅助’的标准化评测范式。”交流会主办方——上海市浦东新区先进音视频技术协会副会长黄海燕表示,希望通过建立共识,携手业界共同赋能国产音视频产业创新升级。

据悉,协会后续将联动参会院校、企业编制《新一代音视频主观听觉评价行业参考规范》,持续搭建产学研交流平台,完善适配超高清、空间音频、AI视听、具身交互等新技术的评价体系。