由 NCMMSC 2025 组委会发起,清华大学、北京邮电大学、海天瑞声、语音之家共同主办的第三届中文连续视觉语音识别挑战赛 CNVSRC 2025 正式启动,诚邀参与报名。
- 任务设置
-
T1:多个说话人视觉语音识别 (Multi-speaker VSR)
-
T2: 特定说话人视觉语音合成 (Single-speaker VTS)
-
固定赛道仅允许使用CN-CVS, CNVSRC(CNVSRC包括CNVSRC.Single.Dev和 CNVSRC.Multi.Dev ), CN-CVS2-P1, CN-CVS3数据集即各任务发布的开发集作为训练集,旨在验证算法的先进性。开放赛道则可以使用任何数据进行训练,旨在验证当前技术能够达到的性能上限。清华大学提供固定赛道上的基线系统代码,供参赛者作为参考。
-
- 参赛方式
CNVSRC 2025 对任何个人和机构开放。目前,竞赛官网已经启动并接受报名。关于竞赛规则、时间节点等更多信息,可扫描下方二维码进入竞赛官网,或在浏览器中访问网址。
[1] Chen C, Wang D, Zheng T F. CN-CVS: A mandarin audio-visual dataset for large vocabulary continuous visual to speech synthesis[C]//ICASSP 2023-2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, 2023: 1-5.
[2] Chen C, Liu Z, Li X, et al. CNVSRC 2023: The First Chinese Continuous Visual Speech Recognition Challenge[C]//Proc. Interspeech 2024. 2024: 1930-1934.
[3] Liu Z, Li X, Chen C, et al. CNVSRC 2024: The Second Chinese Continuous Visual Speech Recognition Challenge[J]. arXiv preprint arXiv:2506.02010, 2025.
<p style="margin: 0px; padding: 0px; outline: 0px; max- 100%; box-sizing: border-box; clear: both; min-height: 1em; caret-color: rgb(62, 62, 62); color: rgb(62, 62, 62); font-family: " pingfang="" sc",="" system-ui,="" -apple-system,="" macsystemfont,="" "helvetica="" neue",="" "hiragino="" sans="" gb",="" "microsoft="" yahei="" ui",="" yahei",="" arial,="" sans-serif;="" font-size:="" 16px;="" letter-spacing:="" 0.544px;="" text-align:="" justify;="" overflow-wrap:="" break-word="" !important;"="">