企业资讯

首页 关于我们

企业资讯

第三届视觉语音识别挑战赛 CNVSRC 2025 启动
发布时间:2025/07/07
返回列表

由 NCMMSC 2025 组委会发起,清华大学、北京邮电大学、海天瑞声、语音之家共同主办的第三届中文连续视觉语音识别挑战赛 CNVSRC 2025 正式启动,诚邀参与报名。

 

 

  1. 任务设置
    • T1:多个说话人视觉语音识别 (Multi-speaker VSR)

    • T2:  特定说话人视觉语音合成 (Single-speaker VTS)

    • 固定赛道仅允许使用CN-CVS, CNVSRC(CNVSRC包括CNVSRC.Single.Dev和 CNVSRC.Multi.Dev ), CN-CVS2-P1, CN-CVS3数据集即各任务发布的开发集作为训练集,旨在验证算法的先进性。开放赛道则可以使用任何数据进行训练,旨在验证当前技术能够达到的性能上限。清华大学提供固定赛道上的基线系统代码,供参赛者作为参考。

  2. 参赛方式

CNVSRC 2025 对任何个人和机构开放。目前,竞赛官网已经启动并接受报名。关于竞赛规则、时间节点等更多信息,可扫描下方二维码进入竞赛官网,或在浏览器中访问网址

 

[1] Chen C, Wang D, Zheng T F. CN-CVS: A mandarin audio-visual dataset for large vocabulary continuous visual to speech synthesis[C]//ICASSP 2023-2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, 2023: 1-5.

[2] Chen C, Liu Z, Li X, et al. CNVSRC 2023: The First Chinese Continuous Visual Speech Recognition Challenge[C]//Proc. Interspeech 2024. 2024: 1930-1934.

[3] Liu Z, Li X, Chen C, et al. CNVSRC 2024: The Second Chinese Continuous Visual Speech Recognition Challenge[J]. arXiv preprint arXiv:2506.02010, 2025.

 

<p style="margin: 0px; padding: 0px; outline: 0px; max- 100%; box-sizing: border-box; clear: both; min-height: 1em; caret-color: rgb(62, 62, 62); color: rgb(62, 62, 62); font-family: " pingfang="" sc",="" system-ui,="" -apple-system,="" macsystemfont,="" "helvetica="" neue",="" "hiragino="" sans="" gb",="" "microsoft="" yahei="" ui",="" yahei",="" arial,="" sans-serif;="" font-size:="" 16px;="" letter-spacing:="" 0.544px;="" text-align:="" justify;="" overflow-wrap:="" break-word="" !important;"=""> 

分享到微信朋友圈

打开微信,点击底部的"发现"

使用“扫一扫”即可将网页分享至朋友圈。