140+小时免费数据!2019东方多语种识别竞赛开始报名啦!
竞赛简介
由清华大学和海天瑞声联合主办的“东方多语种识别竞赛(OLR Challenge)”自2016年以来已成功举办了3届。该竞赛旨在促进东方语种识别技术的发展,与往年相比,今年的竞赛将增加更多趣味性和挑战性,所覆盖语种多达16种,参赛的队伍可免费获得全部141小时的竞赛数据。请点击文章左下角“阅读原文”查看竞赛详细信息。
是时候展现真正的实力了!带着您的战队前来挑战吧!
数据详情
语种 |
时长 |
用途 |
中文普通话、粤语、日语、韩语、印尼语、 越南语、俄语 |
89小时 |
训练集(71小时) 测试集(18小时) |
加泰罗尼亚语、希腊语、泰卢固语 |
9小时 |
测试集 |
四川话、上海话、闽南话 |
3小时 |
开发集 |
哈萨克语、藏语、维吾尔语 |
35小时 |
训练集 |
跨信道语言: 中文普通话、日语、越南语、俄语、藏语、维吾尔语 |
5小时 |
测试集 |
测试任务
任务1: 短语音——测试语音将短至1秒钟。
任务2: 跨信道语音——测试数据将与训练数据处于不同录音信道。
任务3: 无训练集语音——在测试之前不提供训练数据,但是为每种语言提供一些参考句子。
时间安排
07月16日 |
注册开放 训练集和开发集发布 |
10月01日 |
注册关闭 |
10月20日 |
测试集发布 |
11月01日 |
测试结果提交 |
11月18日 |
竞赛结果公布 |
主办单位
清华大学 / 北京海天瑞声科技股份有限公司 / 厦门大学 / 昆山杜克大学 / 西北工业大学
报名方式
报名请发送以下内容至该邮箱:olr19@cslt.org
1. 团队名称;
2. 机构名称;
3. 全部参与者姓名;
4. 队伍负责人姓名;
5. 参赛个人、参赛机构的主页或所发布的关于语音领域的论文。