企业资讯

首页 关于我们

企业资讯

140+小时免费数据!2019东方多语种识别竞赛开始报名啦!
发布时间:2019/08/01
返回列表

竞赛简介

 

由清华大学和海天瑞声联合主办的“东方多语种识别竞赛(OLR Challenge)”自2016年以来已成功举办了3届。该竞赛旨在促进东方语种识别技术的发展,与往年相比,今年的竞赛将增加更多趣味性和挑战性,所覆盖语种多达16种,参赛的队伍可免费获得全部141小时的竞赛数据。请点击文章左下角“阅读原文”查看竞赛详细信息。

 

是时候展现真正的实力了!带着您的战队前来挑战吧!

 

数据详情

 

语种

时长

用途

中文普通话、粤语、日语、韩语、印尼语、

                            越南语、俄语

89小时

训练集(71小时)

测试集(18小时)

加泰罗尼亚语、希腊语、泰卢固语

9小时

测试集

四川话、上海话、闽南话

3小时

开发集

哈萨克语、藏语、维吾尔语

35小时

训练集

 

跨信道语言:

中文普通话、日语、越南语、俄语、藏语、维吾尔语

5小时

测试集

 

测试任务

 

任务1: 短语音——测试语音将短至1秒钟。

任务2: 跨信道语音——测试数据将与训练数据处于不同录音信道。

任务3: 无训练集语音——在测试之前不提供训练数据,但是为每种语言提供一些参考句子。

 

时间安排

 

07月16日

注册开放

训练集和开发集发布

10月01日

注册关闭

10月20日

测试集发布

11月01日

测试结果提交

11月18日

竞赛结果公布

 

主办单位

 

清华大学 / 北京海天瑞声科技股份有限公司 / 厦门大学 / 昆山杜克大学 / 西北工业大学

 

报名方式

 

报名请发送以下内容至该邮箱:olr19@cslt.org

 

1. 团队名称;

2. 机构名称;

3. 全部参与者姓名;

4. 队伍负责人姓名;

5. 参赛个人、参赛机构的主页或所发布的关于语音领域的论文。

 

 

分享到微信朋友圈

打开微信,点击底部的"发现"

使用“扫一扫”即可将网页分享至朋友圈。