多模态数据集

多模态数据集

返回数据集

分类筛选

数据格式

语言选择

全部

印尼语

美式英语

应用场景

更多

美国英语多模态语音视频数据集

King-ASR-863-2

购买咨询

多模态模型被认为是目前提高人工智能系统能力的最佳途径之一,而本产品库采用最新采集形式,同时采集录制美式英语native发音人的多人对话的音频和视频数据,共计约85小时的有效对话数据,音频和视频数据采集结果会进行对齐处理,误差在30毫秒以内。在稀缺资源语种的基础上具有非常高的信息丰富度,可提供更加全面的信息输入从而高效提升系统的表现和效率。

产品库编号

King-ASR-863-2

产品名称

美国英语多模态语音视频数据集

录音语种

美式英语

录音时长

85

产品规模

120条音频、120条转写文本、120条视频

您想了解更多产品信息吗?请咨询我们

购买咨询

请先登录

登录

选择分享平台

分享链接已复制到您的剪切板,您可以把链接分享给好友

分享到微信朋友圈

打开微信,点击底部的"发现"

使用“扫一扫”即可将网页分享至朋友圈。