多模态数据集
返回数据集
技术领域
数据格式
视频
文本,图像
文本,视频
WAV,TextGrid,mp4
语言选择
全部
印尼语
美式英语
应用场景
IT互联网
智能搜索
智能驾驶
社交软件
教育科研
智能家居
智能安防
智慧金融
智慧城市
物联网
不同场景下(室内交谈、户外交流、电话通话等)的人物对话,音频准确还原人物声音,包括语音内容、语调变化等。每段音频1-20s,音频采样率22.4kHz及以上。
产品名称
人物对话语音数据集
录音时长
每段音频1-20s
产品规模
515万段
标注信息
语音内容、语调变化
产品推荐
模拟闸机视频采集1800人
运动精彩瞬间视频
唇语语音视频采集250人
唇动视频数据库
美国英语多模态语音视频数据集
印尼语多模态语音视频数据集
多模态3D手语库
多模态3D手语库-句子类
您想了解更多产品信息吗?请咨询我们
请先登录
选择分享平台
微信
企业微信
钉钉
微博
分享链接已复制到您的剪切板,您可以把链接分享给好友
分享到微信朋友圈
打开微信,点击底部的"发现"
使用“扫一扫”即可将网页分享至朋友圈。