多模态数据集
返回数据集
技术领域
数据格式
视频
文本,图像
文本,视频
WAV,TextGrid,mp4
语言选择
全部
印尼语
美式英语
应用场景
IT互联网
智能搜索
智能驾驶
社交软件
教育科研
智能家居
智能安防
智慧金融
智慧城市
物联网
King-VD-028
208人唇动动作视频数据库,包括2080个视频文件和4160个音频文件。采集对象以成年人和小孩为主,包含20位60岁以上老人。采集表演者在不同光线和环境下的说话状态和内容,可用于人脸识别、目标检测、目标跟踪等任务。
产品库编号
产品名称
唇动视频数据库
产品规模
46.2GB
样品情况
208人次,男女性别比例均衡,年龄段:20个老人(60岁以上)、80个未成年人(7-17岁)、108个成年人
光照条件
逆光、正面光
拍摄角度
正面
产品推荐
模拟闸机视频采集1800人
运动精彩瞬间视频
唇语语音视频采集250人
美国英语多模态语音视频数据集
印尼语多模态语音视频数据集
多模态3D手语库
多模态3D手语库-句子类
您想了解更多产品信息吗?请咨询我们
请先登录
选择分享平台
微信
企业微信
钉钉
微博
分享链接已复制到您的剪切板,您可以把链接分享给好友
分享到微信朋友圈
打开微信,点击底部的"发现"
使用“扫一扫”即可将网页分享至朋友圈。