自然语言处理数据集

自然语言处理数据集

返回数据集

分类筛选

数据格式

语言选择

全部

EN-US英语(美国)

JA-JP日语(日本)

ES-ES西班牙语(西班牙)

JA-JA日语(日本)

ZH-CN汉语(中国大陆)

应用场景

更多

高质量大模型内容审查数据集

King-NLP-234

购买咨询
"高质量大模型内容审查数据集"是一个专为训练和评估中文自然语言处理(NLP)模型而设计的数据集,旨在提高这些模型在面对敏感信息时的安全性和合规性。该数据集涵盖了中国国家互联网信息办公室(简称网信办)定义的31个主要类别中的敏感指令。
这31个类别包括但不限于政治、宗教、色情、暴力、谣言传播等多个方面,确保了数据集能够全面地覆盖可能遇到的各种敏感场景。通过使用这样一个综合性的数据集进行训练,中文NLP模型能够更好地识别并处理敏感内容,减少输出中出现不当言论的风险,从而更加符合监管要求和社会伦理标准。"

产品库编号

King-NLP-234

产品名称

高质量大模型内容审查数据集

产品规模

5000145条

您想了解更多产品信息吗?请咨询我们

购买咨询

请先登录

登录

选择分享平台

分享链接已复制到您的剪切板,您可以把链接分享给好友

分享到微信朋友圈

打开微信,点击底部的"发现"

使用“扫一扫”即可将网页分享至朋友圈。