现成的 AI 训练数据集

用于训练聊天机器人、医疗保健和对话式 AI 模型的数据集

样本数据集

访问高质量、可扩展的数据集来训练聊天机器人、对话式人工智能和医疗保健应用程序

这些数据集包括一小时的对话式 AI 训练数据,使用澳大利亚英语、英国英语、丹麦语、印地语、印尼语、马来语、南非荷兰语、阿拉伯语、爱尔兰语等语言。医疗保健数据包括医生口述的音频,详细描述了患者的临床状况和护理计划,以及转录的对话和临床文件。

数据集文件用例描述下载
医师听写
医生听写音频文件
音频文件
医疗保健由医生口述的音频记录,描述患者的临床状况和医院/临床环境中的护理计划。
医师听写
逐字转录的文本文件
逐字转录的文本文件
医疗保健与听写音频数据集对应的一组转录文档。 逐字转录,根据需要训练语音识别声学和词汇模型。
医师临床笔记
医生听写笔记
听写笔记
医疗保健一组由医生口述的描述患者临床状况的临床文件。
医师临床笔记
医生听写笔记
去标识化听写笔记
医疗保健一组由医生指定的格式化临床文档,用于训练医疗 AI 模型。
人际对话
澳大利亚英语
澳大利亚英语
对话式AI音频对话示例和相应的转录 JSON 文件
人际对话
英国英语
英国英语
对话式AI音频对话示例和相应的转录 JSON 文件
对话数据集
丹麦语
丹麦语
对话式AI音频对话示例和相应的转录 JSON 文件
对话数据集
印地语
印地语
对话式AI音频对话示例和相应的转录 JSON 文件
对话数据集
泰卢固语
泰卢固语
对话式AI音频对话示例和相应的转录 JSON 文件
对话数据集
印尼语
印尼语
对话式AI音频对话示例和相应的转录 JSON 文件
对话数据集
希伯来语
希伯来语
对话式AI音频对话示例和相应的转录 JSON 文件
对话数据集
马来语
马来语
对话式AI音频对话示例和相应的转录 JSON 文件
对话数据集
南非荷兰语
南非荷兰语
对话式AI音频对话示例和相应的转录 JSON 文件
对话数据集
阿拉伯语
阿拉伯语
对话式AI音频对话示例和相应的转录 JSON 文件
对话数据集
爱尔兰语
爱尔兰语
对话式AI音频对话示例和相应的转录 JSON 文件
对话数据集
苏格兰的
苏格兰的
对话式AI音频对话示例和相应的转录 JSON 文件
对话数据集
威尔士语
威尔士语
对话式AI音频对话示例和相应的转录 JSON 文件