现成的 AI 训练数据集
用于训练聊天机器人、医疗保健和对话式 AI 模型的数据集
访问高质量、可扩展的数据集来训练聊天机器人、对话式人工智能和医疗保健应用程序
这些数据集包括一小时的对话式 AI 训练数据,使用澳大利亚英语、英国英语、丹麦语、印地语、印尼语、马来语、南非荷兰语、阿拉伯语、爱尔兰语等语言。医疗保健数据包括医生口述的音频,详细描述了患者的临床状况和护理计划,以及转录的对话和临床文件。
数据集 | 文件 | 用例 | 描述 | 下载 |
---|---|---|---|---|
医师听写 | 音频文件 | 医疗保健 | 由医生口述的音频记录,描述患者的临床状况和医院/临床环境中的护理计划。 | 下载 |
医师听写 | 逐字转录的文本文件 | 医疗保健 | 与听写音频数据集对应的一组转录文档。 逐字转录,根据需要训练语音识别声学和词汇模型。 | 下载 |
医师临床笔记 | 听写笔记 | 医疗保健 | 一组由医生口述的描述患者临床状况的临床文件。 | 下载 |
医师临床笔记 | 去标识化听写笔记 | 医疗保健 | 一组由医生指定的格式化临床文档,用于训练医疗 AI 模型。 | 下载 |
人际对话 | 澳大利亚英语 | 对话式AI | 音频对话示例和相应的转录 JSON 文件 | 下载 |
人际对话 | 英国英语 | 对话式AI | 音频对话示例和相应的转录 JSON 文件 | 下载 |
对话数据集 | 丹麦语 | 对话式AI | 音频对话示例和相应的转录 JSON 文件 | 下载 |
对话数据集 | 印地语 | 对话式AI | 音频对话示例和相应的转录 JSON 文件 | 下载 |
对话数据集 | 泰卢固语 | 对话式AI | 音频对话示例和相应的转录 JSON 文件 | 下载 |
对话数据集 | 印尼语 | 对话式AI | 音频对话示例和相应的转录 JSON 文件 | 下载 |
对话数据集 | 希伯来语 | 对话式AI | 音频对话示例和相应的转录 JSON 文件 | 下载 |
对话数据集 | 马来语 | 对话式AI | 音频对话示例和相应的转录 JSON 文件 | 下载 |
对话数据集 | 南非荷兰语 | 对话式AI | 音频对话示例和相应的转录 JSON 文件 | 下载 |
对话数据集 | 阿拉伯语 | 对话式AI | 音频对话示例和相应的转录 JSON 文件 | 下载 |
对话数据集 | 爱尔兰语 | 对话式AI | 音频对话示例和相应的转录 JSON 文件 | 下载 |
对话数据集 | 苏格兰的 | 对话式AI | 音频对话示例和相应的转录 JSON 文件 | 下载 |
对话数据集 | 威尔士语 | 对话式AI | 音频对话示例和相应的转录 JSON 文件 | 下载 |