许可证 高质量
医疗保健/医疗数据
用于 AI 和 ML 模型

现成的医疗保健/医疗数据集可快速启动您的医疗保健 AI 项目

医疗保健数据集

插入您今天丢失的医疗数据

用于机器学习的医疗和保健数据集 

医师听写音频数据

我们用于医疗保健的去标识化数据集包括 31 个不同的专业音频文件,这些文件由医生根据医院/临床环境中的医患遭遇描述患者的临床状况和护理计划。

现成的医师听写音频文件:

  • 来自 257,977 个专业的 31 小时真实世界医师听写语音数据集,用于训练医疗保健语音模型
  • 从电话听写 (54.3%)、数字录音机 (24.9%)、语音麦克风 (5.4%)、智能手机 (2.7%) 和未知 (12.7%) 等各种设备捕获的听写音频
  • 遵循 HIPAA 的安全港指南的 PII 编辑音频和成绩单

转录病历

病案抄录是指医患对话的抄录、医疗报告的抄录和医学评估的抄录。 它有助于绘制患者的病史以供将来访问,并且还可以作为医生的参考点。 它有助于医生评估患者的现状并提出合适的治疗方案。

现成的转录医疗记录:

  • 转录来自 257,977 个专业的 31 小时真实世界医师听写,以训练医疗保健语音模型
  • 从各种工作类型转录的医疗记录,如手术报告、出院总结、会诊记录、入院记录、ED 记录、临床记录、放射学报告等。
  • 遵循 HIPAA 的安全港指南的 PII 编辑音频和成绩单
转录病历

电子健康记录(EHR)

电子健康记录或 EHR 是包含患者病史、诊断、处方、治疗计划、疫苗接种或免疫接种日期、过敏、放射学图像(CT 扫描、MRI、X 射线)和实验室测试等的医疗记录。

现成的电子健康记录 (EHR):

  • 5.1 个专业的 31 万个以上记录和医生音频文件
  • 用于训练临床 NLP 和其他 Document AI 模型的真实世界黄金标准病历
  • 元数据信息,例如 MRN(匿名)、入院日期、出院日期、住院天数、性别、患者类别、付款人、财务类别、状态、出院处置、年龄、DRG、DRG 描述、$ 报销、AMLOS、GMLOS、风险死亡率、疾病严重程度、石斑鱼、医院邮政编码等。
  • 来自美国各州和地区的医疗记录 - 东北 (46%)、南部 (9%)、中西部 (3%)、西部 (28%)、其他 (14%)
  • 属于所有患者类别的医疗记录 - 住院、门诊(临床、康复、经常性、外科日间护理)、急诊。
  • 属于所有患者年龄组的医疗记录 <10 岁 (7.9%)、11-20 岁 (5.7%)、21-30 岁 (10.9%)、31-40 岁 (11.7%)、41-50 岁 (10.4%) )、51-60 岁 (13.8%)、61-70 岁 (16.1%)、71-80 岁 (13.3%)、81-90 岁 (7.8%)、90 岁以上 (2.4%)
  • 患者性别比例为 46%(男性)和 54%(女性)
  • 遵守 HIPAA 的安全港指南的 PII 编辑文档
电子健康记录 (Ehr)
  • 属于所有患者年龄组的医疗记录 <10 岁 (7.9%)、11-20 岁 (5.7%)、21-30 岁 (10.9%)、31-40 岁 (11.7%)、41-50 岁 (10.4%) )、51-60 岁 (13.8%)、61-70 岁 (16.1%)、71-80 岁 (13.3%)、81-90 岁 (7.8%)、90 岁以上 (2.4%)
  • 患者性别比例为 46%(男性)和 54%(女性)
  • 遵守 HIPAA 的安全港指南的 PII 编辑文档
联系我们

不能找到你想要的?

正在收集所有数据类型的新的现成医疗数据集 

立即联系我们,免除您的医疗培训数据收集后顾之忧

  • 通过注册,我同意 Shaip 隐私政策服务条款 并同意接受来自 Shaip 的 B2B 营销传播。