用于 AI 和 ML 项目的电子健康记录 (EHR) 数据集

现成的电子健康记录 (EHR) 数据集可快速启动您的医疗保健 AI 项目。

电子健康记录 (Ehr) 数据

插入您今天丢失的医疗数据

为您的医疗保健 AI 找到正确的电子健康记录 (EHR) 数据

使用一流的训练数据改进您的机器学习模型。 电子健康记录或 EHR 是包含患者病史、诊断、处方、治疗计划、疫苗接种或免疫接种日期、过敏、放射学图像(CT 扫描、MRI、X 射线)和实验室测试等的医疗记录。 我们现成的数据目录使您可以轻松获得值得信赖的医疗培训数据。

现成的电子健康记录 (EHR):

  • 5.1 个专业的 31 万个以上记录和医生音频文件
  • 用于训练临床 NLP 和其他 Document AI 模型的真实世界黄金标准病历
  • 元数据信息,例如 MRN(匿名)、入院日期、出院日期、住院天数、性别、患者类别、付款人、财务类别、状态、出院处置、年龄、DRG、DRG 描述、$ 报销、AMLOS、GMLOS、风险死亡率、疾病严重程度、石斑鱼、医院邮政编码等。
  • 来自美国各州和地区的医疗记录 - 东北 (46%)、南部 (9%)、中西部 (3%)、西部 (28%)、其他 (14%)
  • 属于所有患者类别的医疗记录 - 住院、门诊(临床、康复、经常性、外科日间护理)、急诊。
  • 属于所有患者年龄组的医疗记录 <10 岁 (7.9%)、11-20 岁 (5.7%)、21-30 岁 (10.9%)、31-40 岁 (11.7%)、41-50 岁 (10.4%) )、51-60 岁 (13.8%)、61-70 岁 (16.1%)、71-80 岁 (13.3%)、81-90 岁 (7.8%)、90 岁以上 (2.4%)
  • 患者性别比例为 46%(男性)和 54%(女性)
  • 遵守 HIPAA 的安全港指南的 PII 编辑文档
按位置划分的 EHR 数据
地点文本文档
东北4,473,573
1,801,716
中西部781,701
韦斯特1,509,109
按主要诊断类别划分的 EHR 数据
按主要诊断类别划分的 EHR 数据文本文档
循环系统589,730
传染病和寄生虫病559,244
呼吸系统561,983
肌肉骨骼系统和结缔组织329,344
消化系统
346,369
神经系统
316,243
精神疾病和障碍
282,501
肾脏和泌尿道
209,561
怀孕、分娩和产褥期
165,303
新生儿和其他新生儿疾病起源于围产期
163,605
内分泌、营养和代谢疾病和障碍
142,808
肝胆系统和胰腺
127,172
皮肤、皮下组织和乳房
89,577
药物的伤害、中毒和毒性作用
64,097
血液、造血器官、免疫疾病
48,990
酒精/药物使用和酒精/药物引起的有机精神障碍
48,717
多重重大创伤
27,902
耳鼻喉
22,987
女性生殖系统
17,010
影响健康状况和其他与卫生服务联系的因素
21,294
骨髓增生性疾病和疾病,低分化肿瘤
15,620
人类免疫缺陷病毒感染
12,422
男性生殖系统
9,230

3,549
伯恩斯
444
酒精/药物使用或诱发的精神障碍48,717
                                                                                  与 MDC 合计
4,175,702
使用 3M 等特种石斑鱼的案例(未指定 MDC)
1,619,682
门诊病例(未指定 MDC)
1,980,606
生成未报销的案例(未指定 MDC)
790,697

总计包括所有内容(有和没有 MDC 类别的情况)

8,566,687

我们处理所有类型的数据许可,即文本、音频、视频或图像。 数据集由用于 ML 的医学数据集组成:医师听写数据集、医师临床笔记、医学对话数据集、医学转录数据集、医患对话、医学文本数据、医学图像 - CT 扫描、MRI、超声(收集的基础定制要求) .

联系我们

不能找到你想要的?

正在收集所有数据类型的新的现成医疗数据集 

立即联系我们,免除您的医疗培训数据收集后顾之忧

  • 通过注册,我同意 Shaip 隐私政策服务条款 并同意接受来自 Shaip 的 B2B 营销传播。