医疗数据去标识化解决方案
根据 HIPAA、GDPR 或特定的定制要求,自动匿名化结构化和非结构化数据、文档、PDF 文件和图像。
从去识别化的患者数据中释放洞察力
数据去标识化和匿名化解决方案
受保护的健康信息(PHI) 去识别化或 PHI 数据匿名化是对医疗记录中可用于识别个人身份的任何信息进行去识别化的过程;在提供医疗服务(例如诊断或治疗)过程中创建、使用或披露的信息。 Shaip 通过人机交互提供去身份识别功能,以提高文本内容中敏感数据匿名化的准确性。这种方法利用 HIPAA 去识别方法(包括专家判定和安全港)来转换、掩盖、删除或以其他方式掩盖敏感信息。 HIPAA 将以下内容识别为 PHI:
- 名称
- 地址/地点
- 日期和年龄
- 电话号码
- 车辆标识符和序列号,包括车牌号
- 传真号码
- 设备标识符和序列号
- 电子邮件地址
- Web 统一资源定位器 (URL)
- 社会安全号码
- 互联网协议(IP)地址
- 病历编号
- 生物识别标识符,包括指纹和声纹
- 健康计划受益人号码
- 全脸照片和任何类似的图像
- 帐号
- 证书/许可证号码
- 任何其他唯一标识号、特征或代码
- 医学影像、记录、健康计划受益人、证书、社会保障和帐号
- 个人过去、现在或未来的健康或状况
- 过去、现在或将来为个人提供医疗保健的付款
- 每个与个人直接相关的日期,例如出生日期、出院日期、死亡日期和行政管理
HIPAA 专家裁决
医疗保健组织的任务是创新和形成更大的网络,同时管理健康数据的敏感使用,这引发了隐私问题。 为了平衡大型健康数据集的社会效益和个人隐私,建议采用 HIPAA 专家判定方法进行去识别化。 我们的服务可帮助任何规模的组织将其数据与 HIPAA 标准保持一致,从而降低法律、财务和声誉风险,并增强医疗保健服务和结果。
APIs
Shaip API 提供对您所需记录的实时按需访问,使您的团队能够快速、可扩展地访问去识别化的高质量情境化医疗数据,使他们能够一次准确地完成人工智能项目。
去标识化API
患者数据对于开发可能的最佳医疗保健 AI 项目至关重要。 但保护他们的个人信息对于防止可能的数据泄露同样重要。 Shaip 是数据去标识化、数据屏蔽和数据匿名化方面的知名行业领导者,可删除所有 PHI/PII(个人健康/身份信息)。
- 对 PHI、PII 和 PCI 的敏感数据进行去标识化、标记化和匿名化
- 确认 HIPAA 和安全港指南
- 编辑 HIPAA 和安全港去标识化指南中涵盖的所有 18 个标识符。
- 去标识化质量专家认证审核
- 遵循全面的 PHI 注释指南进行 PHI 去标识化,从而遵守安全港指南
数据去标识化服务的主要特点
人在回路
具有多层次质量控制和人工参与的世界级质量数据。
单一优化的数据完整性平台
通过生产、测试和开发实现数据匿名可确保跨多个地理区域和系统的数据完整性。
100+ 百万条去识别化数据
一个经过验证的平台,可促进对数据进行有效的 HIPAA 去标识化,从而降低 PII/PHI 受损的风险。
增强数据安全性
增强的数据安全性确保数据格式受到策略控制和保留。
增强的可扩展性
使用人在回路中大规模匿名化任何规模的数据集。
可用性和交付
数据、服务和解决方案的高网络正常运行时间和准时交付。
去识别化数据在行动
PII/HI 编辑正在实施
通过使用 Shaip 专有的医疗保健 API(数据去识别平台)匿名或掩盖患者的健康信息 (PHI) 来去识别医疗文本记录。
去识别结构化医疗记录
从医疗记录中去除个人身份信息 (PII) 患者健康信息 (PHI),同时遵守 HIPAA 法规。
PII去标识化
我们的 PII 去识别功能包括删除敏感信息,例如姓名、日期和年龄,这些信息可能直接或间接地将个人与其个人数据联系起来。
PHI 去识别化
我们的 PHI 去识别功能包括删除敏感信息,例如 MRN 号、入院日期,这些信息可能直接或间接将个人与其个人数据联系起来。 这是患者应得的,也是 HIPAA 所要求的。
从电子病历 (EMR) 中提取数据
执业医师从电子病历 (EMR) 和医生临床报告中获得重要见解。 我们的专家可以提取可用于疾病登记、临床试验和医疗保健审计的复杂医学文本。
符合 HIPAA 和 GDPR 要求的 PDF 去标识化
通过我们的 PDF 去识别服务确保 HIPAA 和 GDPR 合规; 为了保护隐私和法律完整性,您的敏感信息将被安全地匿名化。
用例
目标: 财务文件中的 PII 数据屏蔽,包括 W2、银行对账单、1099、1040 等。
挑战: 对 18 多份财务文件中的 10,000 个预定义 HIPAA 标识符进行去标识化。
我们的贡献: 利用在岸人员从客户平台上的 10,000 多份财务文件中去除身份识别数据 (PII)。
最终结果: 客户开发了一个人工智能驱动的信息提取模型,从财务文件中提取关键数据。
目标: 从临床文档中删除 PHI 信息。
挑战: 对可用于开发 AI 模型的 30,000 多个临床文档进行去标识化。
我们的贡献: 从符合 HIPAA 和安全港指南的临床文件中去除识别的 PHI
最终结果: 客户利用注释良好的黄金标准数据集来解决他们的用例。
全面的合规范围
跨不同监管管辖区(包括 GDPR、HIPAA 和根据安全港去标识化)扩展数据去标识化,以降低 PII/PHI 泄露的风险
选择 Shaip 作为您的数据去标识化合作伙伴的原因
团队
专门和训练有素的团队:
- 30,000 多名数据创建、标签和 QA 协作者
- 有资质的项目管理团队
- 经验丰富的产品开发团队
- 人才库采购和入职团队
工艺过程
通过以下方式确保最高的流程效率:
- 稳健的 6 Sigma Stage-Gate 工艺
- 一个由 6 Sigma 黑带组成的专门团队——关键流程负责人和质量合规
- 持续改进和反馈循环
平台
获得专利的平台具有以下优势:
- 基于网络的端到端平台
- 无可挑剔的品质
- 更快的 TAT
- 无缝交付
团队
专门和训练有素的团队:
- 30,000 多名数据创建、标签和 QA 协作者
- 有资质的项目管理团队
- 经验丰富的产品开发团队
- 人才库采购和入职团队
工艺过程
通过以下方式确保最高的流程效率:
- 稳健的 6 Sigma Stage-Gate 工艺
- 一个由 6 Sigma 黑带组成的专门团队——关键流程负责人和质量合规
- 持续改进和反馈循环
平台
获得专利的平台具有以下优势:
- 基于网络的端到端平台
- 无可挑剔的品质
- 更快的 TAT
- 无缝交付
推荐资源
博客
命名实体识别 (NER) – 概念、类型和应用
每次我们听到一个单词或阅读一段文字时,我们都有自然的能力来识别单词并将其分类为人物、地点、位置、价值观等。 人类可以快速识别一个词,对其进行分类并理解上下文。
解决方案
人工智能在医疗保健中的作用:好处、挑战以及介于两者之间的一切
我们提供医疗数据注释服务,帮助组织提取非结构化医疗数据中的关键信息,即医生笔记、EHR 入院/出院摘要、病理报告等,帮助机器识别给定文本或图像中存在的临床实体。
特色客户
赋能团队打造世界领先的人工智能产品。
立即开始对您的 AI 数据进行去识别化。 使用人工在环对任何规模的数据进行大规模匿名化
常见问题
数据去标识化、数据屏蔽或数据匿名化是删除所有 PHI/PII(个人健康信息/个人身份信息)的过程,例如可能直接或间接将个人与其数据联系起来的姓名和社会安全号码。
去标识化患者数据是删除了 PHI(个人健康信息)或 PII(个人身份信息)的健康数据。 也称为 PII 屏蔽,它涉及删除姓名、社会安全号码和其他可能直接或间接将个人与其数据联系起来的个人详细信息,从而导致重新识别的风险。
PII 是指个人身份信息,它是任何可以联系、定位或识别特定个人的数据,例如社会安全号码 (SSN)、护照号码、驾照号码、纳税人识别号、患者识别号、财务帐号、信用卡号或个人地址信息(街道地址或电子邮件地址。个人电话号码)。
PHI 是指任何形式的个人健康信息,包括身体记录(医疗报告、实验室测试结果、医疗账单)、电子记录 (EHR) 或口头信息(医生口述)。
有两种突出的数据去标识化技术。 第一个是删除直接标识符,第二个是删除或更改可能用于重新识别或引导个人的其他信息。 在 Shaip,我们使用精确的数据去标识化工具和标准操作程序,以确保流程尽可能密封和准确。