任何 AI 模型的成功都取决于输入系统的数据质量。 机器学习系统在大量数据上运行,但不能指望它们只使用任何数据。 它需要是 高质量的 AI 训练数据. 如果 AI 模型的输出需要真实准确,不用说,训练系统的数据应该是高标准的。
用于训练 AI 和 ML 模型的数据应该是企业从中汲取有意义和相关见解的优质数据。 然而,获取大量异构数据对公司构成了挑战。
公司应该依靠像 Shaip 这样的供应商,他们在流程中实施严格的数据质量管理措施来应对这一挑战。 此外,在 Shaip,我们还对我们的系统进行持续转型,以应对不断变化的挑战。
Shaip 的数据质量管理简介
在 Shaip,我们了解可靠训练数据的重要性及其在开发 ML 模型和基于 AI 的解决方案的成果中的作用。 除了筛选员工的技能外,我们同样专注于发展他们的知识基础和个人发展。
我们遵循在流程各个层面实施的严格指导方针和标准操作程序,以使我们的培训数据符合质量基准。
质量管理
我们的质量管理工作流程在提供机器学习和 AI 模型方面发挥了重要作用。 通过循环反馈,我们的质量管理模型是一种经过科学测试的方法,有助于为我们的客户成功交付多个项目。 我们的质量审核流程按以下方式进行。
- 审查合同
- 创建审核清单
- 文件来源
- 采购 2 层审计
- 注释文本审核
- 注释 2 层审计
- 工作交付
- 客户反馈
众包员工选择和入职
我们严格的工人选拔和入职流程使我们在竞争中脱颖而出。 我们进行了一个精确的选择过程,根据质量检查表只引入最熟练的注释者。 我们认为:
- 以前作为文本版主的经验,以确保他们的技能和经验符合我们的要求。
- 以往项目的表现,以确保其生产力、质量和产出与项目需求相匹配。
- 广泛的领域知识是为特定垂直行业选择特定工人的必要条件。
我们的选择过程并没有到此结束。 我们对工人进行样本注释测试,以验证他们的资格和表现。 根据在试验、分歧分析和问答中的表现,他们将被选中。
一旦工人被选中,他们将根据项目需要接受使用项目 SOW、指南、抽样方法、教程等的全面培训课程。
数据收集清单
双层质量检查到位,以确保只有 高质量的训练数据 被传递到下一个团队。
级别 1:质量保证检查
Shaip 的 QA 团队对数据收集进行 1 级质量检查。 他们检查所有文件,并根据必要的参数快速验证。
级别 2:关键质量分析检查
由经过认证、经验丰富和合格的资源组成的 CQA 团队将对剩余的 20% 的追溯样本进行评估。
一些数据采购质量清单项目包括:
- URL 来源是否真实,是否允许数据网络抓取?
- 入围 URL 是否存在多样性以避免偏见?
- 内容是否经过相关性验证?
- 内容是否包括审核类别?
- 是否涵盖优先领域?
- 文档类型来源是否牢记文档类型分布?
- 每个审核等级是否包含最小体积板?
- 是否遵循反馈循环过程?
数据注释清单
与 Data Collection 类似,我们也有两层用于数据注释的质量检查表。
级别 1:质量保证检查
此流程可确保根据团队和客户设置的质量参数正确验证 100% 的文档。
级别 2:关键质量分析检查
这个过程确保了 15% 到 20% 的追溯样本也得到验证,并且质量得到保证。 此步骤由合格且经验丰富的 CQA 团队承担,他们在质量管理和黑带持有者方面至少有 10 年的经验。
CQA 团队确保,
- 用户文本审核的一致性
- 检查每个文档是否使用了正确的短语和审核类别
- 检查元数据
我们还根据以下情况提供每日反馈 帕累托分析 以确保其性能符合客户的要求。
我们进行了另一层性能分析,专注于使用底部四分位数管理的性能最差的注释器。 在最终交付之前,我们还确保完成样品卫生检查。
参数阈值
根据项目指南和客户要求,我们有 90% 到 95% 的参数阈值。 我们的团队有能力且经验丰富,可以采取以下任何一种方法,以确保更高的质量管理标准。
- F1 Score or F Measure – 判断两个分类器的性能 – 2* ((Precision * Recall)/ (Precision + Recall))
- DPO 或每个机会的缺陷数方法计算为缺陷除以机会的比率。
样本审核清单
Shaip 的样本审核清单是一个完整的定制程序,可以根据项目和客户的需求进行定制。 它可以根据从客户收到的反馈进行修改,并在彻底讨论后最终确定。
- 语言检查
- URL 和域检查
- 多样性检查
- 每个语言和节制课程的音量
- 定位关键字
- 文档类型和相关性
- 有毒词组检查
- 元数据检查
- 一致性检查
- 注释类检查
- 根据客户的喜好进行任何其他强制性检查
我们采取严格的措施来维护数据质量标准,因为我们了解所有基于 AI 的模型都是数据驱动的。 并且,拥有 高质量的训练数据 是所有人工智能和机器学习模型的必要条件。 我们了解高质量训练数据的重要性及其对您的 AI 模型的性能和成功的重要性。