案例研究:内容审核

30K+ 文档 web 报废和注释内容审核
内容审核 - 横幅
人们对人工智能内容审核的需求日益增长,力求确保我们连接和交流的在线空间的安全。

随着社交媒体使用量的持续增长,网络欺凌问题已成为各平台维护网络安全的一大障碍。高达38%的个人每天都会遭遇这种有害行为,这凸显了创新内容审核方法的迫切需求。如今,各组织机构依靠人工智能来主动应对网络欺凌这一长期存在的问题。

网络安全:

Facebook 第四季度社区标准执行报告披露——对 4 万条欺凌和骚扰内容采取行动,主动检测率为 6.3%

Education:

2021 研究发现 36.5%美国 % 的学生年龄介于 12和17 年在他们上学期间曾经历过网络欺凌。

根据 2020 年的一份报告,4.07 年全球内容审核解决方案市场价值 2019 亿美元,预计到 11.94 年将达到 2027 亿美元,复合年增长率为 14.7%。

真实世界的解决方案

调节全球对话的数据

客户正在为其云产品开发一个强大的自动内容审核机器学习模型,为此他们正在寻找能够为他们提供准确训练数据的特定领域供应商。

利用我们在自然语言处理 (NLP) 方面的广泛知识,我们协助客户收集、分类和注释了 30,000 多份英语和西班牙语文档,以构建自动内容审核机器学习模型,分为有毒、成人或色情内容类别。

现实世界的解决方案

市场问题

  • 从优先域中抓取 30,000 份西班牙语和英语文档
  • 将收集到的内容分为短、中、长段
  • 将编译后的数据标记为有毒、成人或露骨色情内容
  • 确保高质量的注释,准确率至少为 90%。

解决方案

  • Web 从 BFSI、医疗保健、制造、零售中分别收集了 30,000 份西班牙语和英语文档。 内容进一步分为短、中、长文档 
  • 成功将分类内容标记为有毒、成人或露骨色情内容
  • 为了达到 90% 的质量,Shaip 实施了两层质量控制流程:
    » 级别 1:质量保证检查:100% 的文件进行验证。
    » 级别 2:关键质量分析检查:Shaips 的 CQA 团队评估 15%-20% 的回顾性样本。

结果

培训数据有助于构建自动化内容审核 ML 模型,该模型可以产生多种有益于维护更安全的在线环境的结果。 一些主要成果包括:

  • 处理大量数据的效率
  • 确保统一执行适度政策的一致性
  • 适应不断增长的用户群和内容量的可扩展性
  • 实时审核可以识别和
    删除生成的潜在有害内容
  • 通过减少对人类主持人的依赖来提高成本效益

将您的对话式 AI 应用程序开发速度提高 100%

告诉我们我们如何为您的下一个 AI 计划提供帮助。