近日,据外媒报道,苹果公司计划关闭位于圣地亚哥的一个与Siri人工智能(AI)业务相关的团队。

该团队的核心职能在于对用户与Siri交互时产生的数据进行监听分析,通过标注和理解用户需求来不断优化和完善Siri的功能表现,根据知情人士透露,这次裁员可能会导致121人失业。

作为人工智能和机器学习领域的一个关键环节,数据标注是对原始的、未标记的数据集进行人工处理,使其转化为可用于模型训练的有效输入。

苹果此次裁员受影响的员工可能包括数据标注员,对于Siri这样的智能语音助手而言,数据标注员需要对大量的语音数据进行人工审核、语音片段标注以及语义理解标注,以此来训练和提升Siri理解和回应各种语言及方言的能力。

由于大规模的数据集需要进行标注工作,且技术门槛相对较低,这使得数据标注是一个人力密集型行业,目前数据标注员主要分布在人力成本相对较低的地区,比如非洲、东南亚、印度以及国内的二、三线城市。

据国内媒体报道,中国的数据标注员队伍庞大,全国从事这项工作的人大概超过千万,很多头部的互联网技术企业都有自己的数据标注团队或与第三方数据标注公司合作。

chatgpt1

ChatGPT技术

不过随着深度学习和自动化技术在人工智能领域的快速发展,部分原本依赖于人工的数据标注工作正逐步被AI自动化标注取代。

例如,ChatGPT在技术上能够实现自动化标注并且极大降低了单个标注任务的成本,有数据显示其平均每个标注的成本低于0.003美元,比人工标注平台便宜约20倍。

去年9月,AI初创公司refuel就发布了一款名为Autolabel的开源工具,这款工具专注于数据标注领域,采用GPT-4等主流模型,来高效处理和标注各类数据集。

相较于传统的人工标注方式,AI自动化标注在效率上实现了显著提升,极大地减少人工时间消耗,并有助于降低人工智能项目开发过程中的成本,部分原本依赖人工的标注任务也将逐步实现智能化和规模化处理,AI自动化标注正在改变数据标注行业的面貌。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党