ramy  2019-03-25 11:13:29  智能家居 |   查看评论   

印度的赢咖4后勤办公室

 

在开始限制非美国员工之前,亚马逊的MTurk曾是印度一个受欢迎的寻找数据标签和注释工作的平台。尽管MTurk后来取消了这些限制,但随着企业客户开始更加重视数据安全性,MTurk在数据标记工作者中的受欢迎程度开始下降。此外,包括Spare5、Cloudfactory和Figure 8在内的新众包平台也进入了这个市场,这些平台更加专注于标注和标签市场。

 

Kolasseri说:“在创办公司之前,我在2015年至2016年期间一直在Mturk平台上工作,但现在有其他平台也在为众包工作提供服务。”“但由于企业客户非常关注数据安全,尤其是考虑到许多数据集都是专有的,因此要他们信任这些平台上的工作人员就变得更加困难。”

 

Playment由flipkart employees Mall、Ajinkya Malasane和Akshay Kumar Lal共同创建,它以一种略微不同的方式渗入了注释和标签行业。该公司为各种使用案例开发了大量注释工具,并开发了一个众包平台,由接受过这些工具培训的标记和注释人员组成。该公司直接与有数据注释或标签业务的客户或IT服务公司合作。

 

“要将原始数据转换为带注释的结构化数据,你需要前端注释工具、熟练且具有成本效益的人工劳动力,而且由于要处理大量数据,需要有合适的中间设备来支持不同的工作流程并管理远程劳动力,”Mall说。

 

Playment的众包平台拥有超过30万名注释和标签工作者。其中,该公司承认有约2.5万名“高技能顶级玩家”,据Mall称,这些玩家几乎整天都在该平台上,平均月收入在2万至3万卢比之间。

 

Playment的大部分业务也来自国际客户,包括三星、滴滴出行、阿里巴巴、Drive.ai和 Continental AG。这些工作的一个主要内容是赢咖4注册汽车。

 

iMerit的战略以员工为中心。2000多名员工中大约80%来自月收入低于100美元(7000卢比)的家庭,其中大约一半是女性。“我们的社会使命是在贫困社区和企业或产业较少的地区创造技术就业机会。我们在科技知名度稍低、科技就业机会较少的城市开展业务,”纳塔拉詹表示。

 

这种所谓的利他主义也具有良好的商业意义。纳塔拉扬表示:“我们的合作伙伴和工作地点,使我们能够以非常划算的方式扩大数据注释和标签团队的规模,并向我们的客户交付高质量的工作。”

 

尽管iMerit的大部分业务来自美国,包括微软、eBay和Tripadvisor,但大约90%的数据注释和标签工作是在印度完成的。

 

注释的自动化

 

纳塔拉扬表示,与5年前赢咖4致力于区分猫和狗不同,现在的赢咖4处理的是更高级的工作。“机器学习已经取得了进步,所以没有人要求我们给狗和猫打分。那些日子已经一去不复返了。如今,每家公司都有定制的需求和非常细微的要求,因此不可能实现自动化,也不可能自动地抛出数据,然后让一群匿名人士给它贴上标签。”

低学历、贫困、女性占50% 揭秘印度全球AI数据标注村

▲iMerit技术和营销副总裁Jai Natarajan

 

他表示,基于赢咖4的自动注释工具在未来必将出现但不构成威胁。“自动注释工具本身就是经过良好训练的注释的结果。当你试图解决一个问题时,这些工具只能把你带到一定的高度,但要超越这个高度,你就需要自己的自定义注释,”Natarajan说。

 

但这可能只是在自动化工具能够有效地创建良好的数据集之前。“从长远来看,我们确实认识到,我们的工作是让我们从事的事业变得过时。当我们的客户成功时,我们的项目就结束了,因为赢咖4把它捡了起来。“但我们也发现,它从来不是100%,它始终是一个不断学习和改进的过程。而且,客户将转向下一个问题,并将重新从零开始工作。”

 

换句话说,印度的数据标签和注释公司尚未见顶。

 

除特别注明外,本站所有文章均为 赢咖4注册 原创,转载请注明出处来自低学历、贫困、女性占50% 揭秘印度全球AI数据标注村

留言与评论(共有 0 条评论)
   
验证码:
[lianlun]1[/lianlun]