负责人的态度感染了每一个人。大家都在努力想办法,但按照目前的现实情况,想要实现承诺真是天方夜谭。产品团队在会后进行头脑风暴,集思广益寻找思路。但囿于国内标注现状,大家想的还是传统的解决方法,很难从根本上解决问题。
面对客户的高标准严要求,有些人打起了退堂鼓。“要不这项目我们不做了?我们有那么多项目,这个不做我们也没什么损失”。在产品、技术、运营的联合会议上,负责人明确告诉大家:“这项目我们必须做,哪怕花再大代价,我们也要让客户满意,这是龙猫一直坚持的信念!再说这个我们不做,国内恐怕也没有第二家能够按要求做出来”。
作为数据采集和标注领域的领军企业,北京安捷智合科技有限公司(龙猫数据)在AI发展中积累了大量经验,服务过超过100家的AI大型公司,累计提供行业解决方案超500个,并自主建立起国内第一个数据+算力的AI综合服务平台,为AI发展做出了突出贡献。
数据标注的精准性对算法优化结果起到了决定性作用,这就要求数据标注必须高质量完成。而产品研发的紧迫性、行业竞争的白热化决定了标注数据的产出必须极其关注效率,可能一次数据标注的拖延就将导致产品上市的滞后,造成竞争力下降,甚至直接危及初创企业的生死存亡。
大家会心一笑,方案找到了意味着:可以加班了。所有人都意识到这两天将是特别难熬的两天,但黎明前最黑暗,这也是创造标注“历史”的时刻。为了赶工期,技术的同事通宵达旦,设计标注标签、像素区块画笔,设置画笔大小范围、提供接口……一步步有条不紊的进行着,两天两夜满满的工作后,终于在第三天,测试工程师在群里告诉大家:标注新功能上线,超像素分割,欢迎使用。
精度、效率与门槛:图像标注业身上的“三座大山”
寒冬里的一把火:上万标注员因此获益
据保守估计,超像素分割降低了图像标注工作门槛之后,将有数万人因此获益,成为“一切图像皆可标”的“万能标注员”。
临危受命:他们遇到标注以来最大挑战
在图像标注领域,拥有自主标注平台的数据服务公司本身就不多,而目前国内图像标注平台普遍采用的还是两种标注方式:打点连线和PS技术。打点连线就是沿着要标注的物体边沿打上足够多的点,然后通过连成线标注出对象轮廓。这一方式门槛低但极其繁琐,只适用于交通线等直线标注标注效果也不够理想。另一方式是通过PS等画面处理技术标注,准入门槛较高,只有深度掌握PS等绘图技术才能够进行,标注时间和人力成本高,且导出格式单一,达不到客户要求,成为制约图像标注时效和质量的一大瓶颈,也成为普通数据标注员的一大心病:明明有标注任务和需求,却因为难以掌握相关技能而失之交臂。
10月中旬以来,多家互联网知名公司被曝出大规模裁员消息,不管是以“业务调整”为借口,还是以“人员优化”为理由,互联网行业就业景气程度大不如前是不争的事实。根据《中国就业市场景气报告》显示,今年第三季度的招聘需求人数与去年同期相比下降了27%,出现了八年来的首次下降。
化压力为动力,从创新处找答案
客户还表示,有了这样的产出质量和效率,他们就可以投入更多在产品研发和落地上,以后将要采集标注的数据也会更多,无论是对数据服务行业还是对整个AI产业,都将起到相当大的推动作用。
然而任何企业的发展都不可能一帆风顺,特别是正在快速成长期的公司。就在前不久,龙猫数据遇到了开展数据标注业务以来最大的挑战。某客户为了产品能够赶在竞品之前上市,要求龙猫数据在一周内为他们提供超过5万张的精细标注图,内容涵盖汽车、道路、自然风景、人脸等多个项目,且标注精度要求极其高,标注图像的边缘必须达到PS标注级别。
超像素分割不仅提升了标注的质量,实现了打点连线标注无法达到的精度,更是极大提升了标注效率,小颖介绍说,之前用打点实现的标注效果,现在用新技术标注,在一半不到的时间里,就可以实现比之前更好的效果。如果用PS等工具进行标注,需要的时间往往比打点还要高。
超像素分割标注:精准,高效,简单,