Hive利用70万用户人力来标记数据和训练AI模型

evan
特邀作者
文章摘要: Hive在30多个国家或地区积累了近70万名用户,这些用户处理了超过一千万个标注

数据库是组成人工智能(AI)系统的基础。但是数据没有被标注就没有价值。针对这个难题,Kevin Guo和Dmitriy Karpman共同创办了Hive这个开放的数据库工具。

Hive是基于Hadoop的一个数据库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据库的统计分析。

Hive在从PayPal创始人Peter Thiel的基金会和其他人投资人那里众筹了3000万美元的风投资金之后,推出了旗舰产品--Hive Data,Hive Predict和Hive Enterprise。

hive系统后台

虽然围绕人工智能的学术很热门,但能够实现商业化应用的还比较少,有些成果演示解决的问题也并不明显,更谈不上批量投产。

为此,Hive通过Hive Work网站和APP招募大量测试用户来给数据添加标注,并指导他们通过完成分类图像和转录音频等任务来获得Hive发放的奖励,到目前为止Hive已经发出30万美元奖金。

HIVE数据标记

通过奖金刺激,Hive迅速在30多个国家/地区积累了近70万名用户,这些用户处理了超过一千万个标注,准确率达到99%。通过用户提供的数据标注,Hive Data可以针对多个目标行业量身定制服务。

Hive Work也为企业提供定制化的程序,通过实现业务流程自动化来节约成本。这部分工作由Hive Predict完成。 Hive Enterprise则是针对汽车,零售,安全和媒体等领域开发的。

hive标记视频内容

到目前为止,凭借其内部服务器和网络基础设施,Hive创建了智能数据采集工具,可识别动作、预测年龄和性别,对汽车进行分类,确定相机传感器与焦距目标之间的距离,甚至可以检测爆炸、电视节目中的枪声,战斗和发布广告。

虽然Hive拒绝透露任何客户的名字,但Hive表示平均每个月都要收到客户发出的数千万的API请求。

本文地址:https://www.xinfengtv.com/11172-hive-700k-ai.html

新风网文章都系原创作品,已加入百度及腾讯原创保护计划,未经授权请勿转载!!

猜你喜欢