为了减少种族偏见, 谷歌举办包容性图像竞赛来促进图像分类AI的发展

evan
特邀作者
文章摘要: 有400个团队参与了这次竞赛

语言偏差是人工智能(AI)中一个公认的难题,要解决这个问题使非常困难的。(在没代表性的数据集上练习模型可以正确显示内容)特别是在种族,社会和种族偏见等问题上,在识别图片时经常出现一些令人尴尬的翻译内容,这些内容可能对使用不同语言的人群和种族来说是无法接受的。

为了解决这个问题,谷歌于9月与神经网络竞争对手合作推出了包容性图像竞赛,该竞赛的挑战团队使用一个来自北美和欧洲的900张公开的数据标记图Open Images,来训练AI系统评估这些照片。图像分类的表现在过去几年中已经大幅改善,某些数据上几乎超越了人类的表现,但谷歌的研究人员仍然像看看数据模型对真实数据的影响有多大。Google AI 研究员演示了该算法的公平性并展示了最新的进度。

在Open Images数据集上训练的分类器标记的婚礼照片

Google AI科学家在Open Images数据集上设置了一个预先训练的Inception v3模型。一张穿着西式长裙和全裙式婚纱的白人新娘的照片,并制作了“礼服”,“女人”,“婚礼”和“新娘”等标签。而另一张则是亚洲血统和穿着民族服饰的新娘照片,并制作了诸如“服装”,“事件”和“表演艺术”之类的标签。测试时机器仅识别出西式装扮的新娘形象,这是个令人尴尬的结果。

虽然Open Images数据集中来自中国,印度和中东等其他族裔的照片较少,但是研究表明,计算机视觉系统非常容易受到种族偏见的影响。因此,包容性图像竞赛的目标是激励竞争对手开发图像分类器,以便在数据收集困难的情况下仍然能够做出正确判断。

来自挑战数据集的标记图像的示例

为了编译可以评估提交的模型的多样化数据集,Google AI使用了一个应用程序,指示用户拍摄周围的对象并使用设备上的机器学习生成字幕。标题被转换为动作标签并通过图像分类器,由人类团队验证。第二个验证步骤确保人们在图像中被正确标记。

有400个团队参与了这次竞赛,在两个竞赛阶段的第一阶段,Google AI发布了32,000张来自不同地理位置的不同数据图像以及来自Open Image数据的标签分布。在第二阶段,Google从第一阶段和训练数据集中发布了100,000张具有不同标签和地理分布的图像。

本文地址:https://www.xinfengtv.com/12042-google-pianjian-ai.html

新风网文章都系原创作品,已加入百度及腾讯原创保护计划,未经授权请勿转载!!

猜你喜欢