首页 > 财经 > 正文
Qzone
微博
微信

芯翌科技联合清华发布全球最大公开人脸数据集,算法斩获人脸识别全球第一

财经 前瞻网 2021-03-17 11:54

 

芯翌科技联合清华发布全球最大公开人脸数据集,算法斩获人脸识别全球第一

(图为已上线的WebFace数据集网站)

日前,芯翌科技与清华大学自动化系智能视觉实验室合作,推出了全球最大的公开人脸数据集WebFace260M。该研究论文已被CVPR2021收录。以该数据集为基础,芯翌科技在最新的全球人脸识别算法测试(NIST-FRVT)榜单中斩获戴口罩人脸识别评测赛道的第一名。

芯翌科技联合清华发布全球最大公开人脸数据集,算法斩获人脸识别全球第一

(WebFace260M人脸数目和图片张数上远超其他公共数据集,图片摘自论文)

数据集为学术界贡献了一个新的百万级人脸基准,包含有噪声的4百万人脸数目/2.6张图片(WebFace260M)和清洗后的2百万人脸数目/420万张图脸(WebFace42M)训练数据,以及精心设计的时间约束评估协议。

芯翌科技联合清华发布全球最大公开人脸数据集,算法斩获人脸识别全球第一

(数据清洗过程,图片摘自论文)

研究团队从互联网上收集了共计4百万的姓名列表,并下载了2.6亿张人脸图片。然后设计了一个自动利用自我训练(CAST)流水线来对庞大的数据库进行清洗。数据库拥有高效且可扩展的特性。

芯翌科技联合清华发布全球最大公开人脸数据集,算法斩获人脸识别全球第一

(清洗过后的人脸姿势、年龄以及人种分布,图片摘自论文)

据悉,净化后的WebFace42M是最大的公共人脸识别训练集。出于期望缩小学术界和产业之间的数据差距的目的,团队参照实际场景,构建了Inference Time conStraint(FRUITS)协议和测试集来全面评估人脸识别数据库。

利用FRUIT协议,团队开发了一个分布式框架来有效地训练人脸识别模型,而不影响其性能。在WebFace42M的支持下,我们在具有挑战性的IJB-C集上降低了40%的失败率,在NIST-FRVT 1:1人脸识别评测中的430个条目中排名世界第三。即使是10%的数据(WebFace4M)也表现出比公共训练集更优越的性能。此外,在FRUITS-100ms/500ms/1000ms协议下的富属性测试集上建立了全面的基线,包括MobileNet、EfficientNet、AttentionNet、ResNet、SENet、ResNeXt和RegNet系列。

芯翌科技联合清华发布全球最大公开人脸数据集,算法斩获人脸识别全球第一

(WebFace260M与其他公开数据集在IJB-C上的表现,图片摘自论文)

NIST-FRVT是全球顶尖科研机构角逐的赛场,测试数据不公开。该测试通过不同类型的照片样本进行上百亿次对比,对人脸识别算法的评估可达到百万分之一精度,是当今全球规模最大、标准最严、竞争最激烈、最权威的人脸识别算法竞赛,素有工业界黄金标准之称。能在NIST-FRVT中斩获首席,可想而知算法的准确率高得吓人。

立足学术前沿,远瞻产业发展。更多数据请参考前瞻产业研究院《2021-2026年中国人脸识别行业市场前瞻与投资战略规划分析报告》,同时前瞻产业研究院提供产业大数据、产业规划、产业申报、产业园区规划、产业招商引资、IPO募投可研等解决方案。

本文来源前瞻网,转载请注明来源。本文内容仅代表作者个人观点,本站只提供参考并不构成任何投资及应用建议。(若存在内容、版权或其它问题,请联系:service@qianzhan.com)

 

责任编辑: 4114RWL

责任编辑: 4114RWL
人家也是有底线的啦~
广告
Copyright © 2018 TOM.COM Corporation, All Rights Reserved 雷霆万钧版权声明
违法信息/未成年人举报:010-85181169     举报邮箱/未成年人举报:jubao@tomonline-inc.com