年龄识别(resnet_transfer_learning)

1,本文思路:

  1. 对DEX文章DEX Deep EXpectation of apparent age from a single image的基本感悟
    本文的结果在2015年Chalearn LAP的比赛中拿到了年龄识别比赛项目的第一名。作者的基本思路是做转移学习(transfer learning)。他的文章主要有两个方面的贡献:
  • 构建了一个大型的人脸年龄数据库imdb和wiki数据库,其中imdb有大约461871张人脸,而wiki有62359张人脸。这是现在公布在网上的最大的人脸年龄的数据库。但是这个数据库的缺点是(1)缺少15岁及以下的人脸图片,所以最后训练得到的模型对15岁以下的人物图片预测结果不好;(2)因为是从网上爬取的明星图片,包含大量误差噪声。但是这个年龄数据库已经是现有的最好的年龄数据库了。
  • 选用了VGG16的网络,并且通过imagenet比赛上的模型,利用自己的imdb-wiki的数据库进行了finetuning,最后用classification+expected value的方式获得了3.221的mae值,赢得了比赛第一名。
    详细步骤请查阅论文。
  1. 对ordinary regressiong文章Ordinal Regression With Multiple Output CNN for Age Estimation的基本感悟
    本文是2016年发表在cvpr上的文章,这篇文章利用排序回归的方式构建了一个轻量级的神经网络,效果同样十分好。改文章同样有这两个方面的贡献:
  • 构建了一个亚洲人脸数据库,所有数据是从人人网上爬取的,并且进行了分类整理。该数据库有160K张人脸图片,同样十分庞大。但是数据分布主要在15到40岁之间。现该数据集还没有公布出来
  • 自己设计了一个3层的卷积神经网络,利用排序回归的思想进行了年龄回归,在morph数据库上测试mae为3.27。效果十分好。
    详细步骤请查阅论文。
  1. 对以上两篇文章结果的个人感悟
    DEX思路效果好,结果稳定,适应情况多,但是模型太大,运算时间长。
    Ordinary Regression思路,效果好,模型小,可以做到实时性,但是我在实际测试使用过程中预测结果不稳定。
    而且两篇文章的训练数据库都缺少1-15岁的数据集部分。
    我从实用性的角度,希望能构建一个预测结果稳定,运行速度快,而且预测范围广泛的网络模型,便选择了使用resnet-50网络模型,结合Tutu公司的1-15岁的人脸数据库以及imdb-wiki数据库,通过finetuning的方式构建了满足以上要求的网络模型。

2,训练过程

  1. 图像预处理

  2. 网络结构

3,模型结果展示

文章目录
  1. 1. 1,本文思路:
  2. 2. 2,训练过程
  3. 3. 3,模型结果展示
,