(41-2) 14 * << * >> * Русский * English * Содержание * Все выпуски
Идентификация лиц в реальном времени с использованием свёрточный нейронной сети и хэширующего леса
Визильтер Ю.В., Горбацевич В.С., Воротников А.В., Костромов Н.А.
Государственный научно-исследовательский институт авиационных систем (ГосНИИАС)
PDF, 1 002 kB
DOI: 10.18287/2412-6179-2017-41-2-254-265
Страницы: 254-265.
Аннотация:
В работе предлагается новый подход к построению биометрического шаблона с использованием свёрточной нейронной сети и хэширующего леса. Метод состоит из двух этапов: на первом происходит обучение свёрточной нейронной сети, далее к полученным описаниям применяется хеширующее преобразование с использованием нового предложенного метода хэширующего леса. Такой способ формирования шаблона является обобщением метода Boosted SSC (Similarity Sensitive Coding) для решения задачи построения оптимального хеша, учитывающего специфику задач верификации и идентификации лиц. Обучение производилось на базе лиц CASIA-WebFace, а тестирование – на базе лиц LFW. Применительно к задачам бинарного хеширования с метрикой Хемминга описанный подход позволяет получать 200-битный (25 байт) биометрический шаблон с качеством верификации 96,3 % и
2000-битный шаблон с 98,14 % на базе изображений лиц LFW. При использовании хэширующего леса с 7-битными деревьями 2000´7 достигается уровень идентификации в 93 % относительно базовых показателей свёрточной нейронной сети в 89,9%. В результате достигается скорость формирования биометрических шаблонов (описаний лиц) с частотой более 40 изображений лиц в секунду на CPU Core i7 и более 120 изображений лиц в секунду с использованием GPU GeForce GTX 650.
Ключевые слова:
свёрточные нейронные сети, хэширование, бинарные деревья, метрика Хэмминга, биометрия.
Цитирование:
Визильтер, Ю.В. Идентификация лиц в реальном времени с использованием свёрточной нейронной сети и хэширующего леса / Ю.В. Визильтер, В.С. Горбацевич, А.В. Воротников, Н.А. Костромов // Компьютерная оптика. – 2017. – Т. 41, № 2. – С. 254-265. – DOI: 10.18287/2412-6179-2017-41-2-254-265.
Литература:
- Belkin, M. Laplacian eigenmaps and spectral techniques for embedding and clustering / M. Belkin, P. Niyogi // Proceedings of the 14th International Conference on Neural Information Processing Systems: Natural and Synthetic. – 2001. – P. 585-591.
- Gionis, A. Similarity search in high dimensions via hashing / A. Gionis, P. Indyk, R. Motwani // Proceedings of the 25th International Conference on Very Large Data Bases. – 1999. – P. 518-529.
- Gong, Y. Iterative quantization: A procrustean approach to learning binary codes for large-scale image retrieval / Y. Gong, S. Lazebnik, A. Gordo, F. Perronnin // IEEE Transactions on Pattern Analysis and Machine Intelligence. – 2012. – Vol. 35, Issue 12. – P 2916-2929. – DOI: 10.1109/TPAMI.2012.193.
- Grauman, K. Learning binary hash codes for large-scale image search / K. Grauman, R. Fergus. – In Book: Machine Learning for Computer Vision / ed. by R. Cipolla, S. Battiato, G.M. Farinella. – Berlin, Heidelberg: Springer, 2013. – P. 49-87. – ISBN: 978-3-642-28660-5. – DOI: 10.1007/978-3-642-28661-2_3.
- He, K. K-means Hashing: An affinity-preserving quantization method for learning binary compact codes / K. He, F. Wen, J. Sun // IEEE Conference on Computer Vision and Pattern Recognition (CVPR). – 2013. – P. 2938-2945. – DOI: 10.1109/CVPR.2013.378.
- Irie, G. Locally linear hashing for extracting non-linear manifolds / G. Irie, L. Zhenguo, W. Xiao-Ming, C. Shih-Fu // IEEE Conference on Computer Vision and Pattern Recognition (CVPR). – 2014. – P. 2115-2122. – DOI: 10.1109/CVPR.2014.272.
- Liu, W. Supervised hashing with kernels / W. Liu, J. Wang, R. Ji, Y.-G. Jiang, S.-F. Chang // IEEE Conference on Computer Vision and Pattern Recognition (CVPR). – 2012. – P. 2074-2081. – DOI: 10.1109/CVPR.2012.6247912.
- Salakhutdinov, R. Semantic hashing / R. Salakhutdinov, G. Hinton // International Journal of Approximate Reasoning. – 2009. – Vol. 50, Issue 7. – P. 969-978. – DOI: 10.1016/j.ijar.2008.11.006.
- Shakhnarovich, G. Learning task-specific similarity: PhD thesis / G. Shakhnarovich. – Cambridge, MA: Massachusetts Institute of Technology, 2005.
- Shakhnarovich, G. Fast pose estimation with parameter sensitive hashing / G. Shakhnarovich, P. Viola, T. Darrell // Proceedings of the Ninth IEEE International Conference on Computer Vision. – 2003. – Vol. 2. – P. 750-757. – DOI: 10.1109/ICCV.2003.1238424.
- Weiss, Y. Spectral Hashing / Y. Weiss, A. Torralba, R. Fergus. – In Book: Advances in Neural Information Processing Systems 21 – Proceedings of the 2008 Conference. – 2008. – P. 1753-1760.
- Zhang, L. Topology preserving hashing for similarity search / L. Zhang, Y. Zhang, X. Gu, J. Tang, Q. Tian // Proceedings of the 21st ACM international conference on Multimedia. – 2013. – P. 123-132. – DOI: 10.1145/2502081.2502091.
- Cao, Z. Face Recognition with Learning-based Descriptor / Z. Cao, Q. Yin, X. Tang, J. Sun // IEEE Conference on Computer Vision and Pattern Recognition (CVPR). – 2010. – P. 2707-2714. – DOI: 10.1109/CVPR.2010.5539992.
- Fan, H. Learning deep face representation / H. Fan, Z. Cao, Y. Jiang, Q. Yin, C. Doudou // arXiv preprint arXiv:1403.2802. – 2014.
- Sun, Y. Deep learning face representation by joint identification-verification / Y. Sun, X. Wang, X. Tang // Proceedings of the 27th International Conference on Neural Information Processing Systems. – 2014. – P. 1988-1996.
- Sun, Y. DeepID3: Face recognition with very deep neural networks /Y. Sun, X. Wang, X. Tang // arXiv preprint arXiv:1502.00873. – 2015.
- Sun, Y. Deep learning face representation from predicting 10,000 classes /Y. Sun, X. Wang, X. Tang // Proceedings of the 2014 IEEE Conference on Computer Vision and Pattern Recognition. – 2014. – P. 1891-1898. – DOI: 10.1109/CVPR.2014.244.
- Taigman, Y. DeepFace: closing the gap to human-level performance in face verification / Y. Taigman, M. Yang, M. Ranzato, L. Wolf // Proceedings of the 2014 IEEE Conference on Computer Vision and Pattern Recognition. – 2014. – P. 1701-1708. – DOI: 10.1109/CVPR.2014.220.
- Wang, W. Face recognition based on deep learning / W. Wang, J. Yang, J. Xiao, S. Li, D. Zhou. – In Book: Human Centered Computing / ed. by Q. Zu, B. Hu, N. Gu, S. Seng. – Vol. 8944. – Springer, 2015. – P. 812-820. – ISBN: 978-3-319-15553-1. – DOI: 10.1007/978-3-319-15554-8_73.
- Wu, X. Learning robust deep face representation / X. Wu // arXiv preprint arXiv:1507.04844. – 2015.
- Zhou, E. Naive-deep face recognition: Touching the limit of LFW benchmark or not? / E. Zhou, Z. Cao, Q. Yin // arXiv preprint arXiv:1501.04690. – 2015.
- Fan, H. Learning compact face representation: Packing a face into an int32 / H. Fan, M. Yang, Z. Cao, Y. Jiang, Q. Yin // Proceedings of the 22nd ACM international conference on Multimedia. – 2014. – P. 933-936. – DOI: 10.1145/2647868.2654960.
- Chen, D. Blessing of dimensionality: High-dimensional feature and its efficient compression for face verification / D. Chen, X. Cao, F. Wen, J. Sun // Proceedings of IEEE Computer Society Conference on Computer Vision and Pattern Recognition. – 2013. – P. 3025-3032. – DOI: 10.1109/CVPR.2013.389.
- Nguyen, H.-V. Cosine similarity metric learning for face verification / H.-V. Nguyen, L. Bai // Proceedings of 10th Asian Conference on Computer Vision. – 2010. – P. 709-720. – DOI: 10.1007/978-3-642-19309-5_55.
- Taigman, Y. Multiple one-shots for utilizing class label information / Y. Taigman, L. Wolf, T. Hassner // Proceedings of British Machine Vision Conference. – 2009. – DOI: 10.5244/C.23.77.
- Liu, J. Targeting ultimate accuracy: face recognition via deep embedding / J. Liu, Y. Deng, T. Bai, Z. Wei, C. Huang // arXiv preprint arXiv:1506.07310. – 2015.
- Qiu, Q. Random forests can hash / Q. Qiu, G. Sapiro, A. Bronstein // arXiv preprint arXiv:1412.5083. – 2014.
- Vens, C. Random forest based feature induction / C. Vens, F. Costa // Proceedings of IEEE 11th International Conference on Data Mining (ICDM). – 2011. – P. 744-753. – DOI: 10.1109/ICDM.2011.121.
- Yu, G. Scalable forest hashing for fast similarity search / G. Yu, J. Yuan // Proceedings of IEEE International Conference on Multimedia and Expo (ICME). – 2014. – P. 1-6. – DOI: 10.1109/ICME.2014.6890219.
- Springer, J. Forest hashing: Expediting large scale image retrieval / J. Springer, X. Xin, Z. Li, J. Watt, A. Katsaggelos // Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). – 2013. – P. 1681-1684. – DOI: 10.1109/ICASSP.2013.6637938.
- Mishina, Y. Boosted random forest / Y. Mishina, R. Murata, M. Tsuchiya, H. Fujiyoshi // IEICE Transactions on Information and Systems. – 2015. – Vol. E98-D, Issue 9. – P. 1630-1636. – DOI: 10.1587/transinf.2014OPP0004.
- Best-Rowden, L. Unconstrained face recognition: Identifying a person of interest from a media collection / L. Best-Rowden, H. Han, C. Otto, B. Klare, A.K. Jain // IEEE Transactions on Information Forensics and Security. – 2014. – Vol. 9, Issue 12. – P. 2144-2157. – DOI: 10.1109/TIFS.2014.2359577.
- Huang, G.-B. Learning to align from scratch /G.-B. Huang, M. Mattar, H. Lee, E. Learned-Miller // Proceedings of the 25th International Conference on Neural Information Processing Systems. – 2012. – P. 764-772.
- Schroff, F. FaceNet: A unified embedding for face recognition and clustering / F. Schroff, D. Kalenichenko, J. Philbin // Proceedings of IEEE Conference on Computer Vision and Pattern Recognition (CVPR). – 2015. – P. 815-823. – DOI: 10.1109/CVPR.2015.7298682.
© 2009, IPSI RAS
Россия, 443001, Самара, ул. Молодогвардейская, 151; электронная почта: journal@computeroptics.ru ; тел: +7 (846) 242-41-24 (ответственный
секретарь), +7 (846)
332-56-22 (технический редактор), факс: +7 (846) 332-56-20