Подавление ложноположительных обнаружений лиц в видеопотоках систем видеонаблюдения
Сергеев А.Е., Конушин А.С., Конушин В.С.
НИУ Высшая школа экономики, Москва, Россия,
ООО «Технологии видеоанализа» Москва, Россия
Аннотация:
Данная работа посвящена задаче фильтрации ложноположительных обнаружений лиц людей в видеопотоках систем видеонаблюдения. Предлагается два подхода для подавления ложноположительных обнаружений в фоновых участках кадра: первый заключается в адаптации детектора под наблюдаемый видеопоток, а второй представляет собой постобработку выхода детектора за счёт анализа частоты обнаружения похожих частей кадра. Мы используем в качестве базового каскадный детектор, но метод может быть применён к другим алгоритмам. Экспериментальное оценивание показывает, что предложенные методы улучшают и точность, и полноту, при этом время работы детектора сокращается на 47 %.
Ключевые слова
:
детекторы, распознавание образов, анализ изображений, алгоритмы машинного зрения.
Цитирование:
Сергеев, А.Е. Подавление ложноположительных обнаружений лиц в видеопотоках систем видеонаблюдения / А.Е. Сергеев, А.С. Конушин, В.С. Конушин // Компьютерная оптика. – 2016. – Т. 40, № 6. – С. 958-967. – DOI: 10.18287/2412-6179-2016-40-6-958-967.
Литература:
- Verma, RC. Face detection and tracking in a video by propagating detection probabilities / R.C. Verma, C. Schmid, K. Mikolaqczyk // IEEE Transactions on Pattern Analysis and Machine Intelligence. – 2003. – Vol. 25(10). – P. 1215-1228. – DOI: 10.1109/TPAMI.2003.1233896.
- Park, D. Exploring weak stabilization for motion feature extraction / D. Park, C.L. Zitnick, D. Ramanan, P. Dollár // CVPR, IEEE Computer Society Conference on Computer Vision and Pattern Recognition, June 2013. – 2013. – P. 2882-2889. – DOI: 10.1109/CVPR.2013.371.
- Walk, S. New features and insights for pedestrian detection / S. Walk, N. Majer, K. Schindler, B. Schiele // IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2010), June 13-18, 2010, San Francisco, California, USA. – 2010. – P. 1030-1037. – DOI: 10.1109/CVPR.2010.5540102.
- Kolarow, A. APFel: The intelligent video analysis and surveillance system for assisting human operators / A. Kolarow, K. Schenk, M. Eisenbach, M. Dose, M. Brauckmann, K. Debes, H.-M. Gross // 2013 10th IEEE International Conference on Advanced Video and Signal Based Surveillance (AVSS). – 2013. – P. 195-201. – DOI: 10.1109/AVSS.2013.6636639.
- Viola, P. Robust real-time face detection / P. Viola, M.J. Jones // International Journal of Computer Vision. – 2004. – Vol. 57(2). – P. 137-154. – DOI: 10.1023/B:VISI.0000013087.49260.fb.
- Mathias, M. Face detection without bells and whistles / M. Mathias, R. Benenson, M. Pedersoli, L. Van Gool // 13th European Conference on Computer Vision (ECCV 2014), Zürich, Switzerland, September 6-12, 2014. – 2014. – P. 720-735. – DOI: 10.1007/978-3-319-10593-2_47.
- Dollár, P. Integral channel features / P. Dollár, Z. Tu, P. Perona, S. Belongie // Proceedings of the British Machine Vision Conference. – 2009. – P. 91.1-91.11. – DOI: 10.5244/C.23.91.
- Felzenswalb, P. A discriminatively trained, multiscale, deformable part model / P. Felzenswalb, D. McAllester, D. Ramanan // IEEE Conference on Computer Vision and Pattern Recognition, June 24-26, 2008 (CVPR 2008). – 2008. – P. 1-8. – DOI: 10.1109/CVPR.2008.4587597.
- Zhu, X. Face detection, pose estimation and landmark localization in the wild / X. Zhu, D. Ramanan // IEEE Computer Society Conference on Computer Vision and Pattern Recognition, June 2012 (CVPR 2012). – 2012. – P. 2879-2886. – DOI: 10.1109/CVPR.2012.6248014.
- Szegedy, C. Deep neural networks for object detection / C. Szegedy, A. Toshev, D. Erhan // Advances in Neural Information Processing Systems. – 2013. – P. 2553-2561.
- Girshick, R. Rich feature hierarchies for accurate object detection and semantic segmentation / R. Girshick, J. Donahue, T. Darrell, J. Malik // Proceedings of the 2014 IEEE Conference on Computer Vision and Pattern Recognition. – 2014. – P. 580-587. – DOI: 10.1109/CVPR.2014.81.
- Appel, R. Quickly boosting decision trees – Pruning underachieving features early / R. Appel, T. Fuchs, P. Dollár, P. Perona // Proceedings of the 30th International Conference on Machine Learning, Atlanta, Georgia, USA, 2013. – 2013. – Vol. 28. – P. 594-602.
- Dollár, P. Fast feature pyramids for object detection / P. Dollár, R. Appel, S. Belongie, P. Perona // IEEE Transactions on Pattern Analysis and Machine Intelligence. – 2014. – Vol. 36(8). – P. 1532-1545. – DOI: 10.1109/TPAMI.2014.2300479.
- Dollár, P. The fastest pedestrian detector in the west / P. Dollár, S. Belongie, P. Perona // Proceedings of the British Machine Vision Conference. – 2010. – P. 68.1-68.11. – DOI: 10.5244/C.24.68.
- Dollár, P. Crosstalk cascades for frame-rate pedestrian detection / P. Dollár, R. Appel, W. Kienzle // Proceedings of the 12th European Conference on Computer Vision. – 2012. – Part II. – P. 645-659. – DOI: 10.1007/978-3-642-33709-3_46.
- Jain, V. Online domain adaptation of a pre-trained cascade of classifiers / V. Jain, E. Miller // Proceedings of the 2011 IEEE Conference on Computer Vision and Pattern Recognition. – 2011. – P. 577-584. – DOI: 10.1109/CVPR.2011.5995317.
- Wang, M. Automatic adaptation of a generic pedestrian detector to a specific traffic scene / M. Wang, X. Wang // Proceedings of the 2011 IEEE Conference on Computer Vision and Pattern Recognition. – 2011. – P. 3401-3408. – DOI: 10.1109/CVPR.2011.5995698.
- Barnich, O. ViBe: A universal background subtraction algorithm for video sequences / O. Barnich, M. Van Droogenbroeck // IEEE Transactions on Image Processing. – 2011. – Vol. 20(6). – P. 1709-1724. – DOI: 10.1109/TIP.2010.2101613.
- Freund, Y. A decision-theoretic generalization of on-line learning and an application to boosting / Y. Freund, R.E. Schapire // Journal of Computer and System Sciences. – 1997. – Vol. 55(1). – P. 119-139. – DOI: 10.1006/jcss.1997.1504.
- Bourdev, L. Robust object detection via soft cascade / L. Bourdev, J. Brandt // Proceedings of the 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. – 2005. – Vol. 2. – P. 236-243. – DOI: 10.1109/CVPR.2005.310.
- Everingham, M. The Pascal visual object clasees (VOC) challenge / M. Everingham, L. Van Gool, C.K.I. Williams, J. Winn, A. Zisserman // International Journal of Computer Vision. – 2010. – Vol. 88(2). – P. 303-338. – DOI: 10.1007/s11263-009-0275-4.
© 2009, IPSI RAS
Institution of Russian Academy of Sciences, Image Processing Systems Institute of RAS, Russia, 443001, Samara, Molodogvardeyskaya Street 151; E-mail: ko@smr.ru; Phones: +7 (846) 332-56-22, Fax: +7 (846) 332-56-20