(44-2) 13 * << * >> * Русский * English * Содержание * Все выпуски

Классификация редких дорожных знаков
Б.В. Фаизов 1, В.И. Шахуро 1, В.В. Санжаров 1,3, А.С. Конушин 1,2

МГУ имени М.В. Ломоносова, Москва, Россия,
НИУ Высшая школа экономики, Москва, Россия,
РГУ нефти и газа (НИУ) имени И.М. Губкина, Москва, Россия

 PDF, 1210 kB

DOI: 10.18287/2412-6179-CO-601

Страницы: 236-243.

Аннотация:
В работе исследуется возможность применения нейронных сетей для классификации объектов, которых мало или совсем нет в обучающей выборке, на примере задачи классификации редких дорожных знаков. Рассматриваются нейронные сети, обученные с использованием сравнительной функции потерь и её модификациями, а также методы генерации синтетических выборок для задач классификации. В качестве базового метода используется индексирование классов объектов при помощи нейросетевых признаков. Проводится сравнение классификаторов, обученных при помощи трёх видов синтетических выборок, а также их смесей с реальными данными. Предлагается метод классификации редких дорожных знаков, использующий нейросетевой дискриминатор редких и частых знаков. Проведённая экспериментальная оценка показала, что предложенный метод позволяет классифицировать редкие дорожные знаки без существенной потери качества на частых знаках.

Ключевые слова:
классификация дорожных знаков, синтетические обучающие выборки, нейронные сети, распознавание изображений, трансформации изображений, композиции нейросетей.

Цитирование:
Фаизов, Б.В. Классификация редких дорожных знаков / Б.В. Фаизов, В.И. Шахуро, В.В. Санжаров, А.С. Конушин // Компьютерная оптика. – 2020. – Т. 44, № 2. – С. 236-243. – DOI: 10.18287/2412-6179-CO-601.

Благодарности:
Работа В.В. Санжарова по фотореалистичному синтезу дорожных знаков выполнена при поддержке гранта РФФИ 18-31-20032 мол_а_вед «Физически-корректное моделирование освещения и синтез изображений на массивно-параллельных вычислительных системах в приложениях искусственного интеллекта», работа Б.В. Фаизова, В.И. Шахуро и А.С. Конушина по улучшению дорожных знаков с помощью нейросетей и классификации редких знаков поддержана грантом РНФ 17-71-20072 «Нейробайесовские методы в задачах машинного обучения, масштабируемой оптимизации и компьютерного зрения».

Литература:

  1. Masana, M. Metric learning for novelty and anomaly detection [Electronical Resource] / M. Masana, [et al.] // arXiv preprint. – URL: https://arxiv.org/abs/1808.05492 (request date 3.10.2019).
  2. Zagoruyko, S. Wide residual networks [Electronical Resource] / S. Zagoruyko, N. Komodakis // arXiv preprint. – URL: https://arxiv.org/abs/1605.07146 (request date 3.10.2019).
  3. Krizhevsky, A. ImageNet classification with deep convolutional neural networks / A. Krizhevsky, I. Sutskever, G.E. Hinton // Advances in Neural Information Processing Systems. – 2012. – Vol. 25, Issue 2. – P. 1097-1105.
  4. He, K. Deep residual learning for image recognition / K. He, [et al.] // Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition. – 2016. – P. 770-778.
  5. Szegedy, C. Going deeper with convolutions / C. Szegedy, [et al.] // Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition. – 2015. – P. 1-9.
  6. Sharif Razavian, A. CNN features off-the-shelf: an astounding baseline for recognition / A. Sharif Razavian, [et al.] // Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition Workshops. – 2014. – P. 806-813.
  7. Huang, G. Centroid networks for few-shot clustering and unsupervised few-shot classification [Electronical Resource] / G. Huang, H. Larochelle, S. Lacoste-Julien // arXiv preprint. – URL: https://arxiv.org/abs/1902.08605 (request date 3.10.2019).
  8. Sankaranarayanan, S. Triplet probabilistic embedding for face verification and clustering / S. Sankaranarayanan, [et al.] // 2016 IEEE 8th International Conference on Biometrics: Theory, Applications and Systems (BTAS). – 2016. – P. 1-8.
  9. Hadsell, R. Dimensionality reduction by learning an invariant mapping / R. Hadsell, S. Chopra, Y. LeCun // 2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'06). – 2006. – Vol. 2. – P. 1735-1742.
  10. Hendrycks, D. Deep anomaly detection with outlier exposure [Electronical Resource] / D. Hendrycks, M. Mazeika, T.G. Dietterich // arXiv preprint. – URL: https://arxiv.org/abs/1812.04606 (request date 3.10.2019).
  11. HydraAPI [Electronical Resource]. – URL: https://github.com/Ray-Tracing-Systems/HydraAPI (request date 3.10.2019).
  12. Шахуро, В.И. Синтез обучающих выборок для классификации дорожных знаков с помощью нейросетей / В.И. Шахуро, А.С. Конушин // Компьютерная оптика. – 2018. – Т. 42, № 1. – С. 105-112. – DOI: 10.18287/2412-6179-2018-42-1-105-112.
  13. Zhu, J.Y. Unpaired image-to-image translation using cycle-consistent adversarial networks / J.Y. Zhu, [et al.] // Proceedings of the IEEE International Conference on Computer Vision. – 2017. – P. 2223-2232.
  14. Huang, R. Beyond face rotation: Global and local perception gan for photorealistic and identity preserving frontal view synthesis / R. Huang, [et al.] // Proceedings of the IEEE International Conference on Computer Vision. – 2017. – P. 2439-2448.
  15. Шахуро, В.И. Российская база изображений автодорожных знаков / В.И. Шахуро, А.С. Конушин // Компьютерная оптика. – 2016. – Т. 40, № 2. – С. 294-300. – DOI: 10.18287/2412-6179-2016-40-2-294-300.

© 2009, IPSI RAS
Россия, 443001, Самара, ул. Молодогвардейская, 151; электронная почта: ko@smr.ru ; тел: +7 (846) 242-41-24 (ответственный секретарь), +7 (846) 332-56-22 (технический редактор), факс: +7 (846) 332-56-20