(44-2) 13 * << * >> * Русский * English * Содержание * Все выпуски
Классификация редких дорожных знаков
Б.В. Фаизов 1, В.И. Шахуро 1, В.В. Санжаров 1,3, А.С. Конушин 1,2
1 МГУ имени М.В. Ломоносова, Москва, Россия,
2 НИУ Высшая школа экономики, Москва, Россия,
3 РГУ нефти и газа (НИУ) имени И.М. Губкина, Москва, Россия
PDF, 1210 kB
DOI: 10.18287/2412-6179-CO-601
Страницы: 236-243.
Аннотация:
В работе исследуется возможность применения нейронных сетей для классификации объектов, которых мало или совсем нет в обучающей выборке, на примере задачи классификации редких дорожных знаков. Рассматриваются нейронные сети, обученные с использованием сравнительной функции потерь и её модификациями, а также методы генерации синтетических выборок для задач классификации. В качестве базового метода используется индексирование классов объектов при помощи нейросетевых признаков. Проводится сравнение классификаторов, обученных при помощи трёх видов синтетических выборок, а также их смесей с реальными данными. Предлагается метод классификации редких дорожных знаков, использующий нейросетевой дискриминатор редких и частых знаков. Проведённая экспериментальная оценка показала, что предложенный метод позволяет классифицировать редкие дорожные знаки без существенной потери качества на частых знаках.
Ключевые слова:
классификация дорожных знаков, синтетические обучающие выборки, нейронные сети, распознавание изображений, трансформации изображений, композиции нейросетей.
Цитирование:
Фаизов, Б.В. Классификация редких дорожных знаков / Б.В. Фаизов, В.И. Шахуро, В.В. Санжаров, А.С. Конушин // Компьютерная оптика. – 2020. – Т. 44, № 2. – С. 236-243. – DOI: 10.18287/2412-6179-CO-601.
Благодарности:
Работа В.В. Санжарова по фотореалистичному синтезу дорожных знаков выполнена при поддержке гранта РФФИ 18-31-20032 мол_а_вед «Физически-корректное моделирование освещения и синтез изображений на массивно-параллельных вычислительных системах в приложениях искусственного интеллекта», работа Б.В. Фаизова, В.И. Шахуро и А.С. Конушина по улучшению дорожных знаков с помощью нейросетей и классификации редких знаков поддержана грантом РНФ 17-71-20072 «Нейробайесовские методы в задачах машинного обучения, масштабируемой оптимизации и компьютерного зрения».
Литература:
-
Masana, M. Metric learning for novelty and anomaly detection [Electronical Resource] / M. Masana, [et al.] // arXiv preprint. – URL: https://arxiv.org/abs/1808.05492 (request date 3.10.2019).
- Zagoruyko, S. Wide residual networks [Electronical Resource] / S. Zagoruyko, N. Komodakis // arXiv preprint. – URL: https://arxiv.org/abs/1605.07146 (request date 3.10.2019).
- Krizhevsky, A. ImageNet classification with deep convolutional neural networks / A. Krizhevsky, I. Sutskever, G.E. Hinton // Advances in Neural Information Processing Systems. – 2012. – Vol. 25, Issue 2. – P. 1097-1105.
- He, K. Deep residual learning for image recognition / K. He, [et al.] // Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition. – 2016. – P. 770-778.
- Szegedy, C. Going deeper with convolutions / C. Szegedy, [et al.] // Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition. – 2015. – P. 1-9.
- Sharif Razavian, A. CNN features off-the-shelf: an astounding baseline for recognition / A. Sharif Razavian, [et al.] // Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition Workshops. – 2014. – P. 806-813.
- Huang, G. Centroid networks for few-shot clustering and unsupervised few-shot classification [Electronical Resource] / G. Huang, H. Larochelle, S. Lacoste-Julien // arXiv preprint. – URL: https://arxiv.org/abs/1902.08605 (request date 3.10.2019).
- Sankaranarayanan, S. Triplet probabilistic embedding for face verification and clustering / S. Sankaranarayanan, [et al.] // 2016 IEEE 8th International Conference on Biometrics: Theory, Applications and Systems (BTAS). – 2016. – P. 1-8.
- Hadsell, R. Dimensionality reduction by learning an invariant mapping / R. Hadsell, S. Chopra, Y. LeCun // 2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'06). – 2006. – Vol. 2. – P. 1735-1742.
- Hendrycks, D. Deep anomaly detection with outlier exposure [Electronical Resource] / D. Hendrycks, M. Mazeika, T.G. Dietterich // arXiv preprint. – URL: https://arxiv.org/abs/1812.04606 (request date 3.10.2019).
- HydraAPI [Electronical Resource]. – URL: https://github.com/Ray-Tracing-Systems/HydraAPI (request date 3.10.2019).
- Шахуро, В.И. Синтез обучающих выборок для классификации дорожных знаков с помощью нейросетей / В.И. Шахуро, А.С. Конушин // Компьютерная оптика. – 2018. – Т. 42, № 1. – С. 105-112. – DOI: 10.18287/2412-6179-2018-42-1-105-112.
- Zhu, J.Y. Unpaired image-to-image translation using cycle-consistent adversarial networks / J.Y. Zhu, [et al.] // Proceedings of the IEEE International Conference on Computer Vision. – 2017. – P. 2223-2232.
- Huang, R. Beyond face rotation: Global and local perception gan for photorealistic and identity preserving frontal view synthesis / R. Huang, [et al.] // Proceedings of the IEEE International Conference on Computer Vision. – 2017. – P. 2439-2448.
- Шахуро, В.И. Российская база изображений автодорожных знаков / В.И. Шахуро, А.С. Конушин // Компьютерная оптика. – 2016. – Т. 40, № 2. – С. 294-300. – DOI: 10.18287/2412-6179-2016-40-2-294-300.
© 2009, IPSI RAS
Россия, 443001, Самара, ул. Молодогвардейская, 151; электронная почта: ko@smr.ru ; тел: +7 (846) 242-41-24 (ответственный
секретарь), +7 (846)
332-56-22 (технический редактор), факс: +7 (846) 332-56-20