Распознавание символов на основе вейвлет-преобразования, метода главных компонент и нейронных сетей
Спицын В.Г., Болотова Ю.А., Фан Нгок Хоанг, Буй Тхи Тху Чанг
Томский политехнический университет,
(национальный исследовательский университет) (ТПУ), Томск, Россия,
Университет Ба Риа-Вунг, Вьетнам
Аннотация:
В работе предложен новый алгоритм распознавания символов в условиях импульсного шума на основе применения вейвлет-преобразования, метода главных компонент и нейронных сетей. В предлагаемом алгоритме для устранения шума и извлечения признаков из исходного изображения и его отдельных частей с помощью вейвлет-преобразования Хаара выделяются низкочастотные компоненты. Сокращение размерности извлечённых признаков осуществляется методом главных компонент. В качестве классификатора используется многослойная нейронная сеть, на входы которой подаётся сокращённый набор признаков. Одной из ключевых особенностей предлагаемого подхода является создание отдельной нейронной сети для каждого типа символа. Результаты экспериментов показывают, что разработанный алгоритм сравним по точности распознавания с системами ABBYY FineReader и Tesseract в условиях импульсного шума.
Ключевые слова
:
распознавание символов, вейвлет-преобразование, метод главных компонент, нейронные сети.
Цитирование:
Спицын, В.Г. Применение вейвлет-преобразования Хаара, метода главных компонент и нейронных сетей для оптического распознавания символов на изображениях в присутствии импульсного шума / В.Г. Спицын, Ю.А. Болотова, Н.Х. Фан, Т.Т.Ч. Буй // Компьютерная оптика. – 2016. – Т. 40, № 2. – С. 249-257. – DOI: 10.18287/2412-6179-2016-40-2-249-257.
Литература:
- Bolotova, Yu.A. License plate recognition with hierarchical temporal memory model / Yu.A. Bolotova, A.A. Druki, V.G. Spitsyn. – In: Proceedings of 9th International Forum on Strategic Technology (IFOST-2014), Chittagong, October 21-23, 2014. – Chittagong: CUET, 2014. – P. 121-124.
- Болотова, Ю.А. Распознавание автомобильных номеров на основе метода связных компонент и иерархической временной сети / Ю.А. Болотова, В.Г. Спицын, М.Н. Рудомёткина // Компьютерная оптика. – 2015. – Т. 39, № 2. – С. 275-280.
- Болотова, Ю.А. Распознавание символов на цветном фоне на основе иерархической временной модели с предобработкой фильтрами Габора / Ю.А. Болотова, А.К. Кермани, В.Г. Спицын // Электромагнитные волны и электронные системы. – 2012. – Т. 16, № 8.– С. 14-19.
- Казанский, Н.Л. Распределённая система технического зрения регистрации железнодорожных составов / Н.Л. Казанский, С.Б. Попов // Компьютерная оптика. – 2012. – Т. 36, № 3.– С. 419-428.
- Изотов, П.Ю. Технология реализации нейросетевого алгоритма в среде CUDA на примере распознавания рукописных цифр / П.Ю. Изотов, С.В. Суханов, Д.Л. Головашкин // Компьютерная оптика. – 2010. – Т. 34, № 2.– С. 243-251.
- Breuel, T.M. High-Performance OCR for Printed English and Fraktur using LSTM Networks / T.M. Breuel, A. Ul-Hasan, M.Al Azawi, F. Shafait // Proceedings of 12th International Conference on Document Analysis and Recognition. – 2013. – P. 683-687.
- Helinski, M. Report on the comparison of Tesseract and ABBYY FineReader OCR engines / M. Helinski, M. Kmieciak, T. Parkola. – Technical report. – Poznañ, Poland: Poznañ Supercomputing and Networking Center, 2012. – 24 p.
- Mori, Sh. Historical review of OCR research and development / Sh. Mori, Ch.Y. Suen, K. Yamamoto // Proceedings of the IEEE. – 1992. – Vol. 80, Issue 7. – P. 1029-1058.
- Smith, R. An overview of the Tesseract OCR Engine / R. Smith // Proceedings of 9th International Conference on Document Analysis and Recognition (ICDAR2007). – 2007. – Volume II. – P. 629-633.
- Крупин, А. ABBYFineReader: взгляд изнутри [Электронный ресурс] / А. Крупин. – URL: http://www.3dnews.ru/software/632560/.
- Breuel, T.M. The OCRopus Open Source OCR System Tech / T.M. Breuel // Proceedings of SPIE. – 2008. – Vol. 6815. – 68150F. – DOI: 10.1117/12.783598.
- Mehdi, L. Combining wavelet transforms and neural networks for image classification / L. Mehdi, A. Solimani, A. Dargazany. – In: 41st Southeasten Symposium on System Theory, Tullahoma, TN, USA. – Tullahoma, TN, USA: 2009. – P. 44-48.
- Буй, Т.Т.Ч. Распознавание лиц на основе применения метода Виолы-Джонса, вейвлет-преобразования и метода главных компонент / Т.Т.Ч. Буй, Н.Х. Фан, В.Г. Спицын // Известия Томского политехнического университета. – 2011. – Т. 320, № 5. – С. 54-59.
- Turk, M.A. Face Recognition Using Eigenfaces / M.A. Turk, A.P. Pentland // Proceedings of the IEEE. – 1991. – P. 586-591.
- Лукьяница, А.А. Цифровая обработка видеоизображений / А.А. Лукьяница, А.Г. Шишкин. – М.: Ай-Эс-Эс Пресс, 2009. – 518 с.
- Спицын, В.Г. Интеллектуальные системы: учебное пособие / В.Г. Спицын, Ю.Р. Цой. – Томск: Изд-во Томского политехнического университета, 2012. – 176 с.
- Хайкин, С. Нейронные сети. Полный курс: / С. Хайкин; пер. с англ. – 2-е изд. – М.: Издательский дом «Вильямс», 2006. – 1104 с.
- LeCun, Y. Gradient based learning applied to document recognition / Y. LeCun, L. Bottou, Y. Bengio, P. Haffner // Proceedings of the IEEE. – 1998. – Vol. 86, Issue 11. – P. 2278-2324.
- LeCun, Y. Convolutional networks and applications in vision / Y. LeCun, K. Kavukcuoglu, C. Farabet. // International Symposium on Circuits and Systems. – Paris: 2010. – P. 253-256.
- Bolotova, Yu.A. Analysis of hierarchically-temporal dependencies for handwritten symbols and gesture recognition / Yu.A. Bolotova, V.G. Spitsyn // 7th International Forum on Strategic Technology (IFOST-2012), Tomsk. – 2012. – Vol. 1. – P. 596-601.
© 2009, IPSI RAS
Institution of Russian Academy of Sciences, Image Processing Systems Institute of RAS, Russia, 443001, Samara, Molodogvardeyskaya Street 151; E-mail: ko@smr.ru; Phones: +7 (846) 332-56-22, Fax: +7 (846) 332-56-20