Алгоритмы распознавания рукописных символов на основе построения структурных моделей
Хаустов П.А.
Томский политехнический университет
(национальный исследовательский университет) (ТПУ), Томск, Россия
Аннотация:
Статья посвящена разработке алгоритмов распознавания рукописных символов на основе построения структурных моделей, существенным преимуществом которых является возможность работы в условиях малого количества эталонных изображений. В том числе был предложен подход к скелетизации бинарного представления изображения символа, основанный на совместном применении алгоритмов Зонга–Суня и Ву–Цая. Эффективность данного подхода к утоньшению бинарного представления символа была подтверждена результатами проведённых экспериментов.
Работа содержит подробное описание всех стадий алгоритма построения структурных моделей и описание подходов к оценке степени их схожести. Приведены результаты апробации предложенных алгоритмов. Выполнено сравнение полученных результатов с результатами аналогов, способных функционировать в условиях малого количества эталонных изображений.
Ключевые слова:
распознавание символов, структурные составляющие, структурные модели, компьютерное зрение, скелетизация, бинаризация.
Цитирование:
Хаустов, П.А. Алгоритмы распознавания рукописных символов на основе построения структурных моделей / П.А. Хаустов // Компьютерная оптика. – 2017. – Т. 41, № 1. – С. 67-78. – DOI: 10.18287/2412-6179-2017-41-1-67-78.
Литература:
- Mori, Sh. Historical review of OCR research and development / Sh. Mori, Ch.Y. Suen, K. Yamamoto // Proceedings of the IEEE. – 1992. – Vol. 80, Issue 7. – P. 1029-1058. – DOI: 10.1109/5.156468.
- Helinski, M. Report on the comparison of Tesseract and ABBYY FineReader OCR engines. Technical report / M. Helinski, M. Kmieciak, T. Parkola. – Poznañ, Poland: Poznañ Supercomputing and Networking Center, 2012. – 24 p.
- Спицын, В.Г. Применение вейвлет-преобразования Хаара, метода главных компонент и нейронных сетей для оптического распознавания символов на изображениях в присутствии импульсного шума / В.Г. Спицын, Ю.А. Болотова, Н.Х. Фан, Т.Т.Ч. Буй // Компьютерная оптика. – 2016. – Т. 40, № 2. – C. 249-257. – DOI: 10.18287/2412-6179-2016-40-2-249-257.
- Breuel, T.M. High-performance ocr for printed english and fraktur using LSTM networks / T.M. Breuel, A. UlHasan, M.Al Azawi, F. Shafait // Proceedings of 12th International Conference on Document Analysis and Recognition. – 2013. – P. 683-687. – DOI: 10.1109/ICDAR.2013.140.
- Jaderberg, M. Reading text in the wild with convolutional neural networks / M. Jaderberg, K. Simonyan, A. Vedaldi, A. Zisserman // International Journal of Computer Vision. – 2016. – Vol. 116, Issue 1. – P. 1-20. - DOI: 10.1007/s11263-015-0823-z.
- Wang, T. End-to-end text recognition with convolutional neural networks / T. Wang, D.J. Wu, A. Coates, A.Y. Ng // Proceedings of the 21st International Conference on Pattern Recognition. – 2012. – P. 3304-3308.
- Lotfi, M. Combining wavelet transforms and neural networks for image classification / M. Lotfi, A. Solimani, A. Dargazany, H. Afzal, M. Bandarabadi // 41st Southeasten Symposium on System Theory, Tullahoma, TN, USA. – 2009. – P. 44-48. – DOI: 10.1109/SSST.2009.4806819.
- Wang, P.S.P. An improved structural approach for automated recognition of handprinted characters / P.S.P. Wang, A. Gupta // International Journal of Pattern Recognition and Artificial Intelligence. – 1991. – Vol. 05, Issue 01n02. – P. 97-121. – DOI: 10.1142/S0218001491000089.
- Otsu, N. A Threshold Selection Method From Gray-level Histograms. / N. Otsu // IEEE Transactions on Systems, Man, and Cybernetics. – 1979. – Vol. SMC-9(1). – P. 62-66.
- Widiarti, A.R. Comparing Hilditch, Rosenfeld, Zhang-Suen, and Nagendraprasad-Wang-Gupta Thinning / A.R. Widiarti // International Journal of Computer, Electrical, Automation, Control and Information Engineering – 2011 – Vol. 5(6). – P. 20-24.
- Zhang, T.Y. A Fast Parallel Algorithm for Thinning Digital Patterns / T.Y. Zhang, C.Y. Suen // Communications of the ACM. – 1984. – Vol. 27, Issue 3. – P. 236-239. – DOI: 10.1145/357994.358023.
- Wu, R.-Y. A new one-pass parallel thinning algorithm for binary images / R.-Y. Wu, W.-H. Tsai // Pattern Recognition Letters. – 1992. – Vol. 13, Issue 10. – P. 715-723. – DOI: 10.1016/0167-8655(92)90101-5.
- Lee, C.Y. An Algorithm for Path Connections and Its Applications. / C.Y. Lee // IRE Transactions on Electronic Computers. – 1961. – Vol. EC-10, Issue 3. – P. 346-365. – DOI: 10.1109/TEC.1961.5219222.
- Градштейн, И.С. Таблицы интегралов, сумм, рядов и произведений / И.С. Градштейн, И.М. Рыжик. – 4-е изд. – М.: Наука, 1963 – 1108 с.
- Кристофидес, Н. Теория графов. Алгоритмический подход / Н. Кристофидес. – Пер. с англ. – М.: Мир, 1978. – 432 с.
- Хаустов, П.А. Генетический алгоритм поиска множества кривых для оптического распознавания символов с использованием метода пересечений / П.А. Хаустов, В.Г. Спицын, Е.И. Максимова // Современные проблемы науки и образования. – 2014. – № 6.
- Vapnik, V.N. Support Vector Networks / V. Vapnik, C. Cortes // Machine Learning. – 1995. – № 20(3). – P. 273-297. - DOI: 10.1023/A:1022627411411.
- Хаустов, П.А. Разработка системы оптического распознавания символов на основе совместного применения вероятностной нейронной сети и вейвлет-преобразования / П.А. Хаустов, Д.С. Григорьев, В.Г. Спицын // Известия Томского политехнического университета. - 2013 – Т. 323, № 5. – C. 101-105.
- LeCun, Y. Gradient-Based Learning Applied to Document Recognition / Y. LeCun, L. Bottou, Y. Bengio, P. Haffner // Proceedings of the IEEE. – 1998. – Vol. 86, Issue 11. – P. 2278-2324. – DOI: 10.1109/5.726791.
© 2009, IPSI RAS
Россия, 443001, Самара, ул. Молодогвардейская, 151; электронная почта: ko@smr.ru ; тел: +7 (846) 242-41-24 (ответственный
секретарь), +7 (846)
332-56-22 (технический редактор), факс: +7 (846) 332-56-20