(49-5) 15 * << * >> * Русский * English * Содержание * Все выпуски

Разработка метода выбора моделей машинного обучения распознавания объектов на изображениях с применением логики продукционных правил
A.A. Сметанин 1, А.В. Духанов 1, М.Ю. Герасимчук 1

Национальный исследовательский университет ИТМО,
197101, Россия, г. Санкт-Петербург, Кронверкский пр., д. 49

  PDF, 1355 kB

DOI: 10.18287/2412-6179-CO-1583

Страницы: 826-834.

Аннотация:
На сегодняшний день технологии в области фото- и видеообработки данных значительно продвинулись, что позволило алгоритмам распознавания и классификации объектов достигать точности выше 90%. Такие прорывные решения стали широко использоваться в личных и профессиональных целях. Вместе с тем расширение областей применения данных решений привело к увеличению влияющих факторов и их вариаций. От таких факторов зависит качество получения и обработки изображений, включая динамику и деформацию объектов в кадре, что усложняет практическое применение соответствующих алгоритмов. Настоящая статья предлагает подход к разработке рекомендательной системы для выбора моделей машинного обучения в целях решения широкого спектра задач, связанных с обнаружением объектов в кадре изображения, полученных в различных условиях. Данный подход основан на механизме продукционных правил, которые формируются по результатам выполненных ранее исследований, а также анализа научных источников (статьи, репозитории научных программных библиотек и пр.). Результатом функционирования разрабатываемой системы является не просто перечень моделей глубокого обучения с указанием их релевантности к применению в задаче пользователя и априорными оценками значений метрик качества. Предлагаемый подход позволяет формировать предложения по созданию конвейеров машинного обучения и рекомендаций по установке и использованию соответствующих программных библиотек.

Ключевые слова:
модели и конвейеры машинного обучения, детектирование объектов, продукционные правила, рекомендательная система.

Благодарности
Данная работа была поддержана Министерством образования и науки, договор FSER-2024-0004.

Цитирование:
Сметанин, А.А. Разработка метода выбора моделей машинного обучения распознавания объектов на изображениях с применением логики продукционных правил / А.А. Сметанин, А.В. Духанов, М.Ю. Герасимчук // Компьютерная оптика. – 2025. – Т. 49, № 5. – С. 826-834. – DOI: 10.18287/2412-6179-CO-1583.

Citation:
Smetanin AA, Dukhanov AV, Gerasimchuk MY. Development of a methodology for selecting machine learning models for recognizing moving objects in a video stream based on production rules. Computer Optics 2025; 49(5): 826-834. DOI: 10.18287/2412-6179-CO-1583.

References:

  1. LeCun Y, Bengio Y, Hinton G. Deep learning. Nature 2015; 521(7553): 436-444. DOI: 10.1038/nature14539.
  2. Butz MV. Towards strong AI. KI – Künstliche Intelligenz 2021; 35(1): 91-101. DOI: 10.1007/s13218-021-00705-x.
  3. Adomavicius G, Tuzhilin A. Toward the next generation of recommender systems: A survey of the state-of-the-art and possible extensions. IEEE Trans Knowl Data Eng 2005; 17(6): 734-749. DOI: 10.1109/TKDE.2005.99.
  4. Tu NV, Cuong LA. A deep learning model of multiple knowledge sources integration for community question answering. VNU Journal of Science: Computer Science and Communication Engineering 2021; 37(1). Source: <https://jcsce.vnu.edu.vn/index.php/jcsce/article/view/295/128>. DOI: 10.25073/2588-1086/vnucsce.295.
  5. Diwan T, Anirudh G, Tembhurne JV. Object detection using YOLO: challenges, architectural successors, datasets and applications.Multimed Tools Appl 2023; 82(6): 9243-9275. DOI: 10.1007/s11042-022-13644-y.
  6. Chen W, et al. YOLO-face: a real-time face detector. Vis Comput 2021; 37(4): 805-813. DOI: 10.1007/s00371-020-01831-7.
  7. Liu W, et al. SSD: Single shot multibox detector. In Book: Leibe B, Matas J, Sebe N, Welling M, eds. Computer vision – ECCV 2016. 14th European Conference, Amsterdam, The Netherlands, October 11–14, 2016, Proceedings, Part I. Cham, Switzerland: Springer International Publishing AG; 2016: 21-37. DOI: 10.1007/978-3-319-46448-0_2.
  8. He K, et al. Mask R-CNN. IEEE Trans Pattern Anal Mach Intell 2020; 42(2): 386-397. DOI: 10.1109/TPAMI.2018.2844175.
  9. Chaudhuri A. Hierarchical modified fast R-CNN for object detection. Informatica (Slovenia) 2021; 45(7): 67-82. DOI: 10.31449/inf.v45i7.3732.
  10. Chen W, et al. A review of object detection: Datasets, performance evaluation, architecture, applications and current trends.Multimed Tools Appl 2024; 83(24): 65603-65661. DOI: 10.1007/S11042-023-17949-4.
  11. He X, Zhao K, Chu X. AutoML: A survey of the state-of-the-art.Knowl Based Syst 2021; 212: 106622. DOI: 10.1016/j.knosys.2020.106622.
  12. saaresearch/ODRS 2025. Source: <https://github.com/saaresearch/ODRS>.
  13. Chen X, et al. No-reference color image quality assessment: from entropy to perceptual quality. EURASIP J Image Video Process 2019; 2019(1): 77. DOI: 10.1186/s13640-019-0479-7.
  14. saaresearch/ODRS_WEB. 2025. Source: <https://github.com/saaresearch/ODRS_WEB>.
  15. Aerial Maritime Drone. 2025. Source: <https://www.kaggle.com/datasets/ammarnassanalhajali/aerial-maritime>.
  16. InSystem – Intelligent Systems AI. 2025. Source: <https://insystem.io/>.
  17. iTMO. 2025. Source: <https://en.itmo.ru/>.
  18. AIRI. AIRI Institute. 2025. Source: <https://airi.net/?force=en>.

© 2009, IPSI RAS
Россия, 443001, Самара, ул. Молодогвардейская, 151; электронная почта: journal@computeroptics.ru; тел: +7 (846) 242-41-24 (ответственный секретарь), +7 (846) 332-56-22 (технический редактор), факс: +7 (846) 332-56-20