(45-6) 17 * << * >> * Русский * English * Содержание * Все выпуски

Методика последовательного формирования набора компонент многомерной случайной величины с использованием непараметрического алгоритма распознавания образов
И.В. Зеньков 1,3,4, А.В. Лапко 2,3, В.А. Лапко 2,3, Е.В. Кирюшина 1, В.Н. Вокин 1, А.В. Бахтина 3

Сибирский федеральный университет, 660041, г. Красноярск, Россия, пр. Свободный, д. 79, стр. 3,

Институт вычислительного моделирования СО РАН,
660036, Россия, г. Красноярск, Академгородок, д. 50, стр. 44,

Сибирский государственный университет науки и технологий имени академика М.Ф. Решетнева,
660037, г. Красноярск, пр. «Красноярский рабочий», д. 31,

Федеральный исследовательский центр информационных и вычислительных технологий,
660049, г. Красноярск, просп. Мира, д. 53

 PDF, 810 kB

DOI: 10.18287/2412-6179-CO-902

Страницы: 926-933.

Аннотация:
Определяется влияние априорных сведений о независимости случайных величин на аппроксимационные свойства непараметрической оценки плотности вероятности Розенблатта–Парзена. Предлагается новая методика формирования наборов независимых компонент многомерной случайной величины. Методика основывается на проверке гипотез о независимости сочетаний компонент многомерной случайной величины с использованием двухальтернативного непараметрического алгоритма распознавания образов ядерного типа, соответствующего критерию максимального правдоподобия. Классы соответствуют областям определения плотностей вероятностей наборов независимых и зависимых компонент многомерной случайной величины. Для оценивания плотностей вероятностей используются непараметрические статистики ядерного типа. Выбор коэффициентов размытости ядерных оценок плотностей вероятностей осуществляется из условия минимума среднего квадратического критерия. Последовательная процедура формирования набора независимых компонент начинается с анализа парных сочетаний компонент многомерной случайной величины. Для каждой пары компонент вычисляется оценка вероятности ошибки распознавания классов, соответствующих предположениям независимости и зависимости рассматриваемых компонент. Определяется пара компонент с максимальным отличием этих ошибок. Если полученные ошибки достоверно не отличаются, то в рассматриваемой многомерной случайной величине независимые компоненты отсутствуют. При достоверном отличии оценок вероятностей ошибок распознавания классов устанавливается пара независимых компонент. Эти компоненты входят в набор из трёх компонент многомерной случайной величины. Анализ их сочетаний осуществляется аналогично по представленным выше рекомендациям. Правилом остановки процесса формирования набора независимых компонент является отсутствие достоверного отличия между вероятностями ошибок распознавания ситуаций, принадлежащих принятым классам. В этом случае предыдущий набор независимых компонент является искомым результатом. В отличие от традиционной методики, основанной на применении критерия Пирсона, предлагаемый подход позволяет обойти проблему декомпозиции области значений случайных величин на многомерные интервалы.
     Методика формирования набора независимых компонент многомерной случайной величины иллюстрируется результатами анализа спектральных признаков данных дистанционного зондирования лесных массивов с использованием космической съёмки со спутника Landsat-8.

Ключевые слова:
распознавание образов, обработка информации, обработка оптических данных, проверка гипотезы, формирование набора независимых признаков, непараметрический алгоритм, ядерная оценка плотности вероятности, выбор коэффициентов размытости ядерных функций, данные дистанционного зондирования.

Благодарности
Исследование выполнено при финансовой поддержке РФФИ, Правительства Красноярского края и Красноярского краевого фонда науки в рамках научного проекта № 20-41-240001..

Цитирование:
Зеньков, И.В. Методика последовательного формирования набора компонент многомерной случайной величины с использованием непараметрического алгоритма распознавания образов / И.В. Зеньков, А.В. Лапко, В.А. Лапко, Е.В. Кирюшина, В.Н. Вокин, А.В. Бахтина // Компьютерная оптика. – 2021. – Т. 45, № 6. – С. 926-933. – DOI: 10.18287/2412-6179-CO-902.

Citation:
Zenkov IV, Lapko AV, Lapko VA, Kiryushina EV, Vokin VN, Bakhtina AV. A method of sequentially generating a set of components of a multidimensional random variable using a nonparametric pattern recognition algorithm. Computer Optics 2021; 45(6): 926-933. DOI: 10.18287/2412-6179-CO-902.

Литература:

  1. Лапко, А.В. Свойства непараметрической оценки многомерной плотности вероятности независимых случайных величин / А.В. Лапко, В.А. Лапко // Информатика и системы управления. - 2012. - Т. 31, № 1. - С. 166-174.
  2. Лапко, А.В. Непараметрическая оценка плотности вероятности независимых случайных величин / А.В. Лапко, В.А. Лапко // Информатика и системы управления. - 2011. - Т. 29, № 3. - С. 118-124.
  3. Лапко, А.В. Влияние априорной информации о независимости многомерных случайных величин на свойства их непараметрической оценки плотности вероятности / А.В. Лапко, В.А. Лапко // Системы управления и информационные технологии. - 2012. - Т. 48, № 2.1. - С. 164-167.
  4. Лапко, А.В. Свойства непараметрической решающей функции при наличии априорных сведений о независимости признаков классифицируемых объектов / А.В. Лапко, В.А. Лапко // Автометрия. - 2012. - Т. 48, № 4. - С. 112-119.
  5. Пугачёв, В.С. Теория вероятностей и математическая статистика: учебное пособие / В.С. Пугачёв. – М: Физматлит, 2002. – 496 с.
  6. Лапко, А.В. Непараметрические алгоритмы распознавания образов в задаче проверки статистической гипотезы о тождественности двух законов распределения случайных величин / А.В. Лапко, В.А. Лапко // Автометрия. - 2010. - Т. 46, № 6. - С. 47-53.
  7. Лапко, А.В. Сравнение эмпирической и теоретической функций распределения случайной величины на основе непараметрического классификатора / А.В. Лапко, В.А. Лапко // Автометрия. - 2012. - Т. 48, № 1. - С. 45-49.
  8. Лапко, А.В. Методика проверки гипотез о распределениях многомерных спектральных данных с использованием непараметрического алгоритма распознавания образов / А.В. Лапко, В.А. Лапко // Компьютерная оптика. - 2019. - Т. 43, № 2. - С. 238-244. - DOI: 10.18287/2412-6179-2019-43-2-238-244.
  9. Parzen, E. On estimation of a probability density function and mode / E. Parzen // The Annals of Mathematical Statistics. – 1962. – Vol. 33, Issue 3. – P. 1065-1076. – DOI: 10.1214/aoms/1177704472.
  10. Епанечников, В.А. Непараметрическая оценка многомерной плотности вероятности / В.А. Епанечников // Теория вероятности и её применения. – 1969. – Т. 14, № 1. – С. 156-161.
  11. Rudemo, M. Empirical choice of histogram and kernel density estimators / M. Rudemo // Scandinavian Journal of Statistics. - 1982. - Vol. 9, No. 2 - P. 65-78.
  12. Hall, P. Large-sample optimality of least squares cross-validation in density estimation / P. Hall // Annals of Statistics. - 1983. - Vol. 11, Issue 4. - P. 1156-1174. – DOI: 10.1214/aos/1176346329.
  13. Silverman, B.W. Density estimation for statistics and data analysis / B.W. Silverman. - London: Chapman and Hall, 1986. - 175 p.
  14. Sheather, S. A reliable data-based bandwidth selection method for kernel density estimation / S. Sheather, M. Jones // Journal of Royal Statistical Society Series B. -  1991. - Vol. 53, Issue 3. - P. 683-690. - DOI: 10.1111/j.2517-6161.1991.tb01857.x.
  15. Sheather, S.J. Density estimation / S.J. Sheather // Statistical Science. - 2004. - Vol. 19, Issue 4. - P. 588-597. - DOI: 10.1214/088342304000000297.
  16. Terrell, G.R. Oversmoothed nonparametric density estimates / G.R. Terrell, D.W. Scott // Journal of the American Statistical Association. - 1985. - Vol. 80, Issue 389. - P. 209-214. – DOI: 10.1080/01621459.1985.10477163.
  17. Jones, M.C. A brief survey of bandwidth selection for density estimation / M.C. Jones, J.S. Marron, S.J. Sheather // Journal of the American Statistical Association. - 1996. - Vol. 91, Issue 433. - P. 401-407. – DOI: 10.2307/2291420.
  18. Scott, D.W. Multivariate density estimation: Theory, practice, and visualization / D.W. Scott. - New Jersey: John Wiley & Sons, 2015. - 384 p.
  19. Лапко, А.В. Модифицированный алгоритм быстрого выбора коэффициентов размытости ядерных оценок многомерных плотностей вероятностей / А.В. Лапко, В.А. Лапко // Измерительная техника. - 2020. - № 11. - С. 9-13. - DOI: 10.32446/0368-1025it.2020-11-9-13.
  20. Лапко, А.В. Анализ методов оптимизации непараметрической оценки плотности вероятности по коэффициенту размытости ядерных функций / А.В. Лапко, В.А. Лапко // Измерительная техника. - 2017. - № 6. - С. 3-8. – DOI: 10.32446/0368-1025it.2017-6-3-8.
  21. Шаракшанэ, А.С. Сложные системы / А.С. Шаракшанэ, И.Г. Железнов, В.А. Ивницкий. – М.: Высшая школа, 1977. – 248 с.

© 2009, IPSI RAS
Россия, 443001, Самара, ул. Молодогвардейская, 151; электронная почта: journal@computeroptics.ru; тел: +7 (846) 242-41-24 (ответственный секретарь), +7 (846) 332-56-22 (технический редактор), факс: +7 (846) 332-56-20