Автоматическое определение количества минимальных единиц языка по артикуляции
В.О. Ячная 1,2, В.Р. Луцив 1

Государственный университет аэрокосмического приборостроения,
190000, Россия, г. Санкт-Петербург, ул. Большая Морская, д. 67, лит. а;
Институт физиологии имени И.П. Павлова РАН,
199034, Россия, Санкт-Петербург, наб. Макарова, д. 6

  PDF, 992 kB

DOI: 10.18287/2412-6179-CO-1451

Страницы: 956-962.

Представленная работа посвящена автоматическому анализу паравербального компонента общения человека. В статье описаны системы, определяющие количество минимальных языковых единиц (слогов и фонем) в устной речи по видеоданным. Такие системы могут быть использованы в оценке темпа артикулирования говорящего, что может применяться в доклинической диагностике некоторых патологических состояний или определении эмоционального статуса. Для проведения исследования была модифицирована существующая база данных слов английского языка и получена разметка, содержащая информацию о количестве слогов и фонем в каждом слове. В ходе исследования адаптирована система распознавания слов для решения поставленной задачи, а также разработана новая архитектура нейронной сети для определения количества слогов и фонем в слове. Оценка эффективности разработанных систем производилась как на наборах заранее известных системам слов, так и на новых для них словах. В результате работы получена система, определяющая количество минимальных единиц языка в произнесённом слове, предоставляющая возможность последующей оценки темпа артикулирования информанта.

Ключевые слова:
распознавание речи, артикуляция, компьютерное зрение, нейронные сети.

Работа поддержана средствами федерального бюджета в рамках государственного задания ФГБУН Институт физиологии им. И.П. Павлова РАН (№ 1021062411653-4-3.1.8).

Ячная, В.О. Автоматическое определение количества минимальных единиц языка по артикуляции / В.О. Ячная, В.Р. Луцив // Компьютерная оптика. – 2024. – Т. 48, № 6. – С. 956-962. – DOI: 10.18287/2412-6179-CO-1451.

Yachnaya VO, Lutsiv VR. Automatic estimation of the number of minimal language units by articulation. Computer Optics 2024; 48(6): 956-962. DOI: 10.18287/2412-6179-CO-1451.


