Skip to content

[Критерий стабильности интонации] Гипотезы критерия и их проблемы

Evgeny Belousov edited this page Dec 27, 2021 · 4 revisions

0. Общая информация

Работа над критерием, в данный момент, ведётся в этой ветке.

1. Гипотезы

1.1. Гипотеза скачков тона речи

На текущий момент, для критерия стабильности интонации была выдвинута и проработана следующая гипотеза: интонация считается нестабильной, если в отрезке речи докладчика (например, в рамках одного слайда презентации) наблюдается высокое количество скачков тона речи. При этом:

  • Допустимая величина скачка тона (в Гц) должна быть определена экспериментально на основе обработки нескольких выступлений разных докладчиков.
  • Количество допустимых скачков также определяется на основе обработки нескольких выступлений разных докладчиков, в речи которых, субъективно, не содержится резких скачков интонации.

2. Выявленные проблемы

2.1. Проблема гипотезы скачков тона речи

Подразумевается, что тренажёр публичных выступлений может быть использован докладчиком в любых условиях, то есть в различных помещениях, с записью речи на различное железо. Это естественно, поскольку собирать всех тренирующихся в одних и тех же условиях (условно, студия) является накладным занятием, а также сильно ограничивает доступность тренажёра.

Однако, из-за использования различного технического оснащения (качество записи микрофона, диапазон частот), а также различных условий записи выступления, возникает проблема, при которой приемлемый диапазон частот может сильно отличаться от одной аудиозаписи к другой. Вследствие этого, например, на плохом микрофоне с шумами любое увеличение громкости речи, либо усиление фонового шума может сильно испортить интонационный портрет речи, и, соответственно, критерий не будет удовлетворён, аудиозапись будет забракована. При этом, субъективно, на слух запись будет восприниматься достаточно комфортно, чтобы без проблем разобрать речь, а резких перепадов тона речи не будет слышно.

В то же время, на микрофоне с более высоким качеством записи (отсутствие фонового шума, шире диапазон частот) каждая пауза между словами воспринимается как резкий скачок, поскольку при микрофоне с плохим качеством разница между фоновым шумом и тоном речи докладчика была меньше, чем между тишиной (т.е. отсутствуют фоновые шумы) и тоном речи докладчика при более продвинутом качестве записи.

Примеры проанализированных докладов

Для демонстрации проблемы, ниже представлены примеры анализа трёх разных выступлений от трёх разных людей, записанные на три разных по качеству микрофона.

Общая информация:

  1. Докладчики: мужчины со среднестатистическим тоном мужского голоса (диапазон фундаментальной частоты - 75-200 [Гц]).
  2. Длительность обработанной записи: 20 [с].
  3. Пороговое значение для скачка интонации: 150 [Гц].
  4. Приемлемое количество скачков на записи: 10.
  5. Легенда:
    • розовая линия - интонационный рисунок речи;
    • чёрный крестик - локальный максимум, являющийся верхним значением текущего скачка;
    • синий крестик - локальный минимум, являющийся нижним значением текущего скачка.

Доклад №1.

Субъективная оценка качества записи: удовлетворительное качество (зашумлённость высокая, однако разобрать речь можно).

Сэмпл аудиозаписи: [Будет исправлено: здесь должен был быть сэмпл записи на несколько секунд, однако Google Drive не позволил открыть аудиозапись по ссылке для других пользователей]

Графики:

  • Спектрограмма:

Спектрограмма доклада №1

  • Интонационный рисунок:

Интонационный рисунок доклада №1

  • Интонационный рисунок с выделением интонационных скачков (разрывов):

Интонационный рисунок с выделением интонационных скачков доклада №1

Итого интонационных скачков на записи: 19 - критерий не удовлетворён.


Доклад №2.

Субъективная оценка качества записи: отличное качество (зашумлённость практически отсутствует, речь полностью понятна).

Сэмпл аудиозаписи: [Будет исправлено: здесь должен был быть сэмпл записи на несколько секунд, однако Google Drive не позволил открыть аудиозапись по ссылке для других пользователей]

Графики:

  • Спектрограмма:

Спектрограмма доклада №2

  • Интонационный рисунок:

Интонационный рисунок доклада №2

  • Интонационный рисунок с выделением интонационных скачков (разрывов):

Интонационный рисунок с выделением интонационных скачков доклада №2

Итого интонационных скачков на записи: 4 - критерий удовлетворён.


Доклад №3.

Субъективная оценка качества записи: плохое качество (зашумлённость высокая, речь не всегда можно разобрать).

Сэмпл аудиозаписи: [Будет исправлено: здесь должен был быть сэмпл записи на несколько секунд, однако Google Drive не позволил открыть аудиозапись по ссылке для других пользователей].

Графики:

  • Спектрограмма:

Спектрограмма доклада №3

  • Интонационный рисунок:

Интонационный рисунок доклада №3

  • Интонационный рисунок с выделением интонационных скачков (разрывов):

Интонационный рисунок с выделением интонационных скачков доклада №3

Итого интонационных скачков на записи: 9 - критерий удовлетворён.


2.2. TBC

Clone this wiki locally