Опубликован: 26.10.2007 | Доступ: свободный | Студентов: 2293 / 735 | Оценка: 4.04 / 3.76 | Длительность: 17:47:00
ISBN: 978-5-94774-810-9
Лекция 1:

Потребительские свойства телефонных аппаратов. Принципы построения микрофона и телефона

Лекция 1: 12345 || Лекция 2 >

Возможны два варианта оценки качества речи: по критерию "лучше/хуже" либо в баллах по пятибалльной шкале. Ниже приводятся рекомендуемая градация интегральной оценки качества речи, прошедшей через тракт (таблица 1.3), градации качества речи по смысловой разборчивости (таблица 1.4) и градации по узнаваемости (таблица 1.5).

Таблица 1.3. Градации интегральной оценки качества речи, прошедшей через тракт
Балл Оценка качества характеристика оцениваемого тракта
5 Отлично В речи, прошедшей через оцениваемый тракт, незаметны какие-либо дополнительные искажения или помехи по сравнению с речью, прошедшей через эталонный тракт
4 Хорошо Отличие речи на входе оцениваемого тракта от речи на выходе эталонного тракта не воспринимается как ухудшение, а наличие незначительных искажений и помех не создает затруднений при разговоре
3 Удовлетворительно В речи на выходе оцениваемого тракта, по сравнению с эталонным трактом, имеются заметные искажения или помехи, несколько затрудняющие ведение разговора и требующие напряженного внимания
2 Неудовлетворительно Искажения и помехи — сильные. Ощущается чувство утомления и раздражения. Разговор возможен лишь при сильном напряжении внимания и при условии привыкания к звучанию передаваемой оцениваемым трактом речи
1 Плохо Разговор практически невозможен из-за сильных искажений или помех
Таблица 1.4. Градации качества речи по узнаваемости
Балл Оценка качества характеристика оцениваемого тракта
5 Отлично Голос говорящего узнается без затруднений сразу после начала разговора
4 Хорошо Голос говорящего узнается без затруднений через некоторое время после начала разговора и при повторных разговорах с данным лицом по оцениваемому тракту. После привыкания к звучанию голоса этого лица по оцениваемому тракту узнавание голоса говорящего не вызывает затруднений
3 Удовлетворительно Голос говорящего узнается с трудом, больше по манере говорить, чем по звучанию. Голоса разных лиц различаются с трудом
2 Неудовлетворительно Узнаются только голоса лиц с особо характерной манерой говорить. Тембр звучания речи усредненный не несущий индивидуальных особенностей
1 Плохо Узнаваемость отсутствует
Таблица 1.5. Градации качества речи по смысловой разборчивости (наличию переспросов, неверно понятых фраз)
Балл Оценка качества характеристика оцениваемого тракта
5 Отлично Понимание содержания речи корреспондента; полное без переспросов (за исключением всплеска шумов в телефонной сети) для любого голоса, в т.ч. для голосов с некоторыми дефектами произношения
4 Хорошо Понимание речи полное, но возможны переспросы необычных слов, а также фамилий и терминов
3 Удовлетворительно При разговоре необходимы переспросы отдельных слов и фраз, но в целом ошибочного восприятия принимаемой речи не происходит
2 Неудовлетворительно Отдельные слова во фразах не понимаются даже после их повторения при переспросе, и их значение приходится объяснять целыми фразами. Разговор приходится вести в замедленном темпе
1 Плохо Смысл передаваемой информации понимается с трудом, выпадают отдельные фразы

В настоящее время, при появлении цифровых методов преобразования и передачи речи с помощью Internet, процесс определения параметров качества речи желательно автоматизировать. Субъективные оценки с помощью человека требуют большого числа испытаний, поскольку их результаты зависят от множества принципиально случайных факторов (настроения участников, состояния здоровья, времени рабочего дня и т. п.). Для уменьшения влияния этих факторов создаются объективные методы испытаний, основанные на инструментальных средствах. В настоящее время определены несколько модификаций стандартизированных методов измерения качества восприятия речи [1.34, 1.38, 1.39]:

  • PSQM (Perceptual Speech Quality Measure) — измерение качества восприятия речи — экспериментальная версия, предназначенная для оценки качества передачи речи в системе сотовой связи GSM [1.38];
  • PESQ — Perceptual Evaluating of Speech Quality — оценка качества восприятия речи [1.39].

На исходящих пунктах в системы автоматизации устанавливаются устройства, производящие следующие действия:

  1. автоматическое установление соединения;
  2. передачу проверочной последовательности;
  3. прием этой последовательности после прохождения по сети на звуковую карту;
  4. сравнение между собой переданной и принятой последовательностей.

Подобные устройства будут рассмотрены в дальнейшем в разделе, посвященном автоматическим устройствам поддержки эксплуатации (например, автоабонентам).

Акустические свойства человеческого уха

Требования к потребительским характеристикам телефонного аппарата определяются в первую очередь свойствами человеческого уха.

Главные факторы, влияющие на слышимость, — мощность звукового давления и частота колебаний звука.

На рис. 1.2 показана так называемая "диаграмма слуха" [1.1] .

Диаграмма слуха

Рис. 1.2. Диаграмма слуха

Здесь показаны области частот и звуковых давлений. Звуковое давление, обозначенное \delta, измеряется в Паскалях (Па). С правой стороны диаграммы дана удельная мощность в Вт/м2, обозначаемая I Вт/м2, а в средней части диаграммы показана относительная безразмерная величина — интенсивность, обозначаемая L_p.

Интенсивность пропорциональна квадрату звукового давления.

L_p величина определяется формулой

L_p=2\lg{\frac{\partial_p}{\partial_{p_{ПОР}}}=\lg \frac{I}{I_{ПОР}}

В определении L_p принято использовать стандартный порог слышимости

\delta_{P_{ПОР}}=2\times10^{-5} Па

или L_p[дБ], определяемую формулой

L_p[\partial Б]=20\lg{\frac{\partial_p}{\partial_{p_{ПОР}}}=10\lg \frac{I}{I_{ПОР}}

В этом определении L_{p(дБ)} I_{ПОР} = 10^{-12}Вт/м^2 в децибелах; это есть безразмерная величина, но название указывает на другой принцип ее определения.

Области показывают звуки, которые воспринимает человеческое ухо. Верхняя кривая показывает порог болевого ощущения, когда волна перестает восприниматься как звук, вызывая в ухе давление и боли. Нижняя кривая показывает порог слышимости. На ней можно увидеть, что в области 1000 Гц звуки воспринимаются в наибольшем диапазоне от наименьшей интенсивности (удельной мощности, звукового давления) до максимального значения. Звук на этой частоте воспринимается при изменении интенсивности от 0 дБ до 140 дБ.

Промежуточные кривые показывают точки субъективного показателя \beta — громкости звука, оценка которого дается человеком (в понятиях "громче", "еще громче", "тише", "еще тише"). Единица измерения громкости называется "фон".

При частоте 1000 Гц этот субъективный показатель совпадает с объективными показателями:

L_p[\partial Б] = \beta [фон]

Например, при \delta = 2 Па (или, что одно и то же, I = 10^{-2} Вт/м^{2} ). Эти показатели совпадают и равны

L_p[\partial Б]=20\lg{\frac{2}{2\times10^{-5}}}=10\lg \frac{10^{-2}}{10^{-2}}=100\partial Б

На уровне порога слышимости (на рисунке 1.2 нижняя кривая) для того чтобы получить одинаково различимый уровень громкости на частоте 16 Гц требуется \delta = 0,2 Па ( I = 10^{-4} Вт/м^{2} ), а на частоте 1000 Гц \delta = 2 \times 10^{-5} Па ( I = 10^{-12} Вт/м^{2} ).

При высоких значениях звукового давления (на рисунке 1.2 верхние кривые) звук на этих же частотах, отклоняющихся от 1000 Гц, воспринимается громче и раньше наступает болевой порог, чем на частоте 1000 Гц.

Например, на частотах 62,5 Гц и 8000 Гц болевой порог наступает при звуковом давлении \delta = 20 Па, а на частоте 1000 Гц — при \delta = 200 Па.

Есть области звукового давления, где величины громкости и объективные показатели совпадают на больших участках диаграммы. Но, несмотря на это, эффект неравномерной слышимости на различных частотах необходимо учитывать при передаче и приеме речи.

Лекция 1: 12345 || Лекция 2 >
Павел Ковалёв
Павел Ковалёв
Кристина Руди
Кристина Руди