Расчет битрейта для стрима. Что такое битрейты? Как они влияют на качество музыки и видео

  • 02.08.2019

Open Broadcaster Software (далее OBS) - бесплатная программа для онлайн-трансляций и записи видео. Скачать программу вы можете на официальном сайте http://obsproject.com

На данный момент есть две версии OBS:

  • OBS Classic - старая версия программы, поддержка разработчиками прекращена.
  • OBS Studio - текущая версия, об особенностях, функционале и настройке которой мы и расскажем.

Для начала работы с OBS скачайте OBS Studio с официального сайта. Скачивание начнется после нажатия на кнопку с Вашей операционной системой. На выбор предоставляется Windows 7, 8, 8.1, 10, macOS 10.11+ и Linux. Проверьте название скачиваемого файла и убедитесь, что скачиваете полную версию программы. Установщик должен содержать словосочетание Full-Installer после версии программы. Например, OBS-Studio-22.0.2-Full-Installer.

Программа устанавливается на ПК сразу в двух версиях - OBS Studio (32bit) и OBS Studio (64bit). Разница между ними в том, что 64-битная версия будет использовать больше оперативной памяти. Это нужно в том случае, когда вы используете процессы, требующие большого количества памяти. Запускайте программу от имени администратора и следите за её производительностью и работой. В каком-то случае лучше будет использовать 64-бит, в другом 32-бит.

Главное окно

Открывая OBS, мы видим главное окно, которое состоит из:

  1. Превью трансляции и режим студии
  2. Список сцен
  3. Список источников
  4. Микшер с ползунками исходящего и входящего звука
  5. Переходы между сценами
  6. Меню управления трансляцией
  7. Состояние трансляции

Главное окно

В первую очередь выясним, что такое сцены и источники. Сцена - это все заданные источники, которые будут видеть зрители. Источники - это окна (вебкамера, игра, изображение, браузер, текст и прочее), которые вы добавляете на сцену. Грубо говоря, сцена - это экран зрителей, а источники - всё, что будет отображаться на экране. Чтобы каждый раз не настраивать одну сцену под разные игры, у вас есть возможность создать несколько сцен с индивидуальными настройками и переключаться между ними. С помощью режима студии можно настраивать сцену до её вывода на экран.

Чтобы изменить размер источника, кликните на его название и в превью трансляции появится выделенная красным граница источника. Потащите мышкой за одну из сторон, и вы измените размер.

Кнопки управления источниками и сценами (слева на право):

  • создать сцену/источник;
  • удалить выбранную сцену/источник;
  • свойства источника;
  • переместить выше по списку сцену/источник выше по списку. Источник, находящийся выше по списку, будет на экране отображаться на переднем плане, а тот, что ниже - на заднем;
  • переместить ниже по списку сцену/источник.

Основные настройки

Перед запуском онлайн трансляции необходимо настроить программу, выбрать сервер, выставить качество, назначить горячие клавиши и т.д. Для этого нажимаем на «Настройки».

Вкладка «Общие»

Вкладка «Общие»

Вкладка «Общие» отвечает за язык OBS, тему программы (Acri, Dark, Default, Rachni), общие настройки онлайн трансляции и источников. Пропустим детальный разбор каждой опции, заметим только «Автоматически включать запись во время трансляции». Если вы хотите иметь записи трансляций на физическом носителе, то эта опция будет вам полезна (учтите только то, что это добавит дополнительную нагрузку на ЦП).

Вкладка «Вещание»

Вкладка «Вещание»

В этой вкладке вы можете прикрепить свою трансляцию к платформе, на которой будет она проходить.

Настройка «Тип вещания» предлагает два выбора:

  • Сервисы вещания - стрим-платформы;
  • Пользовательский сервер вещания - трансляция с собственного сервера.

К примеру, возьмём настройку трансляции для Twitch.tv. Заходим в «Типы вещания», Twitch должен быть выбран «Сервисом» по умолчанию, «Сервер» - чем ближе, тем лучше у вас будет соединение, «Ключ потока» указан в вашем аккаунте на стрим-платформе.

Вкладка «Вывод»

Вкладка «Вывод»

Данная вкладка отвечает за настройку кодирования трансляции и локальную запись. Окно настроек поделено на 2 «Режима вывода»:

  • Простой - простые настройки кодирования трансляции и записи;
  • Расширенный - более детальные настройки кодирования и записи.

Расширенный режим вывода предоставляет больше настроек для трансляции и рекомендуется к использованию. С более детальной настройкой качество изображение на вашей трансляции будет выглядеть лучше.

Разберем более детально два режима вывода, начнем с простого.

Простой режим

«Потоковое вещание» - основные настройки трансляции:

  • Битрейт видео - битрейт для видео трансляции;
  • Кодировщик - кодировщик трансляции. В зависимости от ПК можно выбрать один из вариантов:
    • Программный (х264) - кодировщик, который задействует процессорный кодировщик CPU;
    • Аппаратный (NVENC) - кодировщик, который задействует видеопроцессор GPU (доступен только для видеокарт Nvidia с технологией CUDA);
    • Аппаратный (AMD) - кодировщик, который задействует видеопроцессор GPU (доступен только для видеокарт AMD с технологией AMD APP);
    • Аппаратный (QSV) - кодировщик, который задействует графический чип процессора Intel (поколения Sandy Bridge и более поздних);
  • Битрейт аудио - битрейт звука трансляции;
  • Включить дополнительные настройки кодировщика - более расширенные настройки кодировщика, которые содержат:
    • Следовать ограничениям битрейта, накладываемые потоковой службой - принудительное ограничение битрейта трансляции согласно требованиям провайдера;
    • Предустановки кодировщика (выше = меньше нагрузка на ЦП) - список предустановок для кодировщика. Если кодировщик NVENC или AMD - выбирайте на ваше усмотрение, для х264 рекомендуется veryfast;
    • Пользовательские настройки кодировщика - поле для точных параметров кодировщика.

«Запись» - настройки записи трансляции на физический носитель:

  • Качество записи - выбор качества записи для сохранения, по умолчанию стоит то же, что и у трансляции;
  • Формат записи - формат, в котором сохранится запись трансляции. Формат выбирается в зависимости от того, для чего вам запись;

Теперь рассмотрим расширенный режим.

«Потоковое вещание» содержит основные настройки кодировщика.
  • Звуковая дорожка - выбор одной из шести звуковых дорожек, которая будет задействоваться во время трансляции.
  • Кодировщик - кодировщик на выбор, как и в простом режиме:
    • Программный (х264) - кодировщик, который задействует процессор CPU;
    • Аппаратный (NVENC H.264) - кодировщик, который задействует видеопроцессор GPU(доступен только для видеокарт Nvidia с технологией CUDA);
    • Аппаратный (H264/AVC Encoder (AMD Advanced Media Framework)) - кодировщик, который задействует видеопроцессор GPU (доступен только для видеокарт AMD с технологией AMD APP);
    • Аппаратный (QSV H.264) - кодировщик, который задействует графический чип процессора Intel (поколения Sandy Bridge и более поздних);
  • Принудительно использовать настройки кодировщика потоковой службы - принудительное ограничение кодировщика трансляции согласно требованиям провайдера.
  • Перемасштабировать вывод - изменить масштаб изображения трансляции в указанное разрешение.

Настройки кодировщика NVENC H.264

    • CBR - постоянный битрейт;
    • CQP - одна из разновидностей постоянного битрейта. Разница с CBR в размере файла;
    • VBR - переменный битрейт.
    • Без потерь - малый битрейт при быстром кодировании.
  • Битрейт - значение битрейта для трансляции.
  • Пресет - предустановка для кодирования. Параметр, отвечающий за качество кодировки и нагрузку видеокарты. Для каждый видеокарты выставляется индивидуально:
  • Профиль - стандарт кодирования, выбрать нужно в зависимости от стрим-платформы;
    • main - Основной профиль;
    • high - Высокий профиль;
    • high444p - профиль Hi422P;
    • baseline - Базовый профиль.
  • Уровень - список ограничений для выбранного профиля.
  • Использовать двухпроходное кодирование - параметр, контролирующий качество изображения с двух-поточным кодированием. С битрейтом СBR опция недоступна.
  • GPU - указание количества видеокарт, используемых для трансляции.

Настройки кодировщика x264

  • Управление битрейтом - параметры работы битрейта для трансляции:
    • CBR - постоянный битрейт;
    • VBR - переменный битрейт;
    • ABR - средний битрейт;
    • CRF - битрейт определяется отдельным CRF значением. СRF не поддерживается многими стрим-платформами, но качество изображения у него выше. Изначально имеет значение 23, можно изменять от 0 до 51, когда 0 - лучшее качество изображения, а 51 - худшее.
  • Использовать пользовательский размер буфера - установка значения буфера, по умолчанию равен битрейту
  • Интервал ключевых кадров (сек, 0=авто) - параметр, отвечающий за интервал ключевых кадров. Для платформ Twitch, Youtube нужно выставить на 2
  • Предустановка использования ЦП (выше = меньше) - предустановка, определяющая скорость кодирования и степень использования процессора. Изначально установлена veryfast. Самую быстрая скорость у ultrafast, но и самое худшее качество изображения. Самая медленная скорость у placebo, как и самое лучшее качество изображения. Не каждый процессор может нормально работать с fast, поэтому для обладателей 4-ядерных процессоров veryfast - самый оптимальный выбор.
    • high - Высокий профиль
    • main - Основной профиль
    • baseline - Базовый профиль
  • Настройка - параметр, определяющий оптимизацию видео для трансляции. По умолчанию не используется.
  • Variable Framerate - параметр, включающий колебание FPS
  • Настройки х264 (разделённые пробелом) - поле для задания собственных настроек кодировщика

Настройки для кодировщика QuickSync H.264

  • Target Usage - параметр, показывающий степень использования аппаратных средств кодировщиком
    • Quality - Качественное
    • Balanced - Сбалансированное
    • Speed - Быстрое
  • Профиль - стандарт кодирования, выбрать нужно в зависимости от стрим-платформы.
    • high - Высокий профиль
    • main - Основной профиль
    • baseline - Базовый профиль
  • Интервал ключевых кадров (сек, 0=авто) - параметр, отвечающий за интервал ключевых кадров. Для платформ Twitch, Youtube нужно выставить на 2
  • Async Depth - возможность для обрабатывания сразу несколько задач с помощью Media SDK без синхронизации. Без опыта настройки лучше не менять.
  • Управление битрейтом - параметры работы битрейта для трансляции:
    • CBR - постоянный битрейт
    • VBR - переменный битрейт
  • Максимальный битрейт - показательно максимального битрейта трансляции
    • CQP - одна из разновидностей постоянного битрейта. Разница с CBR в размере файла
    • QPI - параметр, определяющий качество кадров
    • QPP - параметр, определяющий качество P-кадров
    • QPB - параметр, определяющий качество h.264 B-кадров
    • AVBR - средний битрейт
  • Битрейт - значение битрейта для трансляции
    • Accuracy - параметр, определяющий качество в сложных сценах. Связан со следующим параметром
    • Convergence - параметр для настройки качества в сложных сценах. Связан с предыдущим параметром.

Как вы можете наблюдать, параметров и настроек во вкладке «Вывод» много, как и различных конфигураций компьютеров пользователей, поэтому написать один идеальный гайд, который подойдет всем невозможно. В первую очередь нужно выбрать кодировщик трансляции. Если у вас процессоры Intel Core i5 - i7 новых архитектур, то можете смело выбирать х264. Если ваш процессор слабее, то в зависимости от процессора и от игры нужно протестировать и х264 и NVENC и выбрать, какой будет лучше.

Следующий по важности параметр трансляции это битрейт. Для меня с настройкой CBR (постоянный битрейт) оптимальным является 5500. Этот параметр зависит от вашего интернет-провайдера, провайдера трансляций и самой игры. Меняйте, наблюдайте за результатом, выставляйте оптимальный для вашей конфигурации. Кодировщики NVENC и QuickSync требуют больший битрейт, чем программный x264, но выставляя слишком высокий битрейт вы можете ухудшить качество трансляции. В интернете есть обширные статьи по настройке битрейта, но так как я использую только Twitch, Youtube, для оптимального битрейта мне хватает указанного выше показателя.

    • Профиль, интервал ключевых кадров определяются требованиями стрим-платформы. Для Twitch, Youtube оптимальными показателя будут high для профиля и «2» для интервала ключевых кадров.

Настройки для кодировщика H264/AVC Encoder (AMD Advanced Media Framework)

(Статья требует дополнительного описания, если вы знаете и разбираетесь в параметрах H264/AVC Encoder (AMD Advanced Media Framework) свяжитесь с нами по эмейл )

«Запись»
  • Тип - доступно 2 параметра обычный и пользовательский вывод (FFmpeg).
    • Обычный - настройки используемые и предустановленные в саму программу OBS:
      • Путь записи - возможность выбрать, куда будет сохраняться запись трансляции;
      • Генерировать имя файла без пробела - название файла записи будет без пробелов;
      • Формат записи - формат, в котором сохранится запись трансляции. Формат выбирается в зависимости от того, для чего вам запись, доступно: flv , mp4 , mov , mkv , , m3u8 ;
      • Звуковая дорожка - выбор звуковой дорожки либо нескольких дорожек, настройки отдельных звуковых дорожек можно произвести в микшере, например, можно вывести звук из источника в отдельную дорожку;
      • Кодировщик- выбор качества сохранённой записи, по умолчанию стоит то же, что и у трансляции, можете выбрать и настроить любое качество, отличающееся от трансляции из 2-х представленных вариантов, настройки соответствуют настройкам кодировщиков NVENC H.264, x264, QuickSync H.264, H264/AVC Encoder (AMD Advanced Media Framework) описанных ниже;
      • Перемаштабировать вывод - выбрать отличный от трансляции маштаб видео, доступна при выборе кодировщиков NVENC H.264, x264, QuickSync H.264, H264/AVC Encoder (AMD Advanced Media Framework);
      • Пользовательские настройки мультиплексора - дополнительные настройки формата записи трансляции.
    • FFmpeg - набор свободных библиотек с открытым исходным кодом, которые позволяют записывать, конвертировать и передавать цифровые аудио- и видеозаписи в различных форматах. Под FFmpeg нужно установить соответствующую библиотеку на ПК подробнее в Википедии .
      • (Статья требует дополнительного описания, если вы знаете и разбираетесь в параметрах FFmpeg свяжитесь с нами по эмейл)
«Аудио»

Содержит настройки для отдельных звуковых дорожек если вы используете разные дорожки в микшере.

«Буфер повтора»

Включает буфер повтора, нужно настроить горячие клавиши, по нажатию на определённую кнопку запустит повтор выбранного вами отрезка времени, по умолчанию отмотает время на 20 секунд назад и будет повторять этот момент пока не прервёте его горячей клавишей.

Вкладка «Аудио»

Вкладка «Аудио»

Вкладка для настройки аудиоустройства для трансляции. Дополнительно можно настроить функцию включать/выключать микрофон по нажатии и функцию push-to-talk (микрофон работает только пока нажата заданная клавиша). Настройки задержки включения и выключения микрофона определяют задержку перед использованием функции в миллисекундах (ms).

Вкладка «Видео»

Вкладка «Видео»

Вкладка для настройки разрешения вашей трансляции. По умолчанию соотношение сторон выбрано равное соотношениям сторон для мониторов 16:9 это 1280х720, 1680х1050, 1920х1080 и т.д. Лучше отталкиваться от принятых к стандарту разрешений, если у вас монитор 16:10 или более широкий, ориентируйтесь на стандартные разрешения и старайтесь транслировать в 16:9 иначе зрители будут наблюдать чёрные полосы на трансляции снизу, либо вам придётся пожертвовать и обрезать изображение с боков.

  • Базовое разрешение - это разрешение окна превью в самой программе, если вы настроили трансформацию своих источников, то будьте готовы, что при уменьшении этого параметра вам придётся настраивать трансформацию всех источников заново.
  • Выходное разрешение - разрешение которое будет выдавать OBS Studio в эфир, эта настройка будет игнорироваться если Вы выбрали «Перемасштабировать вывод» во вкладке «Вывод»

Чтобы не нагружать процессор ещё сильнее, лучше не использовать масштабирование и выставлять одинаковое значение в опциях «Базовое разрешение» и «Выходное разрешение».

  • фильтр масштабирования - применяется только тогда, когда вы выбираете выходное разрешение отличное от базового, самый лучший фильтр - это Метод Ланцоша работает медленнее, но качество получается лучше и ресурсов процессора используется тоже больше, на современных мощных процессорах почти не заметна нагрузка, а вот обладателям слабых ПК стоит обратить на этот параметр внимание. Выбор фильтра зависит от конфигурации компьютера, самым оптимальным является Бикубический.

Вкладка «Горячие клавиши»

Вкладка «Горячие клавиши»

Вкладка настройки горячих клавиш для управления трансляцией, настройка функций включить/отключить звук, включить/выключить звук по нажатии. Можно задать горячие клавиши для запуска, остановки трансляции, начала и остановки записи и т.д.

Вкладка «Расширенные»

Вкладка «Расширенные»

Вкладка для дополнительных настроек программы. Если вы плохо разбираетесь в программе, то вас заинтересует параметр «Приоритет процесса», формат имени файла записи и задержка потока. Остальные параметры лучше оставить без изменений, и менять только в том случае, если вы знаете, что они означают и это изменение улучшит качество вашей трансляции.

  • Приоритет процесса - изменение приоритете OBS в системе Windows, если наблюдаются какие-либо проблемы с программой попробуйте изменить этот параметр, не рекомендуется выставлять самое высокое значение, так как могут появиться проблемы с другими приложениями.
    • Высокий
    • Выше нормального
    • Средний
    • Ниже среднего
    • Низкий
  • Рендер - выбор значение которое будет отвечать за обработку кадров трансляции.
    • Direct3D
    • Open GL
  • Цветовой формат - или же цветовой профиль, можно выбрать какой именно профиль будет отвечать за построение картинки, обо всех профилях и что они дают можно почитать в википедии это очень обширная тема. Цветовое пространство YUV - это цветовая модель, в которой цвет состоит из трёх компонентов - яркость (Y) и два цветоразностных компонента (U и V). Разные стандарты построения картинки, параметры подбираются опытным путём.
  • Цветовой диапазон YUV.
    • Частичный
    • Полный

> Как изменить битрейт MP3?

Вступление.

МР3 - это самый распространенный аудио формат, поддерживаемый большинством современных проигрывателей. Файлы этого формата имеют небольшой размер, но при кодировании в МР3 потери качества звука неизбежны. Качество в этом формате можно охарактеризовать битрейтом. Битрейт - параметр, указывающий, какой объем данных приходится на определенный отрезок аудио. Битрейт задается при кодировании и может быть изменен только при помощи перекодирования.

Если вы увеличите битрейт MP3, качество звука только ухудшится. А вот если из большего битрейта сделать меньший, то выигрыш будет в размере музыкального файла. Если вы ищете программу, чтобы изменить битрейт и уменьшить размер МР3 , то AudioConverter Studio подойдет для этого идеально.

Шаг первый: Загрузка и установка программы.

Загрузите AudioConverter Studio в выбранную папку и запустите установку. Следуйте инструкциям инсталляции для завершения процесса.

Шаг второй: Запуск программы. Выбор файлов МР3 для конвертирования.

Запустите конвертер МР3 файлов . Откроется мастер, но для нашего случая мы воспользуемся обычным способом работы с программой и закроем его.

Сейчас нужно добавить в программу МР3 файлы, для которых вы хотите изменить битрейт. Нажмите кнопку "Обзор" справа от адресной строки, чтобы зайти в нужную папку. Сразу после этого музыкальные файлы отобразятся в списке.

Шаг третий: Установка битрейта МР3 и прочих параметров.

В правой части окна программы видны два раздела. Рассмотрим раздел "Выходной формат".

Перейдите в нем на вкладку МР3 и выберите нужные настройки качества аудио.

В разделе "Тэги и формат имени файлов" установим "Old filename". Это означает, что программа назовет новые файлы так же, как были названы старые. Для ID3 тэгов мы выберем опцию "Копировать существующие", чтобы скопировать тэги в новые MP3.

Шаг четвертый: Выбор выходной папки. Изменение битрейта МР3 файлов.

Итак, все приготовления выполнены.

На панели инструментов нажмите "Добавить все", чтобы добавить все МР3 в текущей папке в список конвертации. В разделе "Выходные файлы" укажите папку, куда хотите сохранить конвертированные аудио. Обратите внимание, что в данном случае нельзя использовать папку с исходными файлами.

Чуть ниже, в таблице, отображается информация по будущим МР3.

Нажмите "Конвертировать" на панели инструментов, чтобы поменять битрейт МР3 файлов .

Итак, вы собрали себе достойный компьютер, познали дао мидера в Dota 2 и решили таки запустить свою первую трансляцию. Или прокомментировать чей-нибудь матч. Разумеется, на Twitch.tv.

Поздравляем, вы только что в первый окунулись в невероятно бурную реку с крутым руслом и кучей подводных камней. К счастью, со всякими хитрыми вопросами типа вещания с хромакеем или комментирования крупных ивентов можно будет разобраться позже, а пока можно разобраться с базовыми проблемами.

Например, выбором оптимального битрейта.

Предлагаем вашему перевод блога одного из комментаторов студии Moonduck.TV Pimpmuckl’а, посвященный базовым настройкам стрима по Dota 2.

Битрейт - самый важный аспект стрима. Постараемся же выжать максимально возможное для вас качество.

Первым делом для этого нужно скачать тестер качества вашего трафика с Twitch.tv с сайта Team Liquid. Запускаем программу и убираем из теста все региона, кроме «домашнего». Тест по Европе, например, будет выглядеть вот так:

Отлично, теперь выбираем себе сервер с лучшим битрейтом/качеством, берем его тестовые результаты и вычитаем из них 500кбит/сек. Получившийся в результате показатель записываем себе как «максимальный битрейт». Сокращенно - макс-битрейт.

Если вам удалось добиться статуса партнера Twitch.tv (например, вы транслируете какой-нибудь турнир), то можете смело ставить тот же макс-битрейт как «максимальный битрейт» уже в настройках вашей стримеркой программы (например, Open Broadcaster Software > Настройки > Кодирование). Один нюанс: больше 3,500кбит/сек смысла ставить нет по той простой причине, что Twitch не пропустит такой большой поток.

Если же статуса партнера у вас нет, ваш потолок - 2,500. За этой границей стрим начнет лагать.

Также следует подумать о вашей целевой аудитории. Есть на земном шаре регионы, где с интернетом все не так хорошо, как в какой-нибудь Москве, и если у главных зрителей какого-нибудь локального ивента нет подключения быстрее 2мбит/сек, то лучше «успокоить» свой стрим до 1,500кбит/сек, чтобы избавить аудиторию от буфферинга.

Разрешение

Разрешение видео мы будем выставлять, отталкиваясь от битрейта:

  • 500–1,000 кбит/сек: 480p 30fps
  • 1,000–1,500: 540p 30fps
  • 1,500–2,000: 720p 30fps
  • 2,000–3,500: 720p 60fps
  • 3,500: 900p 60fps

Напоминаем, что речь сейчас идет именно о трансляции Dota 2. даже не пытайтесь выставить на стриме CS:Go или Overwatch 900p60 или какого-нибудь другого FPS.

720p 60fps – золотой стандарт, к которому следует стремиться. И качество будет хорошее, и у всяких девайсов типа Chromecast с передачей такого потока проблем не будет.

Всякие мелочи

В «расширенных настройках» OBS можно дополнительно поиграться с оптимизацией. Например, подкрутить пресет x264 CPU, сменив значение «по умлочанию» veryfast на fast. Это, грубо говоря, даст прирост в качестве видео за счет большей нагрузки на CPU.

Правда, в 90% случаев таки лучше оставаться на veryfast и играться этим параметром, только если в вашем компьютере стоит очень хороший процессор.

Еще один прием для владельцев GCN AMD CPU: проставьте в расширенных настройках opencl=true, и система начнет работать чуть шустрее.

Nota bene: галочку напротив «Encode in Full Range» не ставим никогда. Раньше эта опция нужна была, так как некоторые программы типа VLC могли некорректно отображать цвета в видео, но сейчас такой проблемы не существует вовсе.

Если в вашем компьютере стоит не сильно мощный процессор, можно поменять параметр «Кодировщик». NVENC/AMD VCE гораздо меньше грузят компьютер, правда, в этом случае придется пожертвовать качеством видеопотока. Ставить Intel QuickSync также имеет смысл: по качеству потока эта опция заметно обгоняет предыдущие две, но до x264 все равно не дотягивает.

Ну и наконец, геймерам, играющим на карте с измененным ландшафтом (напомним еще раз, речь идет о Dota 2), на сравнительно слабых ПК лучше переключиться на стандартную карту. Ландшафт из Battle Pass последнего The International удушит любые попытки стриминга на бюджетном компьютере.

Правда, если уж ваше железо может потянуть этот ландшафт, видеопоток с кодировкой x264 получится даже чуть лучше по качеству. Соль в том, что арена Battle Pass сама по себе очень светлая, а в x264 яркие цвета «весят» меньше в битрейте/качестве, чем темные тона. Соответственно, «светлый» стрим будет выглядеть опрятнее, чем «темный» стрим с тем же самым битрейтом.

Тем не менее, моим основным выбором все-таки является ландшафт по умолчанию.

Развенчание популярных мифов о цифровом звуке.

2017-10-01T15:27

2017-10-01T15:27

Audiophile"s Software

Примечание : для лучшего понимания нижеизложенного текста очень рекомендую ознакомиться с основами цифрового звука .

Также многие затронутые ниже моменты освещены в моей публикации «Ещё раз о печальной правде: откуда на самом деле берётся хорошее звучание?» .

Чем больше битрейт, тем качественнее трек

Это далеко не всегда так. Для начала напомню, что такое битрейт (bitrate, а не bitraid). Фактически это скорость потока данных в килобитах на секунду при воспроизведении. Т. е., если мы возьмем размер трека в килобитах и разделим на его продолжительность в секундах, получим его битрейт - т. н. file-based bitrate (FBR), обычно он не слишком отличается от битрейта аудиопотока (причиной различий является наличие в треке метаданных - тегов, «вшитых» изображений и т. п.).

Теперь возьмем пример: битрейт несжатого PCM аудио, записанного на обычном Audio CD, рассчитывается следующим образом: 2 (канала) × 16 (бит на каждый семпл) × 44100 (семплов в секунду) = 1411200 (бит/с) = 1411.2 кбит/с. А теперь возьмём и сожмём трек любым lossless кодеком («lossless» - «беспотерьный», т. е. такой, который не приводит к потере какой-либо информации), например кодеком FLAC. В результате мы получим битрейт ниже исходного, но качество при этом останется неизменным - вот вам и первое опровержение.

Сюда ещё кое-что стоит добавить. Битрейт на выходе при lossless сжатии может получиться самый разный (но, как правило он меньше, чем у несжатого аудио) - зависит это от сложности сжимаемого сигнала, а точнее от избыточности данных. Таким образом, более простые сигналы будут сжиматься лучше (т. е. имеем меньший размер файла при такой же продолжительности => меньший битрейт), а более сложные - хуже. Именно поэтому классическая музыка в lossless имеет меньший битрейт, чем, скажем, рок. Но надо подчеркнуть, что битрейт тут ни в коем случае не является показателем качества звукового материала.

Теперь поговорим о lossy сжатии (с потерями). Прежде всего надо понимать, что существует множество разных кодеров и форматов, и даже в пределах одного формата качество кодирования у разных кодеров может отличаться (например, QuickTime AAC кодирует намного качественнее устаревшего FAAC), не говоря уже о превосходстве современных форматов (OGG Vorbis, AAC, Opus) над MP3. Проще говоря, из двух одинаковых треков, закодированных разными кодерами с одним битрейтом, какой-то будет звучать лучше, а какой-то - хуже.

Кроме того, существует такое понятие, как апконверт . Т. е., можно взять трек в формате MP3 с битрейтом 96 кбит/с и конвертировать его в MP3 320 кбит/с. Мало того, что при этом качество не улучшится (ведь потерянные при предыдущем кодировании в 96 кбит/с данные уже не вернуть), оно даже ухудшится. Тут стоит указать, что на каждом этапе lossy кодирования (с любым битрейтом и любым кодером) в аудио вносится определенная порция искажений.

И даже более. Есть еще один нюанс. Если, скажем, битрейт аудиопотока - 320 кбит/с, это не значит, что все 320 кбит ушли на кодирование той самой секунды. Это характерно для кодирования с постоянным битрейтом и для тех случаев, когда человек, надеясь получить максимальное качество, форсирует слишком большой постоянный битрейт (как пример - установка 512 кбит/с CBR для Nero AAC). Как известно, количество бит, выделяемое на тот или иной фрейм, регулируется психоакустической моделью. Но в случае, когда выделенное количество намного ниже установленного битрейта, то не спасает даже резервуар бит (о терминах читайте в статье «Что такое CBR, ABR, VBR?») - в итоге мы получаем бесполезные «нулевые биты», которые просто «добивают» размер фрейма до нужного (т. е. увеличивают размер потока до заданного). Кстати, это легко проверить - сожмите полученный файл архиватором (лучше 7z) и посмотрите на степень сжатия - чем она больше - тем больше нулевых битов (т. к. они приводят к избыточности), тем больше зря потраченного места.

Кодеки lossy (MP3 и прочие) способны справитьcя c современной электронной музыкой, но не способны качественно закодировать классическую (академическую), живую, инструментальную музыку

«Ирония судьбы» здесь в том, что на самом деле всё с точностью до наоборот. Как известно, академическая музыка в подавляющем большинстве случаев следует мелодическим и гармоническим принципам, а также инструментальному составу. С математической точки зрения это обуславливает относительно простой гармонический состав музыки. Так преобладание консонансов продуцирует меньшее количество побочных гармоник: например, для квинты (интервал, в котором основные частоты двух звуков различаются в полтора раза) общей для двух звуков будет каждая вторая гармоника, для кварты, где частоты различаются на одну треть - каждая третья, и т. п. Кроме того, наличие фиксированных соотношений частот, обусловленных использованием равномерно темперированного строя, также упрощает спектральный состав классической музыки. Живой инструментальный состав классики обуславливает отсутствие в ней шумов, характерных для электронной музыки, искажений, резких скачков амплитуды, а также отсутствие избытка высокочастотных составляющих.

Перечисленные выше факторы приводят к тому, что классическая музыка намного легче сжимается, прежде всего, чисто математически. Если вы помните, математическое сжатие работает за счёт устранения избыточности (описывая похожие фрагменты информации с использованием меньшего количества битов), а также за счёт предсказания (т. н. предикторы предсказывают поведение сигнала, а затем кодируется только отклонение реального сигнала от предсказанного - чем точнее они совпали, тем меньше битов нужно для кодирования). В данном случае относительно простой спектральный состав и гармоничность обуславливают высокую избыточность, устранение которой даёт значительную степень компрессии, а малое количество всплесков и шумовых компонентов (являющихся случайными и непредсказуемыми сигналами) обуславливает хорошую математическую предсказуемость подавляющей части информации. И это я уже не говорю об относительно небольшой средней громкости классических треков и о часто встречающихся промежутках тишины, для кодирования которых информация практически не требуется. В итоге мы можем без потерь сжать, например, некоторую сольную инструментальную музыку до битрейтов ниже 320 кбит/с (кодеры TAK и OFR на такое вполне способны).

Так вот, во-первых, дело в том, что математическое сжатие, лежащее в основе lossless кодирования, является также и одним из этапов lossy кодирования (читайте Понятно об MP3 кодировании). А во-вторых, т. к. в lossy используется преобразование Фурье (разложение сигнала на гармоники), то простота спектрального состава даже вдвойне облегчает кодеру работу. В итоге, сравнивая оригинальный и закодированный семпл классической музыки в слепом тесте, мы с удивлением обнаруживаем, что никаких отличий найти не можем, даже при относительно низком битрейте. И самое смешное - что когда мы начинаем совсем понижать битрейт кодирования, первое, что обнаруживает отличия - фоновые шумы в записи.

Что же касается электронной музыки - с ней кодерам приходится очень нелегко: шумовые составляющие имеют минимальную избыточность, и вместе с резкими скачками (какими-нибудь пилообразными импульсами) являются крайне непредсказуемыми сигналами (для кодеров, которые «заточены» под естественные звуки, ведущие себя совершенно иначе), прямое же и обратное преобразование Фурье с отбросом отдельных гармоник психоакустической моделью неминуемо даёт эффекты пре- и пост-эхо, слышимость которых кодеру далеко не всегда легко оценить... Добавьте еще к этому высокий уровень ВЧ составляющих - и получите большое количество киллер-семплов, с которыми на средне-низких битрейтах не справляются даже наиболее продвинутые кодеры, как ни странно, именно среди электронной музыки.

Также забавляют мнения «опытных слухачей» и музыкантов, которые при полном непонимании принципов lossy кодирования начинают утверждать, что они слышат, как инструменты в музыке после кодирования начинают фальшивить, частоты плавают и т. п. Это, возможно, ещё было бы справедливо для допотопных кассетных плееров с детонацией, но в цифровом аудио всё точно: частотная составляющая либо остаётся, либо отбрасывается, смещать тональность тут попросту нет надобности. Более того: наличие у человека музыкального слуха совершенно не означает наличие у него хорошего частотного слуха (например, способности воспринимать частоты >16 кГц, которая с возрастом сходит на нет) и отнюдь не облегчает ему задачу поиска артефактов lossy кодирования, т. к. искажения эти имеют характер очень специфический и требуют опыта слепого сравнения именно lossy аудио - надо знать, на чём и где искать.

DVD-Audio звучит лучше, чем Audio CD (24 бита против 16-ти, 96 кГц против 44.1 и т. п.)

К сожалению, люди обычно смотрят только на цифры и очень редко задумываются о влиянии того или иного параметра на объективное качество.

Рассмотрим для начала разрядность. Этот параметр отвечает не за что иное, как за динамический диапазон, т. е., за разницу между самым тихим и самым громким звуками (в дБ). В цифровом аудио максимальный уровень - это 0 dBFS (FS - full scale), а минимальный - ограничен уровнем шумов, т. е., фактически динамический диапазон по модулю равен уровню шумов. Для 16-битного аудио динамический диапазон рассчитывается как 20 × log 10 2 16 , что равняется 96.33 вБ. При этом динамический диапазон симфонического оркестра - до 75 дБ (в основном около 40-50 дБ).

А теперь представим реальные условия. Уровень шума в комнате - около 40 дБ (не забываем, что дБ - величина относительная. В данном случае за 0 дБ принимается порог слышимости), максимальная громкость музыки достигает 110 дБ (чтобы не было дискомфорта) - получаем разность 70 дБ. Таким образом получается, что динамический диапазон более 70 дБ в данном случае просто бесполезен. Т. е. при диапазоне выше или громкие звуки будут достигать болевого порога, или тихие звуки будут поглощаться окружающими шумами. Достичь уровня окружающих шумов менее 15 дБ очень трудно (так как на этом уровне находится громкость человеческого дыхания и прочих шумов обусловленных, человеческой физиологией), в итоге диапазон в 95 дБ для прослушивания музыки оказывается совершенно достаточным.

Теперь о частоте дискретизации (частота семплирования, sample rate). Этот параметр отвечает за частоту квантования по времени и непосредственно влияет на максимальную частоту сигнала, которую можно описать данным представлением аудио. По теореме Котельникова она равна половине частоты дискретизации. Т. е. для обычной частоты семплирования в 44100 Гц максимальная частота составляющих сигнала - 22050 Гц. Максимальная же частота. которая воспринимается человеческим ухом - чуть выше 20000 Гц (и то, при рождении; по мере взросления порог опускается до 16000 Гц).

Лучше всего данная тема раскрыта в статье Загрузки в формате 24/192 - почему они не имеют смысла .

Разные программные плееры звучат по-разному (e. g. foobar2000 лучше Winamp и т. п.)

Чтобы понять, почему это не так, надо разобраться, что собой представляет программный плеер. По сути это декодер, обработчики (опционально), плагин вывода (на один из интерфейсов: ASIO, DirectSound, WASAPI. etc.), ну и конечно же GUI (графический интерфейс пользователя). Т. к. декодер в 99.9 % случаев работает по стандартному алгоритму, а плагин вывода - это всего лишь часть программы, которая передает поток звуковой карте через один из интерфейсов, то причиной различий могут быть только обработчики. Но дело в том, что обработчики обычно по-умолчанию выключены (или должны быть выключены, т. к. главное для хорошего плеера - уметь передать звук в «первозданном» виде). В итоге, предметом сравнения тут могут быть только возможности обработки и вывода, в которых, кстати говоря, необходимости очень часто вообще нет. Но даже если такая необходимость и есть - то это уже сравнение обработчиков, а никак не плееров.

Разные версии драйвера звучат по-разному

В основании этого утверждения лежит банальное незнание принципов работы звуковой карты. Драйвер - это программное обеспечение, необходимое для эффективного взаимодействия устройства с операционной системой, также обычно предоставляющее графический интерфейс пользователя для возможности управления устройством, его параметрами и т. д. Драйвер звуковой карты обеспечивает распознавание звуковой карты как звукового устройства Windows, сообщает ОС о поддерживаемых картой форматах, обеспечивает передачу несжатого PCM (в большинстве случаев) потока на карту, а также даёт доступ к настройкам. Кроме того, в случае наличия софтовой обработки (средствами CPU), драйвер может содержать различные DSP (обработчики). Потому, во-первых, при отключенных эффектах и обработке, если драйвер не обеспечивает точную передачу PCM на карту, это считается грубейшей ошибкой, критическим багом. И случается такое крайне редко . С другой стороны, различия между драйверами могут быть в обновлении алгоритмов обработки (ресемплеров, эффектов), хотя это случается тоже отнюдь не часто. К тому же, для достижения наивысшего качества эффекты и любую обработку драйвером всё равно следует исключать.

Таким образом, обновления драйверов в основном ориентированы на повышение стабильности работы и устранение ошибок, связанных с обработкой. Ни то, ни другое в нашем случае на качество воспроизведения не влияет, потому в 999 случаях из 1000 драйвер влияния на звук не оказывает.

Лицензионные Audio CD звучат лучше, чем их копии

Если при копировании не произошло ошибок (неустранимых) чтения/записи и у оптического привода устройства, на котором будет воспроизводится диск-копия, нет проблем с его чтением, то такое утверждение ошибочно и легко опровергается .

Режим кодирования Stereo дает лучшее качество, чем Joint Stereo

Это заблуждение главным образом касается LAME MP3, так как все современные кодеры (AAC, Vorbis, Musepack) используют только режим Joint Stereo (и это уже о чём-то говорит)

Для начала стоит упомянуть, что режим Joint Stereo успешно используется при lossless сжатии. Суть его заключается в том, что сигнал перед кодированием раскладывается на сумму правого и левого канала (Mid) и на их разность (Side), а затем происходит отдельное кодирование этих сигналов. В пределе (для одинаковой информации в правом и левом канале) получается двойная экономия данных. А так как в большинстве музыки информация в правом и левом каналах довольно схожа, то этот метод оказывается очень эффективным и позволяет значительно увеличить степень сжатия.

В lossy принцип тот же. Но здесь в режиме постоянного битрейта качество фрагментов со схожей информацией в двух каналах будет увеличиваться (в пределе - удваиваться), а для VBR режима в таких местах будет просто уменьшаться битрейт (не забываем, что главная задача VBR режима - стабильно поддерживать заданное качество кодирования, используя минимально возможный битрейт). Так как во время lossy кодирования приоритет (при распределении битов) отдаётся сумме каналов, чтобы избежать ухудшения стереопанорамы, используется динамическое переключение между режимами Joint Stereo (Mid/Side) и обычным (Left/Right) стерео на базе фреймов. Кстати говоря, причиной данного заблуждения послужило несовершенство алгоритма переключения в старых версиях LAME, а также наличие режима Forced Joint, в котором автопереключение отсутствует. В последних версиях LAME режим Joint включен по умолчанию и менять его не рекомендуется.

Чем шире спектр, тем качественнее запись (о спектрограммах, auCDtect и частотном диапазоне)

В наше время на форумах, к несчастью, очень распространено измерение качества трека «линейкой по спектрограмме». Очевидно, по причине простоты такого способа. Но, как показывает практика, в действительности всё намного сложнее.

А дело тут вот в чем. Спектрограмма визуально демонстрирует распределение мощности сигнала по частотам, но не может дать полного представления о звучании записи, наличии в ней искажений и артефактов компрессии. Т. е., по сути всё, что можно определить по спектрограмме, - это частотный диапазон (и частично - плотность спектра в районе ВЧ). Т. е., в лучшем случае, путем анализа спектрограммы можно выявить апконверт. Сравнение же спектрограмм треков, полученных путем кодирования различными кодерами, с оригиналом - полнейший абсурд. Да, вы сможете выявить различия в спектре, но вот определить, будут ли они (и в какой степени) восприниматься человеческим ухом - практически невозможно. Нельзя забывать, что задача lossy кодирования - обеспечить результат неотличимый человеческим ухом от оригинала (никак не глазом).

Это же относится и к оценке качества кодирования путём анализа треков на выходе программой auCDtect (Audiochecker, auCDtect Task Manager, Tau Analyzer, fooCDtect - это лишь оболочки для единственной в своем роде консольной программы auCDtect). Алгоритм auCDtect тоже фактически анализирует частотный диапазон и всего лишь позволяет определить (с определенной долей вероятности), было ли на каком-либо из этапов кодирования применено MPEG сжатие. Алгоритм заточен под MP3, потому его легко «обмануть» с помощью кодеков Vorbis, AAC и Musepack, так что даже если программа пишет «100% CDDA» - это не значит, что закодированное аудио на 100% соответствует исходному.

И возвращаясь непосредственно к спектрам. Популярно также стремление некоторых «энтузиастов» во что бы то ни было отключить lowpass (НЧ) фильтр в кодере LAME. Здесь на лицо непонимание принципов кодирования и психоакустики. Во-первых, кодер обрезает высокие частоты только с одной целью - сэкономить данные и использовать их для кодирования наиболее слышимого диапазона частот. Расширенный частотный диапазон может фатально сказаться на общем качестве звучания и привести к слышимым артефактам кодирования. Более того, отключение среза на 20 кГц - вообще совершенно неоправданно, так как частоты выше человек попросту не слышит.

Существует некая «волшебная» предустановка эквалайзера, способная значительно улучшить звучание

Это не совсем так, во-первых, потому, что каждая отдельно взятая конфигурация (наушники, акустика, звуковая карта) обладает своими собственными параметрами (в частности, своей амплитудно-частотной характеристикой). И потому к каждой конфигурации должен быть свой, уникальный подход. Проще говоря, такая предустановка эквалайзера существует, но она отличается для разных конфигураций. Суть же её заключается в корректировке АЧХ тракта, а именно - в «выравнивании» нежелательных провалов и всплесков.

Также среди людей далеких от непосредственной работы со звуком очень популярна настройка графического эквалайзера «галочкой», что фактически представляет собой повышение уровня НЧ и ВЧ составляющих, но в то же время приводит к приглушению вокала и инструментов, спектр звучания которых находится в районе средних частот.

Перед конвертированием музыки в другой формат следует «разжимать» её в WAV

Сразу отмечу, что под WAV подразумеваются PCM данные (импульсно-кодовая модуляция) в контейнере WAVE (файл с расширением *.wav). Эти данные представляют собой не что иное, как последовательность битов (нулей и единиц) группами по 16, 24 или 32 (в зависимости от разрядности), каждая из которых представляет собой двоичный код амплитуды соответствующего ей семпла (например, для 16 бит в десятичном представлении это значения от -32768 до +32768).

Так вот, дело в том, что любой обработчик звука - будь то фильтр или кодер - как правило работает только с этими значениями, то есть только с несжатыми данными. Это значит, что для преобразования звука, скажем, из FLAC в APE, просто необходимо сначала декодировать FLAC в PCM, а затем уже закодировать PCM в APE. Это как для перепаковки файлов из ZIP в RAR, надо сначала распаковать ZIP.

Однако, если вы пользуетесь конвертером или просто продвинутым консольным кодером, промежуточное преобразование в PCM происходит на лету, иногда даже без записи во временный WAV файл. Именно это и вводит людей в заблуждения: кажется, что форматы конвертируются непосредственно один в другой, но на самом деле в такой программе обязательно есть декодер входного формата, выполняющий промежуточное преобразование в PCM.

Таким образом, ручное преобразование в WAV не даст вам совершенно ничего, кроме лишней траты времени.

В этой статье я расскажу о том, MP3 файла. Сразу хочу отметить, что если изменить битрейт файла с низкого на более высокий, то качество этого файла от такого конвертирования не изменится. Так, что не думайте, что таким простым способом можно кардинально изменить звучание любимого трека.

Так как же изменить битрейт MP3? Я предлагаю вам несколько вариантов на выбор. Я расскажу о том, с помощью , и . Это далеко не весь перечень программ способных изменить битрейт. Я выбрал именно эти потому, что две из них это бесплатный софт и две – профессиональные программы для работы со звуком (аудиоредактор и ).

Как изменить битрейт в Aimp 3

Из-за патентных ограничений программа не содержит в своем стандартном комплекте кодировщика для файлов MP3. Его необходимо скачать отдельно (сделать это можно по этой ссылке >>> cкачать кодировщик Lame ) и распаковать архив в папку Aimp3/Modules.

1. Запустите программу, нажмите на клавишу Утилиты / Аудиоконвертер или нажмите сочетание клавиш Ctrl+K . Откроется окно аудиоконвертера.

2. Перетащите MP3 файл в аудиоконвертер или выберите пункт Добавление файлов/папок / добавить файл (клавиша Ins )

3. Выберите результирующий формат MP3

4. Нажмите на клавишу параметры

5. Установите необходимые значения

CBR – постоянный битрейт;

VBR – переменный битрейт;

ABR – усредненный битрейт.

6. Нажмите Старт.

Файл с измененным битрейтом находится в исходной директории и имеет вид «имя файла (2).mp3».

Как изменить битрейт в Adobe Audition 3.0

1. Запускаем программу и загружаем в нее MP3 файл

2. Кликнем два раза по файлу и он появится в рабочей области

3. Выберем File / Save As…

4. Установим необходимые параметры, нажав на клавишу Options

5. Нажмем Ok , укажем место для сохранения и нажмем Save

Как изменить битрейт в FL Studio 10

1. Запускаем программу и открываем окно (F5 )

3. Переключимся в режим Song на транспортной панели

4. Выберем пункт File / Export / MP3 file… или нажмем Shift+Ctrl+R

5. Дадим имя файлу, выберем место для сохранения и нажмем Сохранить

6. Укажем необходимые параметры и нажмем клавишу Start

Как изменить битрейт в Audacity

– это великолепная альтернатива профессиональным музыкальным редакторам. Этот бесплатный продукт обладает достаточно мощным функционалом. Поэтому всем начинающим музыкантам и продюсерам я рекомендую познакомиться поближе с этим софтом.

Как и Aimp 3, музыкальный редактор Audacity не содержит в своем комплекте кодировщика MP3 файлов, поэтому его придется скачать отдельно.

1. Запускаем программу и загружаем необходимый файл (или просто перетаскиваем)

2. После того как файл загрузился в программу, выбираем пункт Файл / Экспортировать или нажимаем Ctrl+Shift+E

3. Выбираем тип файла MP3 и нажимаем клавишу Параметры

4. Указываем необходимое качество, нажимаем Ок , Сохранить и снова Ок

Есть и другие программы позволяющие изменять битрейт MP3 файлов. Одной из таких программ является бесплатный проигрыватель . Кроме того он имеет и другие преимущества. Но об этом как-нибудь в другой раз.