Есть ли разница между аудио форматами MP3, AAC, FLAC и какой нужно использовать? Поддержка форматов аудио

  • 29.04.2019

Вам понадобится

  • - приложение «Проигрыватель Windows Media»;
  • - возможно, выход в интернет, браузер и права на установку приложений;
  • - права на изменение звуковых схем Windows.

Инструкция

Проиграйте wav-файл при помощи приложения «Проигрыватель Windows Media». Эта программа по умолчанию входит в большинство дистрибутивов операционных систем семейства Windows.

Запустите «Проигрыватель Windows Media». Воспользуйтесь ярлыком приложения, который обычно находится в секции «Развлечения» раздела «Прогаммы» меню, открывающегося при нажатии на кнопку «Пуск» в панели задач.

Если ярлык не получается найти, запустите «Проигрыватель Windows Media» вручную. Кликните по кнопке «Пуск». Выберите пункт «Выполнить» появившегося меню. В текстовое поле «Открыть» появившегося диалога «Запуск программы» введите wmplayer. Нажмите кнопку OK.

В окне запущенного проигрывателя нажмите Ctrl+O или разверните меню «Файл» и кликните на пункте «Открыть...». Перейдите в директорию с wav-файлом и выделите его в списке. Нажмите кнопку «Открыть». В правой части окна приложения отобразится список воспроизведения с добавленным файлом. Кликните по нужному элементу списка дважды. Начнется проигрывание содержимого wav-файла.

Прослушайте wav-файл при помощи популярного бесплатного медиа-проигрывателя Winamp. Загрузите дистрибутив приложения с официального сайта, открыв в браузере адрес http://www.winamp.com/media-player. Затем инсталлируйте его. Запустите Winamp.



Нажмите клавишу L или выберите в меню приложения пункты File и "Play File...". В появившемся диалоге перейдите в каталог с файлом, выделите его и нажмите кнопку «Открыть». Начнется проигрывание wav-файла.

Воспроизведите wav-файл с помощью просмотрщика Total Commander. Откройте каталог с файлом в одной из панелей этого файлового менеджера. Выделите файл в листинге. Нажмите F3. Откроется окно просмотрщика Lister и начнется воспроизведение файла.



Проиграйте wav-файл при помощи функционала редактирования звуковых тем Windows. Откройте панель управления. Для этого кликните по кнопке «Пуск» в панели задач, выделите в меню пункт «Настройка» и кликните по пункту «Панель управления».

Представляем вашему вниманию статью с подробным разбором заголовка WAV-файла и его структуры.

Теория

Итак, рассмотрим самый обычный WAV файл (Windows PCM). Он представляет собой две, четко делящиеся, области. Одна из них – заголовок файла, другая – область данных. В заголовке файла хранится информация о:

  • Размере файла.
  • Количестве каналов.
  • Частоте дискретизации.
  • Количестве бит в сэмпле (эту величину еще называют глубиной звучания).

Но для большего понимания смысла величин в заголовке следует еще рассказать об области данных и оцифровке звука. Звук состоит из колебаний, которые при оцифровке приобретают ступенчатый вид. Этот вид обусловлен тем, что компьютер может воспроизводить в любой короткий промежуток времени звук определенной амплитуды (громкости) и этот короткий момент далеко не бесконечно короткий. Продолжительность этого промежутка и определяет частота дискретизации. Например, у нас файл с частотой дискретизации 44.1 kHz, это значит, что тот короткий промежуток времени равен 1/44100 секунды (следует из размерности величины Гц = 1/с). Современные звуковые карты поддерживают частоту дискретизации до 192 kHz. Так, со временем разобрались.

Теперь, что касается амплитуды (громкости звука в коротком промежутке времени). От нее, я бы сказал, зависит точность звука. Амплитуда выражается числом, занимаемым в памяти (файле) 8, 16, 24, 32 бит (теоретически можно и больше). Как известно, 8 бит = 1 байту, следовательно, какая-то одна амплитуда в какой-то короткий промежуток времени в памяти (файле) может занимать 1, 2, 3, 4 байта соответственно. Таким образом, чем больше число занимает места в памяти (файле), тем больше диапазон значений для этого числа, а значит и для амплитуды.

  • 1 байт – 0..255
  • 2 байта – 0..65 535
  • 3 байта – 0..16 777 216
  • 4 байта – 0..4 294 967 296

В моно варианте значения амплитуды расположены последовательно. В стерео же, например, сначала идет значение амплитуды для левого канала, затем для правого, затем снова для левого и так далее.

Совокупность амплитуды и короткого промежутка времени носит название сэмпл.

Теперь таблица, наглядно показывающая структуру WAV файла.

Местоположение Поле Описание
0..3 (4 байта) chunkId Содержит символы “RIFF” в ASCII кодировке (0x52494646 в big-endian представлении). Является началом RIFF-цепочки.
4..7 (4 байта) chunkSize Это оставшийся размер цепочки, начиная с этой позиции. Иначе говоря, это размер файла – 8, то есть, исключены поля chunkId и chunkSize.
8..11 (4 байта) format Содержит символы “WAVE” (0x57415645 в big-endian представлении)
12..15 (4 байта) subchunk1Id Содержит символы “fmt “ (0x666d7420 в big-endian представлении)
16..19 (4 байта) subchunk1Size 16 для формата PCM . Это оставшийся размер подцепочки, начиная с этой позиции.
20..21 (2 байта) audioFormat Аудио формат, полный список можно получить . Для PCM = 1 (то есть, Линейное квантование). Значения, отличающиеся от 1, обозначают некоторый формат сжатия.
22..23 (2 байта) numChannels Количество каналов. Моно = 1, Стерео = 2 и т.д.
24..27 (4 байта) sampleRate Частота дискретизации. 8000 Гц, 44100 Гц и т.д.
28..31 (4 байта) byteRate Количество байт, переданных за секунду воспроизведения.
32..33 (2 байта) blockAlign Количество байт для одного сэмпла, включая все каналы.
34..35 (2 байта) bitsPerSample Количество бит в сэмпле. Так называемая “глубина” или точность звучания. 8 бит, 16 бит и т.д.
36..39 (4 байта) subchunk2Id Содержит символы “data” (0x64617461 в big-endian представлении)
40..43 (4 байта) subchunk2Size Количество байт в области данных.
44.. data Непосредственно WAV-данные.

Вот и весь заголовок, длина которого составляет 44 байта, далее следует блок данных о котором я уже рассказал выше.

На самом деле, понятно, что использованные типы данных можно и менять. Например, в Си (MSVS) вместе массива char можно использовать __int32 или DWORD , но тогда сравнение с какой-либо строковой константой, к примеру может оказаться не очень удобным. Также хотелось бы предостеречь Вас в связи с влияением новой 64-битной моды на программные средства. А именно: всегда стоит помнить, в языке Си тип переменной int в 64-битной системе будет иметь длину 8 байт, а в 32-битной – 4 байта. В таких случаях можно воспользоваться вышеупомянутым типом переменной __int32 или __int64 , в зависимости от того, какой размер переменной в памяти Вам необходим. Существуют типы __int8 , __int16 , __int32 и __int64 , они доступны только для MSVC++ компилятора как минимум 7-й версии (Microsoft Visual Studio 2003.NET), но зато Вы не ошибетесь с выбором размера типа данных.

Microsoft Windows Media Player

Windows Media Player Playlist (WPL) is a computer file format that keeps multimedia playlists for video and audio collections. It is an owned file format utilized in Microsoft Windows Media Player versions 9 to 12. The fundamentals of WPL files are represented in XML format. These .WPL files can be accessed and utilized by the Nullsoft Winamp Media Player 5.6 application version as well as the Roxio Creator 2012 program. WPL files are also known as Windows Media Player playlist files, which are indicated by the Microsoft Windows Media Player or the other media players with support for WPL files as reference data when users open these playlist files and begin to access the content stored in it. The top-level aspect specifies that the file"s elements go after the Synchronized Multimedia Integration Language (SMIL) structure. The information contained in these WPL files are directory locations to the video files and audio content chose by the creator of the .WPL file, this enables the media player application to quickly and easily find and play the video and audio content from their directory locations.

VideoLan VLC Media player

VideoLan VLC Media player

VideoLan VLC Media player is a multi-media player software that is considered to be an open source and cross platform multimedia player with framework. Thus, a product that can play most of the standard files of multimedia plus CDs, DVDs and VCDs. It also plays different streaming protocols, supported applications or devices and webcams. There is also the ability to play audios of various codecs even if there are no codec packs included: MPEG-2, WebM, MP3, WMV and MKV. This software works on most Windows computers, Mac OS X PCs, Linux and well as Unix. In addition, there is descryption for DVD which is executed via the libdvdcss library. It also has playback control support for all computers compatible with it using libcdio or libvcdinfo. On Mac computers, this media player can grab audios and videos from EyeTV applications and other devices that capture EyeTV data. On GNU and Linux, it supports encoding cards that are compatible with V4L2 and MPEG-2 which are Visiontech Kfir and Hauppage WinTV-PVR 250-350.

Quicktime Player

Quicktime Player

Quicktime Player is a multimedia player that was developed by Apple and is integrated into Mac OS X and apple iTunes. Quicktime player is compatible with windows operating systems as well, namely Windows XP, Windows Vista and Windows 7. This program is a standalone application in Windows platforms. Quicktime Player supports these video file formats: Quicktime Movie; AVI; MPEG; DV; 3GPP; and 3GPP2. Here The audio file formats supported by Quicktime Player include: Itunes audio; SD2, WAV; AMR; SND; CORE AUDIO; MP3; AU; and AIFF. Users can add some components to enable Quicktime player to support other file formats, such as Flash video, ASF, DivX Media format, OGG and Matroska. This application can be downloaded for free, but if users require comprehensive video editing features like converting files to other format, then it is recommended to upgrade their subscription to Quicktime Player Pro. This is packed with H.264 technology that consumes less storage space and bandwidth but plays high resolution videos.

Apple iTunes

Apple iTunes is a software categorized as a media player computer application for playing, downloading, organizing and saving various files, which are digital audios and videos. There is also a feature that enables content managements from iPod models, iPad Touch, iPhone, and iPad. This software can be connected to iTunes Store so a user can download or buy music, videos, audio books, ringtones or even games for iPod in just a click of a button. In fact, it allows the download of various applications via the App Store for some Apple devices, which are iPod Touch, iPhone and iPad. The downside of this is that it does not enable music transfer from one device to another unit. This program is compatible for Apple’s Mac OS X version 10.6.8 and other later versions, but also works for current Windows OS such as Windows 7, Windows XP and Windows Vista, then for the upcoming Windows 8.

Microsoft Zune

Zune is a digital media store developed by Microsoft. Provided are portable media players, a music subscription service known as a "Zune Music Pass", digital media player software for Windows, music and video streaming services via the Zune Software for the Xbox 360 game console. Also included are music, TV and movie sales, and media software for Windows Phones. Zune and the ZPL file format were created by Microsoft. These files have playlists of songs or videos that are saved by Zune to administer and arrange such playlists by libraries, genres or favorites. The Zune software is used to transfer multimedia files to and from various devices, such as XBox, PCs, Windows Phones and Zune Player. By default, the Zune playlist is not compatible with other media players. This means ZPL files must first be converted to M3U, PLS or WPL file formats with the use of a Zune Playlist Converter to make it work.

Данные, имеющие отношение к мультимедиа (звук, видео и т. п.) хранятся в файлах в так называемом RIFF-формате (Resource Interchange File Format - формат файла для обмена ресурсами). Как wav-файлы, содержащие звук, так и avi-файлы, содержащие видеоинформацию, имеют формат RIFF.
Файл в формате RIFF содержит вложенные фрагменты (chunk"s). Внешний фрагмент состоит из заголовка и области данных (рис. 1).

Рис. 1. Фрагмент "RIFF"

Первое двойное слово заголовка содержит четырехбуквенный код FOURCC, который идентифицирует данные, хранящиеся во фрагменте. Второе двойное слово заголовка - размер области данных в байтах (без учета размера самого заголовка).
Область данных имеет переменную длину, однако она должна быть выравнена на границу слова и при необходимости дополнена в конце нулевым байтом до целого числа слов.
Заметим, что формат RIFF не описывает формат данных. Практически файл в формате RIFF может содержать любые данные для мультимедиа, причем формат данных зависит от типа данных.
Область, обозначенная на рис. 1 как "Данные", может содержать внутри себя другие фрагменты. Для файла, в котором хранятся звуковые данные (wav-файл), эта область содержит идентификатор данных "WAVE", фрагмент формата звуковых данных "fmt " (три символа "fmt" и пробел на конце), а также фрагмент звуковых данных (рис. 2). Файл может дополнительно содержать фрагменты других типов, поэтому не следует думать, что заголовок wav-файла имеет фиксированный формат. Например, в файле может присутствовать фрагмент "LIST" или "INFO", содержащий информацию о правах копирования и другую дополнительную информацию. Мы не будем рассматривать форматы других фрагментов, при необходимости вы можете узнать их из документации, которая поставляется в составе Microsoft SDK for Windows.

DWORD

DWORD

"RIFF"

Размер

Данные
"WAVE" "fmt " Размер Формат данных Фрагмент "data"
"data" Размер Звуковые данные

Рис. 2. Формат wav-файла

Область, обозначенная на рис. 2 как "Формат данных", описывает звуковые данные. Формат этой области для файлов РСМ (записанных с использованием импульсно-кодовой модуляции) соответствует структуре PCMWAVEFORMAT, определенной в файле mmsystem.h следующим образом:

Typedef struct pcinwaveformat_tag {
WAVEFORMAT wf;
WORD vBitsPerSample;
} PCMWAVEFORMAT;

Typedef PCMWAVEFORMAT *PPCMWAVEFORMAT;

Структура WAVEFORMAT также описана в файле mmsystem.h:

Typedef struct waveformat_tag {
WORD wFormatTag; // тип формата
WORD nChannels; // количество каналов (моно или стeрео)
DWORD nSamplesPerSec; // частота дискретизации
DWORD nAvgBytesPerSec; // скорость потока данных
WORD nBlockAlign; // выравнивание блока данных
} WAVEFORMAT;

Typedef WAVEFORMAT *PWAVEFORMAT;

Поле wFormatTag описывает тип формата звуковых данных. Для импульсно-кодовой модуляции РСМ, которая поддерживается стандартной библиотекой mmsystem.dll, в этом поле должно находиться значение WAVE_FORMAT_PCM, определенное в файле mmsystem.h:

#define WAVE_FORMAT_PCM 1

Поле nChannels содержит количество каналов. В нем могут находиться значение 1 (моно) или 2 (стерео).
В поле nSamplesPerSec записана частота дискретизации, то есть количество выборок сигнала в секунду. В этом поле могут находиться стандартные значения (11025 кГц, 22 050 кГц или 44100 кГц) либо нестандартные значения, такие, как 5000 кГц или 4400 кГц. Учтите, что не все драйверы звуковых адаптеров могут
работать с нестандартными частотами дискретизации.
Поле nAvgBytesPerSec содержит среднюю скорость потока данных, то есть количество байт в секунду, передаваемых драйверу устройства или получаемых от него. Эта информация может быть использована приложением для оценки размера буфера, необходимого для размещения звуковых данных. Для монофонического сигнала с дискретностью 8 бит численное значение скорости совпадает со значением частоты дискретизации. Для стереофонического сигнала с дискретностью 8 бит она в два раза выше. Точное значение вы можете подсчитать по формуле

NAvgBytesPerSec = (nChannels * nSamplesPerSec * wBitsPerSanipIe) / 8

В поле nBlockAlign находится выравнивание блока в байтах, которое подсчитывается по формуле

NBlockAlign = (nChannels * wBitsPerSample) / 8

Поле wBitsPerSainple находится в структуре PCMWAVEFORMAT и содержит дискретность сигнала, то есть количество бит, используемых для представления одной выборки сигнала. Обычно используются значение 8 или 16.
Что же касается формата самих звуковых данных, то он зависит от количества каналов и от дискретности.
Для монофонического сигнала с дискретностью 8 бит звуковые данные пред ставляют собой массив однобайтовых значений, каждое из которых является выбор-кой сигнала.
Для стереофонического сигнала с дискретностью 8 бит звуковые данных имеют формат массива двухбайтовых слов, причем младший байт слова соответствует левому каналу, а старший - правому.
Формат звуковых данных с дискретностью 16 бит выглядит аналогично. Для монофонического сигнала данные хранятся в массиве 16-битовых слов. Для стерео-фонического используется массив двойных слов, причем младшему слову соот-ветствует левый канал, а старшему - правый.
Диапазон изменения значений выборок сигнала определяется дискретизацией. Для 8-битовых данных он составляет от 0 до 255 (Охff), причем отсутствию сигнала (полной тишине) соответствует значение 128 (0х80). Для 16-битовых данных диапа-зон изменения составляет от -32768 (-0х8000) до 32767, (Ox7fff), отсутствию сигнала соответствует значение 0.

Формат WAV часто применяется для хранения несжатого звука. Как правило, профессионалы используют именно этот формат для работы с музыкой в аудиоредакторах. Если вам нужен конвертер аудио в WAV, воспользуйтесь видеоконвертером Movavi.

Movavi Конвертер Видео – это очень простая и удобная программа на русском языке, при помощи которой можно конвертировать видео и музыку в различные форматы. В этой программе вы сможете конвертировать в WAV не только аудио, но и видео, в том числе AVI, MP4, WMV и MOV, т. е. извлекать звук из видео .

Перед тем как начать конвертировать аудиофайлы в WAV, скачайте нужную версию программы и ознакомьтесь с этой инструкцией.

1. Установите программу для конвертации

Для начала вам нужно скачать установочный файл Movavi Конвертера Видео. Запустите скачанный файл и следуйте инструкциям на экране.

2. Добавьте аудиофайлы

Запустите видеоконвертер Movavi, нажмите кнопку Добавить файлы , расположенную в верхнем левом углу окна программы, и кликните Добавить аудио . Выберите файлы, которые нужно конвертировать в WAV, и нажмите кнопку Открыть .

3. Выберите WAV из списка форматов

Откройте вкладку Аудио и выберите формат WAV из списка. Помните, что при помощи конвертера WAV от Movavi вы также можете конвертировать WAV в MP3, FLAC, OGG, WMA и AAC: просто выберите желаемый аудиоформат из списка. Чтобы изменить аудиокодек, количество каналов, битрейт или другие настройки звука, воспользуйтесь кнопкой-шестеренкой рядом со списком форматов.



4. Выберите папку сохранения и начните конвертацию

Нажмите кнопку с изображением папки. В открывшемся диалоговом окне выберите папку, куда будут записываться сконвертированные файлы. Чтобы изменить формат выбранных аудиофайлов на WAV, осталось лишь нажать кнопку Старт и подождать, пока идет процесс конвертации.