Dải động được nén hoặc tiêu chuẩn. Làm chủ ngược: có thể tăng phạm vi động của các bản ghi nén được không? Sử dụng nén động

  • 27.10.2021

Nhóm phương pháp này dựa trên thực tế là các tín hiệu truyền đi là đối tượng của các biến đổi phi tuyến của biên độ, và trong các phần truyền và nhận của sự phi tuyến là tương hỗ. Ví dụ, nếu máy phát sử dụng hàm phi tuyến tính Öu, máy thu sử dụng u 2. Ứng dụng tuần tự của các hàm nghịch đảo sẽ dẫn đến phép biến đổi vẫn tuyến tính như một tổng thể.

Ý tưởng về phương pháp nén dữ liệu phi tuyến tính bắt nguồn từ thực tế là máy phát có thể truyền một phạm vi thay đổi lớn hơn trong tham số truyền (nghĩa là một dải động lớn hơn) với cùng biên độ của tín hiệu đầu ra. Dải động là tỷ số giữa biên độ tín hiệu cho phép lớn nhất và nhỏ nhất, được biểu thị bằng đơn vị tương đối hoặc decibel:

; (2.17)
. (2.18)

Mong muốn tự nhiên để tăng dải động bằng cách giảm U min bị giới hạn bởi độ nhạy của thiết bị và sự gia tăng ảnh hưởng của nhiễu và tiếng ồn nội tại.

Thông thường, nén dải động được thực hiện bằng cách sử dụng một cặp hàm lôgarit nghịch đảo và hàm chiết áp. Thao tác đầu tiên để thay đổi biên độ được gọi là nén(bằng cách nén), thứ hai là sự bành trướng(bằng cách kéo căng). Sự lựa chọn của các chức năng này có liên quan đến khả năng nén lớn nhất của chúng.

Đồng thời, các phương pháp này cũng có những nhược điểm. Đầu tiên là logarit của một số nhỏ là số âm trong giới hạn:

nghĩa là, độ nhạy rất phi tuyến tính.

Để giảm thiểu những nhược điểm này, cả hai hàm đều được sửa đổi với bù đắp và xấp xỉ. Ví dụ, đối với các kênh điện thoại, hàm gần đúng có dạng (loại A,):

và A = 87,6. Mức tăng từ nén là 24 dB.

Việc nén dữ liệu bằng các thủ tục phi tuyến tính được thực hiện bằng các phương tiện tương tự với sai số lớn. Việc sử dụng các công cụ kỹ thuật số có thể cải thiện đáng kể độ chính xác hoặc tốc độ chuyển đổi. Đồng thời, việc sử dụng trực tiếp công nghệ máy tính (tức là tính trực tiếp logarit và cấp số nhân) sẽ không cho kết quả tốt nhất do hiệu suất thấp và sai số tính toán tích lũy.

Do những hạn chế về độ chính xác, nén dữ liệu bằng cách nén được sử dụng trong các trường hợp không quan trọng, ví dụ, để truyền thoại qua điện thoại và các kênh vô tuyến.

Mã hóa hiệu quả

Các mã hiệu quả được đề xuất bởi K. Shannon, Fano và Huffman. Bản chất của các mã nằm ở chỗ chúng không đồng đều, tức là có số bit không bằng nhau và độ dài của mã tỷ lệ nghịch với xác suất xuất hiện của nó. Một tính năng đáng chú ý khác của mã hiệu quả là chúng không yêu cầu dấu phân cách, nghĩa là, các ký tự đặc biệt phân tách các tổ hợp mã liền kề. Điều này đạt được bằng cách tuân theo một quy tắc đơn giản: mã ngắn hơn không phải là đầu của mã dài hơn. Trong trường hợp này, dòng bit liên tục được giải mã duy nhất vì bộ giải mã phát hiện các từ mã ngắn hơn trước. Các mã hiệu quả từ lâu chỉ mang tính học thuật, nhưng gần đây chúng đã được sử dụng thành công trong việc hình thành cơ sở dữ liệu, cũng như nén thông tin trong các modem hiện đại và trong các trình lưu trữ phần mềm.

Do sự không đồng đều, độ dài trung bình của mã được nhập. Độ dài trung bình là kỳ vọng toán học về độ dài của mã:

hơn nữa, l cf có xu hướng H (x) từ phía trên (nghĩa là, l cf> H (x)).

Sự thỏa mãn điều kiện (2.23) tăng khi N tăng.

Có hai loại mã hiệu quả: Shannon-Fano và Huffman. Hãy xem cách lấy chúng bằng một ví dụ. Giả sử xác suất của các ký hiệu trong một dãy có giá trị như trong Bảng 2.1.

Bảng 2.1.

Xác suất ký hiệu

n
số Pi 0.1 0.2 0.1 0.3 0.05 0.15 0.03 0.02 0.05

Các ký hiệu được xếp hạng, nghĩa là, chúng được trình bày thành một chuỗi theo thứ tự xác suất giảm dần. Sau đó, theo phương pháp Shannon-Fano, quy trình sau được lặp lại định kỳ: toàn bộ nhóm sự kiện được chia thành hai nhóm con với tổng xác suất giống nhau (hoặc xấp xỉ nhau). Quy trình tiếp tục cho đến khi một phần tử vẫn còn trong nhóm con tiếp theo, sau đó phần tử này bị loại bỏ và các hành động được chỉ định tiếp tục với các phần tử còn lại. Điều này xảy ra cho đến khi một phần tử vẫn còn trong hai nhóm con cuối cùng. Hãy tiếp tục ví dụ của chúng tôi, được tóm tắt trong Bảng 2.2.

Bảng 2.2.

Mã hóa Shannon-Fano

n Số Pi
4 0.3 tôi
0.2 tôi II
6 0.15 tôi tôi
0.1 II
1 0.1 tôi tôi
9 0.05 II II
5 0.05 II tôi
7 0.03 II II tôi
8 0.02 II

Có thể thấy trong bảng 2.2, ký hiệu đầu tiên với xác suất p 4 = 0,3 đã tham gia vào hai thủ tục tách thành nhóm và cả hai lần đều rơi vào nhóm có số I. Theo đó, nó được mã hóa bằng mã hai chữ số II. Phần tử thứ hai ở giai đoạn đầu tiên của phân vùng thuộc nhóm I, ở phần thứ hai - đến nhóm II. Do đó, mã của nó là 10. Mã của các ký hiệu khác không cần chú thích thêm.

Thông thường, các mã không đồng nhất được mô tả dưới dạng cây mã. Cây mã là một biểu đồ chỉ ra các kết hợp mã được phép. Hướng của các cạnh của đồ thị này đã được thiết lập trước, như thể hiện trong Hình 2.11 (việc lựa chọn hướng là tùy ý).

Chúng được hướng dẫn bởi đồ thị như sau: lập lộ trình cho biểu tượng đã chọn; số chữ số của nó bằng số cạnh trong tuyến đường và giá trị của mỗi chữ số bằng chiều của cạnh tương ứng. Lộ trình được biên dịch từ điểm xuất phát (trong hình vẽ được đánh dấu bằng chữ A). Ví dụ, một lộ trình đến đỉnh 5 bao gồm năm cạnh, trong đó tất cả trừ cạnh cuối cùng có hướng 0; chúng tôi nhận được mã 00001.

Hãy tính toán entropy và độ dài từ trung bình cho ví dụ này.

H (x) = - (0,3 log 0,3 + 0,2 log 0,2 + 2 0,1 log 0,1+ 2 0,05 log 0,05+

0,03 log 0,03 + 0,02 log 0,02) = 2,23 bit

l av = 0,3 2 + 0,2 2 + 0,15 3 + 0,1 3 + 0,1 4 + 0,05 5 +0,05 4+

0.03 6 + 0.02 6 = 2.9 .

Như bạn thấy, độ dài từ trung bình gần bằng entropy.

Mã Huffman được xây dựng theo một thuật toán khác. Quy trình mã hóa bao gồm hai giai đoạn. Ở giai đoạn đầu tiên, việc nén một lần bảng chữ cái được thực hiện tuần tự. Nén một lần - thay thế hai ký tự cuối cùng (có xác suất thấp nhất) bằng một ký tự, với xác suất tổng. Quá trình nén được thực hiện cho đến khi còn lại hai ký tự. Đồng thời, bảng mã hóa được điền vào, trong đó xác suất kết quả được đưa ra và các tuyến đường mà các ký hiệu mới đi đến giai đoạn tiếp theo cũng được mô tả.

Ở giai đoạn thứ hai, quá trình mã hóa thực sự diễn ra, bắt đầu từ giai đoạn cuối cùng: ký tự đầu tiên trong hai ký tự được gán mã là 1, ký tự thứ hai - 0. Sau đó, một ký tự chuyển sang giai đoạn trước. Các mã từ giai đoạn tiếp theo được quy cho các ký tự không tham gia nén ở giai đoạn này và mã của ký tự thu được sau khi dán được gán hai lần cho hai ký tự cuối cùng và được thêm vào mã của ký tự trên 1, thấp hơn một - 0. Nếu nhân vật không được tiếp tục tham gia dán, mã của nó vẫn không thay đổi. Quy trình tiếp tục cho đến khi kết thúc (nghĩa là cho đến giai đoạn đầu tiên).

Bảng 2.3 cho thấy mã hóa Huffman. Như bạn có thể thấy từ bảng, mã hóa được thực hiện trong 7 giai đoạn. Bên trái là xác suất của các ký hiệu, bên phải - các mã trung gian. Các mũi tên hiển thị chuyển động của các biểu tượng mới được hình thành. Ở mỗi giai đoạn, hai ký tự cuối cùng chỉ khác nhau ở bit ít quan trọng nhất, tương ứng với kỹ thuật mã hóa. Hãy tính độ dài từ trung bình:

l av = 0,3 2 + 0,2 2 + 0,15 3 ++ 2 0,1 3 + +0,05 4 + 0,05 5 + 0,03 6 + 0,02 6 = 2,7

Điều này thậm chí còn gần với entropy: mã thậm chí còn hiệu quả hơn. Trong bộ lễ phục. 2.12 cho thấy cây mã Huffman.

Bảng 2.3.

Mã hóa Huffman

n số Pi mã số tôi II III IV V VI Vii
0.3 0.3 11 0.3 11 0.3 11 0.3 11 0.3 11 0.4 0 0.6 1
0.2 0.2 01 0.2 01 0.2 01 0.2 01 0.3 10 0.3 11 0.4 0
0.15 0.15 101 0.15 101 0.15 101 0.2 00 0.2 01 0.3 10
0.1 0.1 001 0.1 001 0.15 100 0.15 101 0.2 00
0.1 0.1 000 0.1 000 0.1 001 0.15 100
0.05 0.05 1000 0.1 1001 0.1 000
0.05 0.05 10011 0.05 1000
0.03 0.05 10010
0.02

Cả hai mã đều đáp ứng yêu cầu giải mã rõ ràng: như có thể thấy từ các bảng, các kết hợp ngắn hơn không phải là đầu của các mã dài hơn.

Với sự gia tăng số lượng ký hiệu, hiệu quả của các mã tăng lên, do đó, trong một số trường hợp, các khối lớn hơn được mã hóa (ví dụ: khi nói đến văn bản, bạn có thể mã hóa một số âm tiết, từ và thậm chí là phổ biến nhất. cụm từ).

Hiệu quả của việc đưa ra các mã như vậy được xác định bằng cách so sánh chúng với một mã thống nhất:

(2.24)

trong đó n là số bit của mã thống nhất, được thay thế bằng mã hiệu dụng.

Sửa đổi mã Huffman

Thuật toán Huffman cổ điển đề cập đến hai lần vượt qua, tức là trước hết yêu cầu thu thập số liệu thống kê về các ký hiệu và thông điệp, sau đó là các thủ tục được mô tả ở trên. Điều này không thuận tiện trong thực tế, vì nó làm tăng thời gian xử lý thư và tích lũy từ điển. Phương pháp một lần được sử dụng thường xuyên hơn, trong đó quy trình tích lũy và mã hóa được kết hợp. Các phương pháp như vậy cũng được gọi là nén thích ứng theo Huffman [46].

Bản chất của nén thích ứng Huffman được rút gọn thành việc xây dựng cây mã ban đầu và sửa đổi tuần tự của nó sau khi xuất hiện mỗi ký tự tiếp theo. Như trước đây, các cây là nhị phân ở đây, tức là nhiều nhất là hai cung xuất phát từ mỗi đỉnh của biểu đồ hình cây. Thông thường gọi đỉnh ban đầu là cha và hai đỉnh tiếp theo liên kết với nó, là con. Hãy để chúng tôi giới thiệu khái niệm trọng số của một đỉnh - đây là số lượng ký hiệu (từ) tương ứng với một đỉnh nhất định, có được khi gửi dãy ban đầu. Rõ ràng, tổng số cân nặng của con cái bằng số cân nặng của bố mẹ.

Sau khi giới thiệu ký tự tiếp theo của chuỗi đầu vào, cây mã được sửa lại: trọng số của các đỉnh được tính toán lại và nếu cần, các đỉnh được sắp xếp lại. Quy tắc hoán vị đỉnh như sau: trọng số của các đỉnh phía dưới là nhỏ nhất và các đỉnh bên trái của đồ thị có trọng số ít nhất.

Đồng thời, các đỉnh được đánh số. Việc đánh số bắt đầu từ các đỉnh dưới cùng (treo lơ lửng, tức là không có con) từ trái sang phải, sau đó chuyển lên mức cao nhất, v.v. trước khi đánh số của đỉnh ban đầu, cuối cùng. Trong trường hợp này, kết quả sau đây đạt được: trọng lượng của đỉnh càng ít thì số của nó càng ít.

Hoán vị được thực hiện chủ yếu đối với các đỉnh treo. Khi sắp xếp lại, cần lưu ý quy tắc xây dựng ở trên: đỉnh có trọng số cao hơn cũng có số cao hơn.

Sau khi vượt qua chuỗi (nó còn được gọi là kiểm soát hoặc kiểm tra), các tổ hợp mã được gán cho tất cả các đỉnh mặt dây chuyền. Quy tắc gán mã tương tự như trên: số bit mã bằng số đỉnh mà tuyến đi từ nguồn đến đỉnh treo đã cho và giá trị của một bit cụ thể tương ứng với hướng từ cha. thành "con" (ví dụ: sự chuyển đổi sang trái từ giá trị gốc tương ứng với giá trị 1, sang phải - 0).

Các tổ hợp mã kết quả được nhập vào bộ nhớ của thiết bị nén cùng với các đối tác của chúng và tạo thành một từ điển. Việc sử dụng thuật toán như sau. Chuỗi ký tự nén được chia thành các đoạn phù hợp với từ điển có sẵn, sau đó mỗi đoạn được thay thế bằng mã của nó từ từ điển. Các đoạn không tìm thấy trong từ điển tạo thành các đỉnh treo mới, tăng trọng lượng và cũng được nhập vào từ điển. Do đó, một thuật toán bổ sung từ điển thích ứng được hình thành.

Để nâng cao hiệu quả của phương pháp, điều mong muốn là tăng kích thước của từ điển; trong trường hợp này, tỷ lệ nén được tăng lên. Thực tế, kích thước của từ điển là 4-16 Kbyte bộ nhớ.


Hãy để chúng tôi minh họa thuật toán đã cho bằng một ví dụ. Trong bộ lễ phục. 2.13 cho thấy sơ đồ ban đầu (nó còn được gọi là cây Huffman). Mỗi đỉnh của cây được thể hiện bằng một hình chữ nhật, trong đó hai số được ghi thông qua một phân số: thứ nhất là số của đỉnh, thứ hai - trọng lượng của nó. Như bạn có thể thấy, sự tương ứng giữa trọng số của các đỉnh và số của chúng được đáp ứng.

Giả sử bây giờ ký hiệu tương ứng với đỉnh 1 được gặp lần thứ hai trong chuỗi thử nghiệm. Trọng lượng đỉnh đã thay đổi như trong Hình. 2.14, do quy tắc đánh số đỉnh bị vi phạm. Ở giai đoạn tiếp theo, chúng tôi thay đổi vị trí của các đỉnh treo, chúng tôi hoán đổi các đỉnh 1 và 4 và đánh số lại tất cả các đỉnh cây. Biểu đồ kết quả được hiển thị trong Hình. 2,15. Hơn nữa, quy trình tiếp tục theo cùng một cách.

Cần nhớ rằng mỗi đỉnh treo lơ lửng trong cây Huffman tương ứng với một biểu tượng nhất định hoặc một nhóm chúng. Cha mẹ khác con cái ở chỗ nhóm ký hiệu tương ứng với anh ta ngắn hơn nhóm con của anh ta một ký hiệu, và những đứa trẻ này khác nhau ở ký hiệu cuối cùng. Ví dụ, các ký hiệu "kar" tương ứng với cha mẹ; thì những đứa trẻ có thể có các chuỗi "kara" và "cá chép".

Thuật toán đã cho không mang tính học thuật và được sử dụng tích cực trong các chương trình lưu trữ, kể cả khi nén dữ liệu đồ họa (chúng ta sẽ nói về chúng bên dưới).

Lempel - Thuật toán Ziv

Đây là những thuật toán nén được sử dụng phổ biến nhất hiện nay. Chúng được sử dụng trong hầu hết các chương trình lưu trữ (ví dụ: PKZIP. ARJ, LHA). Bản chất của các thuật toán là một bộ ký hiệu nhất định được thay thế trong quá trình lưu trữ bằng số của nó trong một từ điển được tạo đặc biệt. Ví dụ, cụm từ "Số điện thoại gửi thư của bạn ...", thường được tìm thấy trong thư từ kinh doanh, có thể chiếm vị trí 121 trong từ điển; sau đó, thay vì truyền hoặc lưu trữ cụm từ được đề cập (30 byte), bạn có thể lưu trữ số cụm từ (1,5 byte ở dạng nhị phân - thập phân hoặc 1 byte - ở dạng nhị phân).

Các thuật toán được đặt theo tên của các tác giả lần đầu tiên đề xuất chúng vào năm 1977. Chiếc đầu tiên trong số này là LZ77. Để lưu trữ, một cửa sổ trượt được tạo ra, bao gồm hai phần. Phần đầu tiên, có định dạng lớn hơn, dùng để tạo từ điển và có kích thước theo thứ tự vài kilobyte. Phần thứ hai, nhỏ hơn (thường có kích thước tối đa 100 byte) chấp nhận các ký tự hiện tại của văn bản đang được xem. Thuật toán cố gắng tìm trong từ điển một bộ sưu tập các ký hiệu phù hợp với những ký hiệu nhận được trong khung nhìn. Nếu điều này thành công, một đoạn mã được tạo thành bao gồm ba phần: phần bù trong từ điển so với chuỗi con ban đầu của nó, độ dài của chuỗi con này, ký tự theo sau chuỗi con này. Ví dụ: chuỗi con đã chọn bao gồm các ký tự "ứng dụng" (tổng cộng 6 ký tự) theo sau là ký tự "e". Khi đó, nếu chuỗi con có địa chỉ (vị trí trong từ điển) 45, thì mục trong từ điển có dạng "45, 6. e". Sau đó, nội dung của cửa sổ được dịch chuyển theo một vị trí và tiếp tục tìm kiếm. Như vậy, một từ điển được hình thành.

Ưu điểm của thuật toán là dễ dàng chính thức hóa thuật toán biên dịch từ điển. Ngoài ra, có thể giải nén mà không cần từ điển gốc (mong muốn có một chuỗi kiểm tra cùng một lúc) - từ điển được hình thành trong quá trình giải nén.

Các nhược điểm của thuật toán xuất hiện khi kích thước của từ điển tăng lên - thời gian tìm kiếm tăng lên. Ngoài ra, nếu một chuỗi ký tự xuất hiện trong cửa sổ hiện tại không có trong từ điển, thì mỗi ký tự được viết bằng mã ba phần tử, tức là kết quả không phải là nén, mà là kéo giãn.

Thuật toán LZSS, được đề xuất vào năm 1978, có những đặc điểm tốt nhất. Nó có sự khác biệt về bảo trì cửa sổ trượt và mã đầu ra của máy nén. Ngoài cửa sổ, thuật toán tạo một cây nhị phân tương tự như cây Huffman để tăng tốc độ tìm kiếm các kết quả phù hợp: mỗi chuỗi con rời khỏi cửa sổ hiện tại sẽ được thêm vào cây dưới dạng một trong các chuỗi con. Thuật toán này cho phép bạn tăng thêm kích thước của cửa sổ hiện tại (mong muốn rằng kích thước của nó tương đương với lũy thừa của hai: 128, 256, v.v. byte). Các mã trình tự cũng được hình thành theo một cách khác: một tiền tố 1 bit bổ sung được đưa vào để phân biệt các ký tự chưa được mã hóa từ các cặp "độ lệch, độ dài".

Tỷ lệ nén thậm chí còn cao hơn khi sử dụng các thuật toán như LZW. Các thuật toán được mô tả trước đó có kích thước cửa sổ cố định, điều này khiến bạn không thể nhập các cụm từ dài hơn kích thước cửa sổ vào từ điển. Trong các thuật toán LZW (và LZ78 tiền nhiệm của chúng), khung nhìn có kích thước không giới hạn và từ điển tích lũy các cụm từ (không phải là một tập hợp các ký tự như trước đây). Từ điển có độ dài không giới hạn và bộ mã hóa (decoder) hoạt động ở chế độ chờ cụm từ. Khi cụm từ khớp với từ điển được hình thành, mã khớp (tức là mã của cụm từ này trong từ điển) và mã của ký tự tiếp theo sau nó được trả về. Nếu, khi các ký tự tích lũy, một cụm từ mới được hình thành, thì cụm từ đó cũng được nhập vào từ điển, giống như cụm từ ngắn hơn. Kết quả là một thủ tục đệ quy cung cấp mã hóa và giải mã nhanh chóng.

Khả năng nén bổ sung được cung cấp bởi mã hóa ký hiệu lặp lại nén. Nếu trong chuỗi một số ký tự theo sau liên tiếp (ví dụ: trong văn bản, nó có thể là ký tự "khoảng trắng", trong một chuỗi số - các số không liên tiếp, v.v.), thì bạn nên thay thế chúng bằng một cặp ký tự " ; length "hoặc" sign, length ". Trong trường hợp đầu tiên, mã chỉ ra dấu hiệu rằng chuỗi sẽ được mã hóa (thường là 1 bit), sau đó là mã của ký hiệu lặp lại và độ dài của chuỗi. Trong trường hợp thứ hai (được cung cấp cho các ký tự lặp lại thường xuyên xảy ra nhất), tiền tố chỉ đơn giản chỉ ra thuộc tính lặp lại.

, Trình phát phương tiện

Các bản thu âm, đặc biệt là những bản cũ được thu âm và sản xuất trước năm 1982, ít có khả năng bị trộn lẫn và làm to hơn nhiều. Chúng tái tạo âm nhạc tự nhiên với dải động tự nhiên được lưu lại trong hồ sơ và bị mất ở hầu hết các định dạng kỹ thuật số tiêu chuẩn hoặc độ nét cao.

Tất nhiên, vẫn có những trường hợp ngoại lệ - hãy nghe album của Steven Wilson mới phát hành gần đây từ MA Recordings hoặc Reference Recordings và bạn sẽ nghe được âm thanh kỹ thuật số tốt như thế nào. Nhưng điều này hiếm khi xảy ra, hầu hết các bản ghi âm hiện đại đều có âm lượng lớn và bị nén.

Việc nén nhạc gần đây đã bị chỉ trích nghiêm trọng, nhưng tôi cho rằng hầu như tất cả các bản ghi âm yêu thích của bạn đều được nén. Một số ít hơn, một số nhiều hơn, nhưng vẫn bị nén. Nén dải động là vật tế thần cho âm thanh nhạc kém, nhưng nhạc nén ở mức độ cao không phải là một xu hướng mới: nghe các album Motown thập niên 60. Điều tương tự có thể được nói đối với các tác phẩm kinh điển của Led Zeppelin hoặc các album trẻ hơn của Wilco và Radiohead. Nén dải động làm giảm mối quan hệ tự nhiên giữa âm thanh to nhất và âm thanh yên tĩnh nhất trên bản ghi âm, do đó, tiếng thì thầm có thể lớn như tiếng hét. Thật khó để tìm thấy nhạc pop của 50 năm qua không bị nén.

Gần đây tôi đã có một cuộc trò chuyện vui vẻ với người sáng lập và biên tập viên của Tape Op, Larry Crane về các khía cạnh tốt, xấu và xấu của nén. Larry Crane đã từng làm việc với các ban nhạc và nghệ sĩ như Stefan Marcus, Cat Power, Sleater-Kinney, Jenny Lewis, M. Ward, The Go-Betweens, Jason Little, Eliot Smith, Quasi và Richmond Fontaine. Anh ấy cũng điều hành Phòng thu âm Jackpot! ở Portland, Oregon, quê hương của The Breeders, The Decembeists, Eddie Vedder, Pavement, R.E.M., She & Him và nhiều hơn nữa.

Tôi trích dẫn album They Want My Soul của Spoon, phát hành năm 2014. Crane cười và nói rằng anh ấy lắng nghe anh ấy trong xe vì anh ấy nghe rất tuyệt ở đó. Điều này đưa chúng ta đến một câu trả lời khác cho câu hỏi tại sao âm nhạc được nén: bởi vì tính năng nén và độ "rõ ràng" hơn giúp nó nghe tốt hơn ở những nơi ồn ào.

Larry Crane tại nơi làm việc. Ảnh của Jason Quigley

Khi mọi người nói rằng họ thích âm thanh của bản ghi âm, tôi tin rằng họ thích âm nhạc, như thể âm thanh và âm nhạc là hai thuật ngữ không thể tách rời. Nhưng đối với bản thân tôi, tôi phân biệt các khái niệm này. Theo quan điểm của người yêu nhạc, âm thanh có thể thô và thô, nhưng điều đó sẽ không thành vấn đề đối với hầu hết người nghe.

Nhiều người vội vàng buộc tội các kỹ sư thành thạo lạm dụng quá trình nén, nhưng nén được áp dụng trực tiếp trong quá trình ghi âm, trong quá trình trộn và chỉ sau đó trong quá trình làm chủ. Nếu bạn không trực tiếp có mặt ở mỗi giai đoạn này, thì bạn sẽ không thể biết được âm thanh của các nhạc cụ và giọng hát như thế nào khi bắt đầu quá trình.

Crane tá hỏa: "Nếu một nhạc sĩ muốn cố tình làm cho âm thanh trở nên điên rồ và méo mó như những bản thu của Guided by Voices, thì không có gì sai khi điều đó - mong muốn luôn vượt trội hơn chất lượng âm thanh." Giọng của người biểu diễn gần như luôn luôn bị nén, điều tương tự cũng xảy ra với bass, trống, guitar và tổng hợp. Nén duy trì âm lượng giọng hát ở mức mong muốn trong suốt bài hát hoặc hơi nổi bật so với phần còn lại của âm thanh.

Nén đúng cách có thể làm cho âm thanh trống trở nên sống động hơn hoặc có chủ ý là kỳ lạ. Để âm nhạc có âm thanh tuyệt vời, bạn cần có khả năng sử dụng các nhạc cụ cần thiết cho việc này. Đây là lý do tại sao phải mất nhiều năm để tìm ra cách sử dụng tính năng nén và không lạm dụng nó. Nếu kỹ sư hòa âm đã nén phần guitar quá nhiều, kỹ sư thành thạo sẽ không thể khôi phục đầy đủ các tần số bị thiếu.

Nếu các nhạc sĩ muốn bạn nghe nhạc không trải qua giai đoạn trộn và làm chủ, thì họ sẽ phát hành nó vào các kệ hàng ngay từ phòng thu. Crane cho biết những người sáng tạo, chỉnh sửa, hòa âm và làm chủ âm nhạc không ở đó để bị lạc dưới chân các nhạc sĩ - họ đã giúp đỡ các nghệ sĩ ngay từ đầu trong hơn một thế kỷ qua.

Những người này là một phần của quá trình sáng tạo cho ra đời những tác phẩm nghệ thuật tuyệt vời. Crane nói thêm, "Bạn không muốn một phiên bản 'Dark Side of the Moon' chưa trải qua quá trình hòa trộn và làm chủ." Pink Floyd đã phát hành bài hát theo cách mà họ muốn nghe.

Mức độ âm thanh giống nhau trong toàn bộ bố cục, có một số khoảng tạm dừng.

Thu hẹp phạm vi động

Thu hẹp phạm vi động hoặc đơn giản hơn nén, là cần thiết cho các mục đích khác nhau, phổ biến nhất là:

1) Đạt được mức âm lượng đồng nhất trong toàn bộ tác phẩm (hoặc phần nhạc cụ).

2) Đạt được mức âm lượng đồng đều của các bài hát trong suốt quá trình phát sóng album / radio.

2) Cải thiện độ rõ, chủ yếu khi nén một phần nhất định (giọng hát, trống bass).

Làm thế nào để phạm vi động giảm?

Máy nén phân tích mức âm thanh đầu vào bằng cách so sánh nó với giá trị Ngưỡng do người dùng xác định.

Nếu mức tín hiệu dưới giá trị Ngưỡng- sau đó máy nén tiếp tục phân tích âm thanh mà không thay đổi âm thanh đó. Nếu mức âm thanh vượt quá giá trị Ngưỡng thì máy nén sẽ bắt đầu hoạt động. Vì vai trò của máy nén là thu hẹp dải động, hợp lý khi cho rằng nó giới hạn các giá trị lớn nhất và nhỏ nhất của biên độ (mức tín hiệu). Ở giai đoạn đầu tiên, các giá trị lớn nhất bị giới hạn, các giá trị này giảm xuống theo một lực nhất định, được gọi là Tỉ lệ(Thái độ). Hãy xem một ví dụ:

Các đường cong màu xanh lá cây biểu thị mức âm thanh, biên độ dao động của chúng từ trục X càng lớn thì mức tín hiệu càng lớn.

Đường màu vàng là ngưỡng (Threshold) của máy nén. Bằng cách đặt giá trị Ngưỡng cao hơn, người dùng sẽ di chuyển giá trị đó ra khỏi trục X. Bằng cách đặt giá trị Ngưỡng thấp hơn, người dùng đưa giá trị này đến gần trục Y. Rõ ràng là giá trị ngưỡng càng thấp thì máy nén càng thường xuyên được kích hoạt, và ngược lại, càng cao, càng ít thường xuyên. Nếu giá trị Ratio rất cao, thì sau khi đạt đến mức tín hiệu Ngưỡng, tất cả tín hiệu tiếp theo sẽ bị máy nén triệt tiêu cho đến khi im lặng. Nếu giá trị Ratio rất nhỏ, thì sẽ không có gì xảy ra. Việc lựa chọn các giá trị Ngưỡng và Tỷ lệ sẽ được thảo luận sau. Bây giờ chúng ta nên tự hỏi bản thân câu hỏi sau: Đâu là điểm triệt tiêu tất cả âm thanh tiếp theo? Thật vậy, không có ích gì trong việc này, chúng ta chỉ cần loại bỏ các giá trị biên độ (đỉnh) vượt quá giá trị Ngưỡng (được đánh dấu màu đỏ trên đồ thị). Để giải quyết vấn đề này có một tham số Phóng thích(Phân rã), đặt thời lượng nén.

Ví dụ cho thấy rằng lần đầu tiên và lần thứ hai vượt quá ngưỡng Threshold kéo dài ít hơn lần thứ ba vượt quá ngưỡng Threshold. Vì vậy, nếu thông số Phát hành được đặt thành hai đỉnh đầu tiên, thì khi xử lý đỉnh thứ ba, một phần chưa được xử lý có thể vẫn còn (vì vượt quá ngưỡng Threshold sẽ mất nhiều thời gian hơn). Nếu thông số Release được đặt thành đỉnh thứ ba, thì khi xử lý đỉnh thứ nhất và thứ hai, mức tín hiệu giảm không mong muốn sẽ hình thành đằng sau chúng.

Tương tự với tham số Ratio. Nếu tham số Ratio được đặt thành hai đỉnh đầu tiên, thì tham số thứ ba sẽ không bị triệt tiêu đủ. Nếu tham số Ratio được đặt để xử lý đỉnh thứ ba, thì quá trình xử lý hai đỉnh đầu tiên sẽ được đánh giá quá cao.

Những vấn đề này có thể được giải quyết theo hai cách:

1) Đặt tham số Tấn công là một giải pháp từng phần.

2) Nén động là một giải pháp hoàn chỉnh.

Tham số Mộttaki (Tấn công)được thiết kế để đặt thời gian mà sau đó máy nén sẽ bắt đầu hoạt động sau khi vượt quá Ngưỡng. Nếu thông số gần bằng 0 (bằng 0 trong trường hợp nén song song, xem bài viết tương ứng) - thì máy nén sẽ bắt đầu triệt tiêu tín hiệu ngay lập tức và khoảng thời gian được đặt bởi thông số Release sẽ hoạt động. Nếu tốc độ tấn công cao, thì máy nén sẽ bắt đầu hoạt động sau một khoảng thời gian nhất định (điều này là cần thiết để làm rõ). Trong trường hợp của chúng tôi, bạn có thể điều chỉnh các thông số của Ngưỡng, Mức giải phóng và Mức nén (Tỷ lệ) để xử lý hai đỉnh đầu tiên và đặt giá trị Tấn công gần bằng không. Sau đó, máy nén sẽ triệt tiêu hai đỉnh đầu tiên và khi xử lý đỉnh thứ ba, nó sẽ triệt tiêu nó cho đến khi vượt quá Ngưỡng. Tuy nhiên, điều này không đảm bảo quá trình xử lý âm thanh chất lượng cao và gần đến mức giới hạn (phần cắt thô của tất cả các giá trị biên độ, trong trường hợp này máy nén được gọi là bộ giới hạn).

Hãy xem kết quả của quá trình xử lý âm thanh bằng máy nén:

Các đỉnh đã biến mất, tôi lưu ý rằng cài đặt xử lý khá nhẹ nhàng và chúng tôi chỉ loại bỏ các giá trị biên độ nổi bật nhất. Trên thực tế, phạm vi động thu hẹp hơn nhiều và xu hướng này chỉ đang tiếp tục. Trong suy nghĩ của nhiều nhà soạn nhạc, họ làm cho âm nhạc to hơn, nhưng trên thực tế, họ hoàn toàn tước đi sự năng động của nó đối với những thính giả có thể nghe ở nhà chứ không phải trên đài phát thanh.

Nó vẫn để chúng tôi xem xét thông số nén cuối cùng, nó là Thu được(Thu được). Gain nhằm mục đích tăng biên độ của toàn bộ bố cục và về cơ bản tương đương với một công cụ chỉnh sửa âm thanh khác, bình thường hóa. Hãy cùng xem kết quả cuối cùng:

Trong trường hợp của chúng tôi, việc nén là hợp lý và cải thiện chất lượng âm thanh, vì đỉnh nổi bật là một tai nạn hơn là một kết quả cố ý. Ngoài ra, có thể thấy rằng âm nhạc có nhịp điệu, do đó nó có một dải động hẹp. Trong trường hợp các giá trị biên độ cao đã được cố tình thực hiện, quá trình nén có thể trở thành lỗi.

Nén động

Sự khác biệt giữa nén động và nén không động là lúc đầu, mức triệt tiêu tín hiệu (Ratio) phụ thuộc vào mức tín hiệu đầu vào. Máy nén động có sẵn trong tất cả các chương trình hiện đại, các thông số Tỷ lệ và Ngưỡng được điều khiển bằng cửa sổ (mỗi thông số có trục riêng):

Không có tiêu chuẩn duy nhất để hiển thị đồ thị, ở đâu đó dọc theo trục Y, mức tín hiệu đầu vào được hiển thị, ở đâu đó ngược lại, mức tín hiệu sau khi nén. Một nơi nào đó điểm (0,0) ở góc trên bên phải, một nơi nào đó ở phía dưới bên trái. Trong mọi trường hợp, di chuyển con trỏ chuột qua trường này sẽ thay đổi giá trị của các số tương ứng với các tham số Tỷ lệ và Ngưỡng. Những thứ kia. Bạn đặt mức nén cho từng giá trị Ngưỡng, điều này giúp bạn điều chỉnh độ nén rất linh hoạt.

Chuỗi bên

Máy nén xích bên phân tích tín hiệu của một kênh và khi mức âm thanh vượt quá ngưỡng, nó sẽ áp dụng nén cho kênh kia. Chuỗi bên có lợi thế khi làm việc với các nhạc cụ nằm trong cùng một vùng tần số (trống bass-bass được sử dụng tích cực), nhưng đôi khi các nhạc cụ nằm ở các vùng tần số khác nhau được sử dụng, điều này dẫn đến hiệu ứng chuỗi phụ thú vị.

Phần hai - Các giai đoạn nén

Có ba giai đoạn nén:

1) Giai đoạn đầu tiên là nén các âm thanh riêng lẻ (hát đơn).

Âm sắc của bất kỳ nhạc cụ nào cũng có các đặc điểm sau: Tấn công, Giữ, Giảm dần, Chậm trễ, Duy trì, Phát ra.

Giai đoạn nén các âm thanh riêng lẻ được chia thành hai phần:

1.1) Nén âm thanh nhạc cụ nhịp điệu riêng lẻ

Thông thường, các bit cấu thành yêu cầu nén riêng biệt để tạo độ giòn. Nhiều người xử lý trống trầm riêng biệt với các nhạc cụ nhịp điệu khác, cả ở giai đoạn nén các âm thanh riêng lẻ và ở giai đoạn nén các bộ phận riêng lẻ. Điều này là do thực tế là nó nằm ở vùng tần số thấp, nơi thường chỉ có âm trầm. Độ trong của trống trầm được hiểu là sự hiện diện của tiếng lách cách đặc trưng (trống trầm có thời gian tấn công và giữ tiếng rất ngắn). Nếu không có nhấp chuột, thì bạn cần xử lý nó bằng máy nén, đặt ngưỡng bằng 0 và thời gian tấn công từ 10 đến 50 ms. Realese của máy nén phải kết thúc trước khi khởi động lại. Vấn đề cuối cùng có thể được giải quyết bằng cách sử dụng công thức: 60.000 / BPM, trong đó BPM là nhịp độ của bố cục. Vì vậy, chẳng hạn) 60.000 / 137 = 437,96 (thời gian tính bằng mili giây cho đến một phần mạnh mới của bố cục 4 chiều).

Tất cả những điều trên áp dụng cho các nhạc cụ nhịp điệu khác có thời gian tấn công ngắn - chúng phải có tiếng nhấn có dấu, không được nén bởi máy nén ở bất kỳ giai đoạn nào của mức nén.

1.2) Nénâm thanh riêng lẻnhạc cụ hòa âm

Không giống như các nhạc cụ nhịp điệu, các bộ phận của nhạc cụ hòa âm hiếm khi được cấu tạo bởi các âm thanh riêng biệt. Tuy nhiên, điều này không có nghĩa là chúng không nên được xử lý ở mức độ nén âm thanh. Nếu bạn sử dụng mẫu có một phần được ghi lại, thì đây là mức nén thứ hai. Mức nén này chỉ bao gồm các nhạc cụ hài tổng hợp. Chúng có thể là bộ lấy mẫu, bộ tổng hợp sử dụng các phương pháp tổng hợp âm thanh khác nhau (mô hình vật lý, FM, cộng, trừ, v.v.). Như bạn có thể đã đoán - chúng ta đang nói về cài đặt bộ tổng hợp lập trình. Đúng! Đây cũng là nén! Hầu hết tất cả các bộ tổng hợp đều có tham số phong bì có thể lập trình (ADSR), có nghĩa là phong bì. Phong bì được sử dụng để đặt thời gian Tấn công, Suy giảm, Duy trì và Phát hành. Và nếu bạn nói với tôi rằng đây không phải là nén của từng âm thanh - bạn là kẻ thù của tôi suốt đời!

2) Giai đoạn thứ hai - Nén các bộ phận riêng lẻ.

Bằng cách nén các phần riêng lẻ, ý tôi là thu hẹp phạm vi động của một loạt các âm thanh riêng lẻ kết hợp. Giai đoạn này cũng bao gồm ghi âm các phần, bao gồm cả giọng hát, yêu cầu xử lý nén để làm cho nó rõ ràng và dễ hiểu. Khi xử lý quá trình nén các bộ phận, bạn cần phải tính đến thực tế là khi thêm các âm thanh riêng lẻ, các đỉnh không mong muốn có thể xuất hiện, bạn cần loại bỏ ở giai đoạn này, vì nếu điều này không được thực hiện ngay bây giờ, thì hình ảnh có thể xấu đi ở khâu trộn toàn bộ chế phẩm. Ở khâu nén từng bộ phận, bạn cần tính đến khâu nén âm thanh riêng lẻ. Nếu bạn đã đạt được độ trong của tiếng trống trầm, thì việc xử lý lại không chính xác ở giai đoạn thứ hai có thể làm hỏng mọi thứ. Máy nén xử lý tất cả các bộ phận là tùy chọn, vì nó không cần thiết phải xử lý tất cả các âm thanh riêng lẻ. Tôi khuyên bạn nên đặt một máy phân tích biên độ trong trường hợp để xác định sự hiện diện của các tác dụng phụ không mong muốn của việc kết hợp các âm thanh riêng lẻ. Ngoài việc nén, ở giai đoạn này, cần đảm bảo rằng các bộ phận ở các dải tần số khác nhau, nếu có thể, để quá trình lượng tử hóa được thực hiện. Nó cũng hữu ích để nhớ rằng âm thanh có một đặc tính như che dấu (tâm thần):

1) Âm thanh trầm hơn bị che bởi âm thanh lớn hơn phát ra phía trước.

2) Âm thanh êm hơn ở tần số thấp bị che bởi âm to hơn ở tần số cao.

Vì vậy, ví dụ, nếu bạn có phần tổng hợp, thì thường các nốt sẽ bắt đầu phát trước khi các nốt trước kết thúc âm thanh của chúng. Đôi khi điều này là cần thiết (tạo ra sự hài hòa, phong cách chơi, đa âm sắc), nhưng đôi khi không hề - bạn có thể cắt bỏ phần cuối của chúng (Delay - Release) nếu nó được nghe ở chế độ solo, nhưng không được nghe thấy ở tất cả các phần ở chế độ phát lại. Điều tương tự cũng áp dụng cho các hiệu ứng như hồi âm - nó sẽ không kéo dài cho đến khi nguồn âm thanh bắt đầu trở lại. Bằng cách cắt bỏ và loại bỏ tín hiệu không cần thiết, bạn làm cho âm thanh sạch hơn và đây cũng có thể được coi là quá trình nén - bởi vì bạn loại bỏ các sóng không cần thiết.

3) Giai đoạn thứ ba - Nén bố cục.

Khi nén toàn bộ bố cục, hãy nhớ rằng tất cả các phần đều là sự kết hợp của nhiều âm thanh riêng biệt. Vì vậy, khi kết hợp chúng và sau đó nén chúng, bạn cần chú ý để lần nén cuối cùng không làm hỏng những gì chúng ta đã đạt được trong hai giai đoạn đầu tiên. Bạn cũng cần tách các bố cục trong đó phạm vi rộng hay hẹp là quan trọng. khi nén các chế phẩm có dải động rộng, đủ để đặt một máy nén sẽ nghiền nát các đỉnh ngắn hạn được hình thành do cộng các bên với nhau. Nén một bố cục trong đó dải động hẹp là quan trọng sẽ phức tạp hơn nhiều. Ở đây gần đây máy nén được gọi là máy nén cực đại. Maximizer là một trình cắm thêm kết hợp máy nén, bộ giới hạn, bộ cân bằng đồ họa, bộ tăng cường và các công cụ chuyển đổi âm thanh khác. Đồng thời, anh ta nhất thiết phải có các công cụ phân tích âm thanh. Việc tối đa hóa, quá trình xử lý cuối cùng bằng máy nén, phần lớn là cần thiết để giải quyết những sai sót đã mắc phải trong các giai đoạn trước. Sai lầm không quá nhiều về việc nén (tuy nhiên, nếu bạn làm ở giai đoạn cuối, những gì bạn có thể làm ở giai đoạn đầu tiên đã là một sai lầm), như trong việc lựa chọn ban đầu các mẫu và dụng cụ tốt sẽ không ảnh hưởng lẫn nhau ( chúng ta đang nói về các dải tần số) ... Đó là cho điều này mà đáp ứng tần số được sửa chữa. Thường xảy ra rằng khi nén mạnh trên bản chính, bạn cần thay đổi các thông số nén và trộn ở các giai đoạn trước đó, vì khi dải động bị thu hẹp mạnh, các âm thanh yên tĩnh trước đây bị che đi sẽ phát ra, âm thanh của các thành phần riêng lẻ của thay đổi thành phần.

Trong những phần này, tôi cố tình không nói về các thông số nén cụ thể. Tôi cảm thấy cần phải viết về sự cần thiết phải chú ý đến tất cả các âm thanh và tất cả các bộ phận trong quá trình nén ở tất cả các giai đoạn sáng tác. Đây là cách duy nhất cuối cùng bạn sẽ có được một kết quả hài hòa không chỉ từ quan điểm của lý thuyết âm nhạc mà còn từ quan điểm của kỹ thuật âm thanh.

Bảng dưới đây cung cấp lời khuyên thiết thực để xử lý từng lô riêng lẻ. Tuy nhiên, trong quá trình nén, các con số và giá trị đặt trước chỉ có thể cho bạn biết khu vực bạn cần tìm. Cài đặt nén lý tưởng sẽ khác nhau tùy từng trường hợp. Các tham số Gain và Threshold giả định mức âm thanh bình thường (sử dụng hợp lý toàn bộ dải).

Phần ba - Tùy chọn nén

Tham khảo nhanh:

Threshold - xác định mức âm thanh của tín hiệu đến mà máy nén bắt đầu hoạt động khi đạt đến mức đó.

Attack - xác định thời gian mà sau đó máy nén sẽ bắt đầu hoạt động.

Mức (tỷ lệ) - xác định mức độ giảm của các giá trị biên độ (liên quan đến giá trị ban đầu của biên độ).

Release - xác định thời gian mà sau đó máy nén sẽ ngừng hoạt động.

Gain - Xác định mức độ tăng của tín hiệu đầu vào, sau khi được xử lý bởi máy nén.

Bảng nén:

Dụng cụ Ngưỡng Tấn công Tỉ lệ Phóng thích Thu được Sự miêu tả
Giọng hát 0 dB 1-2 mili giây

2-5 mS

10 mili giây

0,1 mili giây

0,1 mili giây

ít hơn 4: 1

2,5: 1

4:1 – 12:1

2:1 -8:1

150 mili giây

50-100 mS

150 mili giây

150 mili giây

0,5 giây

Nén trong quá trình ghi âm nên được tối thiểu, yêu cầu xử lý bắt buộc ở giai đoạn trộn để làm cho nó rõ ràng và dễ hiểu.
Nhạc cụ hơi 1 - 5ms 6:1 – 15:1 0,3 giây
Thùng từ 10 đến 50 mili giây

10-100 mS

4: 1 hoặc cao hơn

10:1

50-100 mili giây

1 mS

Thrshold càng thấp và Tỷ lệ càng cao và Tấn công càng dài, thì tiếng click ở đầu cú đá càng rõ rệt.
Bộ tổng hợp Phụ thuộc vào loại sóng (phong bì ADSR).
Trống Snare: 10-40 mS

1- 5ms

5:1

5:1 – 10:1

50 mS

0,2 giây

Hi-Hat 20 mS 10:1 1 mS
Micrô trên đầu 2-5 mS 5:1 1-50 mS
Trống 5ms 5:1 – 8:1 10ms
Bas-guitar 100-200 mS

4ms đến 10ms

5:1 1 mS

10ms

Dây 0-40 mS 3:1 500 mS
Sint. âm trầm 4ms - 10ms 4:1 10ms Phụ thuộc vào các phong bì.
Bộ gõ 0-20 mS 10:1 50 mS
Guitar acoustic, Piano 10-30 mS

5 - 10ms

4:1

5:1 -10:1

50-100 mS

0,5 giây

Electro-nitara 2 - 5ms 8:1 0,5 giây
Nén cuối cùng 0,1 mili giây

0,1 mili giây

2:1

2: 1 đến 3: 1

50 mili giây

0,1 mili giây

Đầu ra 0dB Thời gian tấn công phụ thuộc vào mục tiêu - cho dù bạn muốn loại bỏ các đỉnh hoặc làm cho đường chạy mượt mà hơn.
Giới hạn sau khi nén cuối cùng 0 mS 10:1 10-50 mS Đầu ra 0dB Nếu bạn cần một dải động hẹp và "cắt" sóng thô.

Thông tin được lấy từ nhiều nguồn khác nhau, được tham khảo bởi nhiều nguồn khác nhau trên Internet. Sự khác biệt về các thông số nén được giải thích là do sự khác biệt về sở thích âm thanh và cách làm việc với các chất liệu khác nhau.

Nén động(Nén dải động, DRC) - thu hẹp (hoặc mở rộng trong trường hợp mở rộng) dải động của bản ghi âm. Dải động, nó là sự khác biệt giữa âm thanh yên tĩnh nhất và to nhất. Đôi khi âm thanh yên tĩnh nhất trong nhạc nền sẽ lớn hơn một chút so với độ ồn và đôi khi yên tĩnh hơn một chút so với âm thanh lớn nhất. Các thiết bị và chương trình phần cứng thực hiện nén động được gọi là máy nén, phân biệt bốn nhóm chính trong số đó: bản thân máy nén, bộ giới hạn, bộ mở rộng và cổng.

Máy nén tương tự ống chân không DBX 566

Nén lên và xuống

Nén xuống(Nén xuống) giảm âm lượng của âm thanh khi âm thanh đó bắt đầu vượt quá ngưỡng nhất định, giữ nguyên các âm thanh trầm hơn. Tùy chọn nén xuống cực hạn là người giới hạn. Nén lên Ngược lại, (Nén hướng lên) sẽ tăng âm lượng nếu nó ở dưới giá trị ngưỡng mà không ảnh hưởng đến âm thanh to hơn. Trong trường hợp này, cả hai kiểu nén đều thu hẹp dải động của tín hiệu âm thanh.

Nén xuống

Nén lên

Expander và Gate

Nếu máy nén giảm dải động, bộ giãn nở sẽ tăng dải động. Khi mức tín hiệu tăng lên trên mức ngưỡng, bộ mở rộng sẽ tăng mức đó nhiều hơn, do đó làm tăng sự khác biệt giữa âm thanh lớn và âm thanh yên tĩnh. Những thiết bị như vậy thường được sử dụng khi ghi bộ trống để tách âm thanh của một số trống với những trống khác.

Loại bộ khuếch đại được sử dụng không phải để khuếch đại âm thanh lớn, nhưng để át đi âm thanh yên tĩnh không vượt quá mức ngưỡng (ví dụ: tiếng ồn xung quanh) được gọi là Cổng ồn ào... Trong một thiết bị như vậy, ngay khi mức âm thanh giảm xuống dưới ngưỡng, luồng tín hiệu sẽ dừng lại. Thông thường cổng được sử dụng để ngăn chặn tiếng ồn trong thời gian tạm dừng. Trên một số kiểu máy, bạn có thể đảm bảo rằng âm thanh không dừng đột ngột khi đạt đến mức ngưỡng mà nhỏ dần. Trong trường hợp này, tốc độ phân rã được đặt bằng núm Phân rã.

Gate, giống như các loại máy nén khác, có thể phụ thuộc vào tần số(nghĩa là xử lý các dải tần số nhất định theo cách khác nhau) và có thể hoạt động trong chuỗi bên(xem bên dưới).

Nguyên lý làm việc của máy nén

Tín hiệu đi vào máy nén được tách thành hai bản. Một bản sao được gửi đến bộ khuếch đại, trong đó mức độ khuếch đại được điều khiển bởi tín hiệu bên ngoài, bản sao thứ hai tạo thành tín hiệu này. Nó đi vào một thiết bị được gọi là chuỗi bên, nơi tín hiệu được đo và dựa trên dữ liệu này, một phong bì được tạo ra mô tả sự thay đổi về khối lượng của nó.
Đây là cách bố trí hầu hết các máy nén hiện đại, đây là loại được gọi là loại nạp tiến. Trong các thiết bị cũ hơn (loại phản hồi), mức tín hiệu được đo sau bộ khuếch đại.

Có nhiều công nghệ khuếch đại khuếch đại độ lợi biến tương tự khác nhau, mỗi công nghệ đều có những ưu và nhược điểm riêng: ống, quang sử dụng quang trở và bóng bán dẫn. Khi làm việc với âm thanh kỹ thuật số (trong trình chỉnh sửa âm thanh hoặc DAW), bạn có thể sử dụng các thuật toán toán học của riêng mình hoặc mô phỏng công việc của các công nghệ tương tự.

Các thông số cơ bản của máy nén

Ngưỡng

Máy nén giảm mức tín hiệu âm thanh nếu biên độ của nó vượt quá một giá trị ngưỡng nhất định. Nó thường được quy định bằng decibel, với ngưỡng thấp hơn (ví dụ -60 dB) có nghĩa là nhiều âm thanh sẽ được xử lý hơn ngưỡng cao hơn (ví dụ -5 dB).

Tỉ lệ

Mức giảm mức được xác định bởi tham số tỷ lệ: tỷ lệ 4: 1 có nghĩa là nếu mức đầu vào cao hơn ngưỡng 4 dB, mức tín hiệu đầu ra sẽ cao hơn ngưỡng 1 dB.
Ví dụ:
Ngưỡng = −10 dB
Tín hiệu đầu vào = −6 dB (4 dB trên ngưỡng)
Tín hiệu đầu ra = −9 dB (1 dB trên ngưỡng)

Điều quan trọng cần lưu ý là sự triệt tiêu mức tín hiệu tiếp tục diễn ra trong một thời gian sau khi nó giảm xuống dưới mức ngưỡng và thời gian này được xác định bởi giá trị của tham số phóng thích.

Nén với tỷ lệ tối đa là ∞: 1 được gọi là giới hạn. Điều này có nghĩa là bất kỳ tín hiệu nào trên mức ngưỡng đều bị chặn ở mức ngưỡng (ngoại trừ một khoảng thời gian ngắn sau khi tăng đột ngột âm lượng đầu vào). Xem Limiter bên dưới để biết chi tiết.

Ví dụ về các giá trị Tỷ lệ khác nhau

Tấn công và phát hành

Máy nén cung cấp một số kiểm soát về tốc độ phản ứng của nó với những thay đổi trong động lực tín hiệu. Tham số Attack xác định thời gian cần thiết để máy nén giảm mức khuếch đại đến mức được xác định bởi tham số Ratio. Release xác định thời gian trong đó máy nén, ngược lại, tăng mức khuếch đại hoặc trở lại bình thường nếu mức tín hiệu đầu vào giảm xuống dưới giá trị ngưỡng.

Các giai đoạn tấn công và phát hành

Các thông số này cho biết thời gian (thường tính bằng mili giây) sẽ cần để thay đổi độ lợi bằng một lượng decibel nhất định, thường là 10 dB. Ví dụ, trong trường hợp này, nếu Attack được đặt thành 1ms, sẽ mất 1ms để giảm mức tăng 10dB và 2ms để giảm mức tăng 20dB.

Trong nhiều máy nén, các thông số Tấn công và Phát hành có thể được điều chỉnh, nhưng trong một số máy nén, chúng được đặt trước và không thể điều chỉnh. Chúng đôi khi được gọi là "tự động" hoặc "phụ thuộc vào chương trình", tức là khác nhau tùy thuộc vào tín hiệu đầu vào.

Đầu gối

Thêm một thông số máy nén: cứng / mềm Đầu gối... Nó xác định thời điểm bắt đầu nén là cứng hay mềm. Đầu gối mềm làm giảm sự chuyển đổi đáng chú ý từ tín hiệu khô sang tín hiệu nén, đặc biệt là ở Tỷ lệ cao và tăng âm lượng đột ngột.

Nén đầu gối cứng và đầu gối mềm

Đỉnh và RMS

Máy nén có thể đáp ứng các giá trị đỉnh (cực đại ngắn hạn) hoặc mức đầu vào trung bình. Việc sử dụng các đỉnh có thể dẫn đến sự dao động mạnh trong tỷ lệ nén và thậm chí là biến dạng. Do đó, máy nén áp dụng chức năng tính trung bình (thường là RMS) của tín hiệu đầu vào khi so sánh nó với giá trị ngưỡng. Điều này cho phép nén thoải mái hơn, gần với nhận thức của con người về độ lớn.

RMS là một tham số phản ánh âm lượng trung bình của một bản ghi âm. Theo quan điểm toán học, RMS (Root Mean Square) là giá trị bình phương trung bình của biên độ của một số mẫu nhất định:

Liên kết âm thanh nổi

Một máy nén ở chế độ liên kết âm thanh nổi sẽ áp dụng cùng một độ lợi cho cả hai kênh âm thanh nổi. Điều này giúp tránh sự dịch chuyển của toàn cảnh âm thanh nổi có thể do quá trình xử lý riêng lẻ các kênh trái và phải. Sự thay đổi này xảy ra nếu, ví dụ, một phần tử ồn ào bị di chuyển ra ngoài trung tâm.

Tăng trang điểm

Khi máy nén giảm mức tổng thể của tín hiệu, người ta thường thêm tùy chọn độ lợi đầu ra cố định để có được mức tối ưu.

Nhìn thẳng

Tính năng nhìn về phía trước được thiết kế để giải quyết các vấn đề của cả hai giá trị Tấn công và Phát hành quá cao và quá thấp. Thời gian tấn công quá dài không cho phép chúng tôi chặn hiệu quả quá độ và quá ngắn có thể không thoải mái cho người nghe. Khi sử dụng chức năng nhìn trước, tín hiệu chính bị trễ so với trình quản lý, điều này cho phép quá trình nén bắt đầu sớm, ngay cả trước khi tín hiệu đạt đến ngưỡng.
Hạn chế duy nhất của phương pháp này là độ trễ thời gian của tín hiệu, điều này không mong muốn trong một số trường hợp.

Sử dụng nén động

Tính năng nén được sử dụng ở mọi nơi, không chỉ trong bản ghi âm nhạc mà còn ở bất cứ nơi nào cần tăng âm lượng tổng thể mà không tăng mức đỉnh, nơi sử dụng thiết bị tái tạo âm thanh rẻ tiền hoặc kênh truyền hạn chế (hệ thống cảnh báo và liên lạc, đài nghiệp dư, v.v. .) ...

Tính năng nén được sử dụng khi phát nhạc nền (trong cửa hàng, nhà hàng, v.v.) nơi không mong muốn có bất kỳ thay đổi đáng chú ý nào về âm lượng.

Nhưng ứng dụng quan trọng nhất để nén động là trong sản xuất và phát sóng âm nhạc. Nén được sử dụng để cung cấp "mật độ" và "ổ đĩa" âm thanh, để kết hợp tốt hơn giữa các nhạc cụ với nhau, và đặc biệt là khi xử lý giọng hát.

Giọng hát trong nhạc rock và nhạc pop thường được nén để làm cho chúng nổi bật hơn so với phần đệm và thêm rõ ràng. Một loại máy nén đặc biệt chỉ được điều chỉnh ở một số tần số nhất định - deesser - được sử dụng để loại bỏ âm vị rít.

Trong các bộ phận của nhạc cụ, tính năng nén cũng được sử dụng cho các hiệu ứng không liên quan trực tiếp đến âm lượng, chẳng hạn như âm thanh trống nhanh chóng phân rã có thể kéo dài hơn.

Side-chaining thường được sử dụng trong nhạc khiêu vũ điện tử (EDM) (xem bên dưới) - ví dụ: đường bass có thể được điều khiển bởi trống kick hoặc tương tự để ngăn tiếng bass và trống xung đột và tạo ra gợn động.

Nén được sử dụng rộng rãi trong phát thanh truyền hình (radio, truyền hình, webcasting) để tăng cường độ âm thanh cảm nhận được trong khi giảm dải động của âm thanh gốc (thường là CD). Hầu hết các quốc gia đều có những hạn chế pháp lý về âm lượng tối đa tức thời có thể được phát sóng. Thông thường những hạn chế này được thực hiện bởi các máy nén phần cứng vĩnh viễn trong chuỗi ether. Ngoài ra, việc tăng cường độ âm lượng cảm nhận sẽ cải thiện "chất lượng" của âm thanh theo quan điểm của hầu hết người nghe.

Xem thêm Cuộc chiến ồn ào.

Tăng liên tục âm lượng của cùng một bài hát được làm lại cho CD từ năm 1983 đến năm 2000.

Chuỗi bên

Một công tắc máy nén phổ biến khác là xích bên. Trong chế độ này, âm thanh được nén không phụ thuộc vào mức độ riêng của nó, mà phụ thuộc vào mức độ của tín hiệu đi vào đầu nối, thường được gọi là chuỗi bên.

Có một số cách sử dụng cho việc này. Ví dụ, một ca sĩ nói ngọng và tất cả các chữ cái "s" nổi bật so với bức tranh tổng thể. Bạn truyền giọng nói của anh ấy qua máy nén và vào đầu nối chuỗi bên, bạn truyền âm thanh tương tự, nhưng truyền qua bộ cân bằng. Trên bộ chỉnh âm, bạn loại bỏ tất cả các tần số ngoại trừ những tần số được sử dụng bởi giọng ca khi phát âm chữ cái "c". Thông thường khoảng 5 kHz, nhưng có thể nằm trong khoảng từ 3 kHz đến 8 kHz. Nếu sau đó bạn đặt máy nén ở chế độ chuỗi bên, thì hiện tượng nén giọng nói sẽ xảy ra trong những thời điểm khi chữ "c" được phát âm. Do đó, thiết bị được gọi là "de-esser" đã được thu được. Cách làm việc này được gọi là phụ thuộc tần số.

Một cách sử dụng khác của tính năng này được gọi là "ducker". Ví dụ, trong một đài phát thanh, nhạc đi qua máy nén, và lời của DJ đi qua chuỗi bên. Khi DJ bắt đầu trò chuyện, âm lượng của nhạc sẽ tự động giảm. Hiệu ứng này có thể được sử dụng rất thành công trong việc ghi âm, chẳng hạn như bằng cách giảm âm lượng của các bộ phận bàn phím trong khi hát.

Giới hạn tường gạch

Máy nén và bộ giới hạn hoạt động theo cách giống nhau, chúng ta có thể nói rằng bộ giới hạn là máy nén có Tỷ lệ cao (từ 10: 1) và thông thường, thời gian tấn công thấp.

Có khái niệm Giới hạn tường gạch - giới hạn với Tỷ lệ rất cao (20: 1 trở lên) và tấn công cực nhanh. Lý tưởng nhất là nó không cho phép tín hiệu vượt quá mức ngưỡng cả. Kết quả sẽ gây khó chịu cho tai, nhưng nó sẽ tránh làm hỏng thiết bị tái tạo âm thanh hoặc vượt quá băng thông của kênh. Nhiều nhà sản xuất tích hợp các giới hạn vào thiết bị của họ cho mục đích này.

Clipper vs. Giới hạn, cắt mềm và cứng

Công nghệ mã hóa được sử dụng trong đầu đĩa DVD độc quyền

bộ giải mã và thu âm thanh. Nén (hoặc giảm) dải động được sử dụng để hạn chế âm thanh đạt cực đại khi xem phim. Nếu người xem muốn xem một bộ phim có thể có sự thay đổi đột ngột về mức âm lượng (phim về chiến tranh,

chẳng hạn), nhưng không muốn làm phiền các thành viên trong gia đình mình, thì nên bật DRC. Về mặt chủ quan, sau khi bật DRC, tỷ lệ tần số thấp trong âm thanh giảm đi và âm thanh cao mất đi độ trong, vì vậy bạn không nên bật chế độ DRC mà không cần thiết.

DreamWeaver (Xem - FrontPage)

Một trình soạn thảo tài liệu siêu văn bản trực quan được phát triển bởi công ty phần mềm Macromedia Inc. Chương trình chuyên nghiệp mạnh mẽ DreamWeaver có khả năng tạo các trang HTML có quy mô và độ phức tạp bất kỳ, đồng thời cũng có hỗ trợ tích hợp cho các dự án mạng lớn. Nó là một công cụ thiết kế trực quan hỗ trợ các khái niệm WYSIWYG nâng cao.

Người lái xe Người lái xe)

Một thành phần phần mềm cho phép bạn tương tác với các thiết bị

máy tính, chẳng hạn như thẻ giao diện mạng (NIC), bàn phím, máy in hoặc màn hình. Thiết bị mạng (chẳng hạn như một trung tâm) được kết nối với PC yêu cầu trình điều khiển để PC giao tiếp với thiết bị.

DRM (Quản lý quyền kỹ thuật số)

u Một khái niệm giả định việc sử dụng các công nghệ và phương pháp đặc biệt để bảo vệ các tài liệu kỹ thuật số nhằm đảm bảo rằng chúng chỉ được cung cấp cho những người dùng có thẩm quyền.

v Chương trình khách hàng để tương tác với gói Dịch vụ Quản lý Quyền Kỹ thuật số, được thiết kế để kiểm soát quyền truy cập vào thông tin có bản quyền và việc sao chép thông tin. Dịch vụ DRM chạy trên Windows Server 2003. Phần mềm khách sẽ chạy trên Windows 98, Me, 2000 và XP, cung cấp cho các ứng dụng như Office 2003 quyền truy cập vào các dịch vụ thích hợp. Trong tương lai, Microsoft dự kiến ​​sẽ phát hành một plugin quản lý quyền kỹ thuật số cho Internet Explorer. Trong tương lai, dự kiến ​​sẽ có một chương trình như vậy trên máy tính để hoạt động với bất kỳ nội dung nào sử dụng công nghệ DRM nhằm bảo vệ chống sao chép bất hợp pháp.

Droid (Robot) (Xem tr. Đại lý)

DSA(Thuật toán chữ ký số)

Thuật toán chữ ký số khóa công khai. Được phát triển bởi NIST (Mỹ) vào năm 1991.

DSL (Digital Subscrabe Line - Digital Subscriber Line)

Công nghệ hiện đại được các tổng đài điện thoại thành phố hỗ trợ để trao đổi tín hiệu ở tần số cao hơn so với tần số được sử dụng trong modem analog thông thường. Modem DSL có thể hoạt động đồng thời với điện thoại (tín hiệu tương tự) và đường dây kỹ thuật số. Vì phổ của tín hiệu thoại từ điện thoại và tín hiệu DSL kỹ thuật số không "chồng chéo", i. E. không gây nhiễu lẫn nhau, DSL cho phép bạn lướt Internet và nói chuyện điện thoại trên cùng một đường truyền vật lý. Hơn nữa, công nghệ DSL thường sử dụng nhiều tần số và các modem DSL ở cả hai phía của đường dây cố gắng tìm những tần số tốt nhất để truyền dữ liệu. Modem DSL không chỉ truyền dữ liệu mà còn hoạt động như một bộ định tuyến. Được trang bị cổng Ethernet, modem DSL giúp kết nối nhiều máy tính với nó.

DSOM(Mô hình đối tượng hệ thống phân tán, SOM phân tán - Mô hình đối tượng hệ thống phân tán)

Công nghệ của IBM với phần mềm hỗ trợ thích hợp.

DSR? (Bộ dữ liệu đã sẵn sàng - tín hiệu sẵn sàng để truyền dữ liệu, báo hiệu DSR)

Tín hiệu giao diện nối tiếp cho biết rằng một thiết bị (ví dụ:

modem) đã sẵn sàng để gửi bit dữ liệu đến PC.

DSR? (Báo cáo trạng thái thiết bị)

DSR? (Đăng ký trạng thái thiết bị)

DSS? (Hệ thống hỗ trợ quyết định)