突破性創新－32位元浮點錄音

2023-03-14

32 bit浮點錄音是錄音領域的突破性創新。超過 1,500dB 的動態範圍，削波是不可能的，設置增益水平也無關緊要。32 位浮點記錄於 2019 年首次亮相，是一項相對較新的功能，市場上很少有記錄儀提供此功能。本文將查看所有可用選項，並提供有關什麼是 32 位浮點記錄及其如此出色的其他訊息。

32 bit浮點錄音看起來很神奇，因為超過 0 dBFS錄音的失真可以完全恢復。有關此“魔法”的演示，請參見下面的 GIF。

降低後期增益後截斷 24 位與 32 位浮點記錄。請注意 24 位文件如何保持裁剪，但 32 位浮點文件如何完美地恢復 0 dBFS 以上的數據。

錄音後期降低增益後， 24 位元錄音與 32 位元浮點錄音的比較。

請注意 32 位元浮點錄音檔案如何完美地恢復 0 dBFS 以上失真的數據。

以前使用 16 位元和 24 位元錄音，超過 0 dBFS錄音的失真是不可能救的。如果你的音頻峰值超過 0 dBFS，則錄音音頻將永久失真，因為這些格式無法記錄超過0 dBFS的任何數據。

32 位元浮點錄音動態可以記錄 0 dBFS 以上 +770 dB 和0 dBFS以下 -758 dB 的音頻數據。提供了難以理解的 1528 dB 動態範圍。這個數字很難完全掌握，因為地球上最安靜的聲音（無響室）和可能的最大聲音 (194 dB) 之間的動態範圍僅為 185 dB。

在地球上最安靜和最響亮的聲音之上有超過 1000 dB 的動態餘裕，削風失波是不可能的。超過 0 dBFS 的失真音頻可以通過衰減訊號在錄音後期輕鬆恢復。

這是 Sound Devices 的一篇很棒的文章，更詳細地解釋了這一點：

https://www.sounddevices.com/32-bit-float-files-explained/

32 位元浮點數與 32 位元固定數

市場上有許多聲稱具有 32 位元解析度的錄音機和錄音介面。在我們繼續之前，要指出 32 位元格式之間的差異。

儘管 32 位元固定數（也稱為“整數”）已將動態範圍提高到 192 dB，但是其析度在超過0 dBFS 以上時，無法擴展。這代表 32 位元固定錄音的失真無法恢復。

底線：32 位元固定數是一種整數錄音格式，無法記錄超過 0 dBFS 的數據。如果設備未指明它是 32 位元浮點數還是 32 位元固定數，則它是固定的。

32 位元浮點數的用途？

在兩種情況下，32 位元浮點數非常適合錄音師：

錄製具有大動態範圍的場景。
記錄不可預測的環境。

具有大動態範圍的場景，可以是耳語和喊叫的對話，或者對話和引擎聲音的汽車場景。在這些場景中，32 位浮點數可以使混音器不必即時調整增益，也不必在錄音後期，去找到未失真的音軌。雷暴是受益於 32 位元浮點數動態聲音的另一個示例。

不可預測的環境更適合現場錄音師在無人看管的情況下，或在錄音室環境之外捕捉聲音。自然和人造的環境聲景都屬於這一類。

作為一名自然野外錄音師，我總是保守地將增益設置得較低，以防任何野生動物靠近我的麥克風。這些與大自然的親密互動，受到我和其他人的珍視，因為它們捕捉到在其他情況下極為罕見的聽覺體驗。

有了 32 位元浮點，我現在可以在高增益下以最低的本底噪聲記錄所有內容，而不必擔心削峰失真而失去那些神奇的時刻。

檔案大小比較

32 位元浮點數的缺點之一，是它比傳統的位元深度佔用更多的存儲空間。這是由於32 位元比 16 位元和 24 位元音頻數據取樣率更大。

音訊數據是透過將取樣率、位元深度和聲道數相乘計算得出的。

為了省您的時間，我建立了兩個表格，以相關術語比較了不同位元深度和取樣率的數據。

每 GB 占用時間（2 個聲道）

	48kHz	96kHz	192kHz
16-bit	1hr 26m	43m 24s	21m 42s
24-bit	57m 52s	28m 56s	14m 28s
32-bit float	43m 24s	21m 42s	10m 51s

每 60 分鐘的檔案大小（2 個聲道）

	48kHz	96kHz	192kHz
16-bit	659 MB	1.29 GB	2.57 GB
24-bit	989 MB	1.93 GB	3.86 GB
32-bit float	1.29 GB	2.57 GB	5.15 GB

相容 32 位元浮點數的軟體

並非所有DAW 都可以讀取 32 位浮點。 Sound Devices 擁有最新的應用程序支援列表。他們甚至在 MacOS 和 Windows 之間劃分了結果。在這裡查看他們的最新發現。

在正確的情況下，32 位浮點數可以改變遊戲規則。當您知道，無論如何錄音都不會有削峰失真時，可以節省時間，並減輕壓力。

就個人而言，我真的很期待將 32 位浮點數用於 drop-rig 和雷暴。我對嘗試使用 Ambisonic 錄音很感興趣，所以我傾向於使用 Zoom F6。然而，MixPre-3 II 更安靜的前級放大器和更好的構建質量，使決策變得困難。

對那種 32 位浮動錄音機感興趣，將如何運用它的動態範圍？

Sound devices MixPre II 型號引入了 32 位浮點運算錄音 WAV 檔的功能。對於超高動態範圍錄音，32 位浮點運算是最理想的錄音格式。這些音檔的主要優點是它們能夠正常記錄超過 0 dBFS 的訊號。事實上，餘裕空間如此之大，從高傳真音響的角度來看，錄音時設置增益在那個位置，一點都不重要。使用主要的 DAW 軟體錄音後，32 位浮點運算WAV 檔中的音訊電平可以向上或向下調整，而不會增加噪音或失真。要瞭解 32 位元檔案的具體細節，請繼續閱讀。本文討論了16位元定點、24位元定點和32位元浮點運算檔案之間的差異。

16 位元檔案

傳統的 16 位元 WAV 檔存儲未壓縮的音訊樣本，其中每個樣本由一個 16 位元的二進位數字表示（二進位數 = “位元”）。這些數字是“定點”，因為它們是整數（沒有小數點）。二進位形式的16位元數表示從0到65535（2的16次方）的整數。

數值表示對應於訊號震幅的離散電壓電平。65535 表示訊號可以達到的最大幅度（最響亮），最低值表示音檔的本底雜訊，最低位元在 0 和 1 之間切換。由於有 65536 個電平，因此雜訊 = （1/65536）。

將此雜訊以dB形式表示：

dB雜訊 = 20 x log （1/65536） = -96.3 dB

dB形式的最大電平：

最大 dB = 20 x log （65536/65536） = 0 dB

16 位 WAV 檔可以表示的最大動態範圍為（0 dB – （-96.3 dB）） = 96.3 dB

16 位元WAV 檔案，無論是在數位錄音機還是 DAW 軟體中，都聲稱捕獲的最大訊號為0 dBFS，這意味著相對最大音量為 0 dB。因此，16 位元WAV 檔可以存儲從 0 dBFS 到 -96 dBFS 的音訊。每個音訊樣本在硬碟或記憶體上消耗 16 位元空間，在 48 kHz 採樣率下，這意味著需要 16 x 48，000 = 768，000 位元/秒來存儲單聲道 16 位元、48 kHz 檔。

24 位元檔案

24 位（定點）WAV 檔通過擴展 16 位元數位數字（增加 50%位元）來改進 16位元的振幅解析度，以形成 24 位元數位數字。

位元越多，分頻音訊訊號的離散電壓電平就越多。二進位表示法中的 24 位元範圍為 0 到 16,777,215 （2的24次方)

對24位元檔案進行相同的計算，來計算噪音水平和最大電平，結果如下：

dBnoise = 20 x log (1/16777216) = -144.5 dB

dBmax = 20 x log (16777216/16777216) = 0 dB

24位元（固定點）檔案的動態範圍是（0分貝-（-144.5分貝））= 144.5分貝

就像16位元檔案一樣，錄音機和DAW軟體錄製24位元WAV檔案以0 dBFS為最大訊號。每個音訊樣本消耗24位元數位儲存空間，以48 kHz的取樣率，這意味著一個聲道、24位元、48 kHz的檔案每秒需要24 x 48,000 = 1,152,000位元的儲存空間。與16位元檔案相比，儲存空間增加50%，捕獲的動態範圍從96分貝增加到144分貝，效能大幅提高。目前，24位，48 kHz WAV檔案是專業音訊社群中最廣泛使用的檔案。

32位元浮點運算

與固定點檔案（16位元或24位元）相比，32位元浮點運算檔案以浮點格式儲存數字。這與固定點有根本的不同，因為這些WAV檔案中的數字以“科學符號”儲存，使用十進位制點和指數（例如“1.4563 x 10的6次方”而不是“1456300”）。
這種差異很大，因為與固定點表示相比，可以顯示更大和更小的數字。 32位元數位數字的格式和編碼並不直觀——它已經進行了最佳化，使電腦能夠在上面執行常見的數學功能，而不是人類可讀性。第一個位元表示正值或負值，接下來的8位元表示指數，最後23位元表示mantissa曼蒂薩。 (此格式亦稱為IEEE-754）。

可以表示的最大數字是~3.4 x 10的38次方，最小數字是~1.2 x 10的-38次方。做數學運算：

dB噪聲 = 20 x log (1.2 x 10的-38) = -758 dB

dBmax = 20 x log (3.4 x 10 的38次方 ) = 770 dB

32位（浮點運算）檔案可以顯示的動態範圍為1528分貝。由於地球上聲壓的最大差異約為210分貝，從無響室到大規模衝擊波，1528分貝遠遠超出了在電腦檔案中，顯示聲學聲音振幅所需的範圍。

32位元浮點運算檔案還有一個方面並不明顯。用32位元浮點運算錄製的聲音檔案，其中32位元檔案的0 dBFS與24位元或16位元檔案的0 dBFS對行。請記住，它與24位元或16位元檔案不同，32位元檔案最高可達+770 dBFS。因此，與24位元WAV檔案相比，32位元浮點運算WAV檔案的餘域空間增加了770分貝。

現代、專業的DAW軟體可以讀取32位元浮點運算檔案。當DAW首次讀取32位元檔案時，大於0 dBFS的訊號，可能會首先顯示為削峰失真，因為預設情況下，檔案讀取是以0 dB為增益。透過對DAW中的檔案訊號衰減，高於0 dBFS的訊號可以送致低於0 dBFS的位置，不失真，並與任何24位元或16位元檔案一樣使用。

對於32位元浮點運算錄音，從Hi-fi的角度來看，錄音時增益的確切設定，不再令人擔憂。錄音時，錄製的水平可能很低或非常高，但錄音後，DAW軟體可以很容易地調整，而不會出現額外的噪音或失真。這可以透過these sample files. 擋案看到。

這是相同的音源，一個用24位元固定錄音，另一個用32位元浮點運算錄音。這兩個檔案在最初讀入DAW軟體時，都會產生削峰失真，但32位元檔案的增益可以透過DAW調整。

32位元浮點運算檔案的每個音訊樣本，在硬碟或記憶體上消耗32位元空間，對於48 kHz取樣率，這意味著32位元、48 kHz檔案每秒需要32 x 48,000 = 1,536,000位元。因此，與24位元檔案相比，儲存空間增加了33%，捕獲的動態範圍從144分貝到基本上是無限的（超過1500分貝）。但更重要的是，超過0 dBFS的音訊可以正常的儲存在檔案中，使失真的憂慮成為過去。

用高效能類比和數位電子產品，錄製32位元浮點運算音訊檔案，可以利用其巨大動態範圍的優點，為音響設計師和混音器提供了一種錄製音訊的新方式。這對於無需使用限幅器即可捕捉非常響亮、意想不到的聲音的應用方式特別有用。與24位元檔案相比，使用32位元浮點運算檔案的缺點是更大的檔案大小。