32 bit浮點錄音是錄音領域的突破性創新。超過 1,500dB 的動態範圍,削波是不可能的,設置增益水平也無關緊要。32 位浮點記錄於 2019 年首次亮相,是一項相對較新的功能,市場上很少有記錄儀提供此功能。本文將查看所有可用選項,並提供有關什麼是 32 位浮點記錄及其如此出色的其他訊息。

 

 

32 bit浮點錄音看起來很神奇,因為超過 0 dBFS錄音的失真可以完全恢復。 有關此“魔法”的演示,請參見下面的 GIF。

 

降低後期增益後截斷 24 位與 32 位浮點記錄。 請注意 24 位文件如何保持裁剪,但 32 位浮點文件如何完美地恢復 0 dBFS 以上的數據。

 

錄音後期降低增益後, 24 位元錄音與 32 位元浮點錄音的比較。

 

請注意 32 位元浮點錄音檔案如何完美地恢復 0 dBFS 以上失真的數據。

 

以前使用 16 位元和 24 位元錄音,超過 0 dBFS錄音的失真是不可能救的。 如果你的音頻峰值超過 0 dBFS,則錄音音頻將永久失真,因為這些格式無法記錄超過0 dBFS的任何數據。

 

32 位元浮點錄音動態可以記錄 0 dBFS 以上 +770 dB 和0 dBFS以下 -758 dB 的音頻數據。 提供了難以理解的 1528 dB 動態範圍。 這個數字很難完全掌握,因為地球上最安靜的聲音(無響室)和可能的最大聲音 (194 dB) 之間的動態範圍僅為 185 dB。

 

在地球上最安靜和最響亮的聲音之上有超過 1000 dB 的動態餘裕,削風失波是不可能的。 超過 0 dBFS 的失真音頻可以通過衰減訊號在錄音後期輕鬆恢復。

這是 Sound Devices 的一篇很棒的文章,更詳細地解釋了這一點:

https://www.sounddevices.com/32-bit-float-files-explained/

 

32 位元浮點數與 32 位元固定數

 

市場上有許多聲稱具有 32 位元解析度的錄音機和錄音介面。 在我們繼續之前,要指出 32 位元格式之間的差異。

儘管 32 位元固定數(也稱為“整數”)已將動態範圍提高到 192 dB,但是其析度在超過0 dBFS 以上時,無法擴展。這代表 32 位元固定錄音的失真無法恢復。

底線:32 位元固定數是一種整數錄音格式,無法記錄超過 0 dBFS 的數據。 如果設備未指明它是 32 位元浮點數還是 32 位元固定數,則它是固定的。

 

 32 位元浮點數的用途?

 

在兩種情況下,32 位元浮點數非常適合錄音師:

 

  1. 錄製具有大動態範圍的場景。
  2. 記錄不可預測的環境。

 

具有大動態範圍的場景,可以是耳語和喊叫的對話,或者對話和引擎聲音的汽車場景。 在這些場景中,32 位浮點數可以使混音器不必即時調整增益,也不必在錄音後期,去找到未失真的音軌。 雷暴是受益於 32 位元浮點數動態聲音的另一個示例。

 

不可預測的環境更適合現場錄音師在無人看管的情況下,或在錄音室環境之外捕捉聲音。 自然和人造的環境聲景都屬於這一類。

 

作為一名自然野外錄音師,我總是保守地將增益設置得較低,以防任何野生動物靠近我的麥克風。 這些與大自然的親密互動,受到我和其他人的珍視,因為它們捕捉到在其他情況下極為罕見的聽覺體驗。

 

有了 32 位元浮點,我現在可以在高增益下以最低的本底噪聲記錄所有內容,而不必擔心削峰失真而失去那些神奇的時刻。

 

檔案大小比較

 

32 位元浮點數的缺點之一,是它比傳統的位元深度佔用更多的存儲空間。 這是由於32 位元比 16 位元和 24 位元音頻數據取樣率更大。

 

音訊數據是透過將取樣率、位元深度和聲道數相乘計算得出的。

 

為了省您的時間,我建立了兩個表格,以相關術語比較了不同位元深度和取樣率的數據。

 

每 GB 占用時間(2 個聲道)

 

 

48kHz

96kHz

192kHz

16-bit

1hr 26m

43m 24s

21m 42s

24-bit

57m 52s

28m 56s

14m 28s

32-bit float

43m 24s

21m 42s

10m 51s

 

每 60 分鐘的檔案大小(2 個聲道)

 

 

48kHz

96kHz

192kHz

16-bit

659 MB

1.29 GB

2.57 GB

24-bit

989 MB

1.93 GB

3.86 GB

32-bit float

1.29 GB

2.57 GB

5.15 GB

 

 

相容 32 位元浮點數的軟體

 

並非所有DAW 都可以讀取 32 位浮點。 Sound Devices 擁有最新的應用程序支援列表。 他們甚至在 MacOS 和 Windows 之間劃分了結果。 在這裡查看他們的最新發現。

 

在正確的情況下,32 位浮點數可以改變遊戲規則。 當您知道,無論如何錄音都不會有削峰失真時,可以節省時間,並減輕壓力。

 

就個人而言,我真的很期待將 32 位浮點數用於 drop-rig 和雷暴。 我對嘗試使用 Ambisonic 錄音很感興趣,所以我傾向於使用 Zoom F6。 然而,MixPre-3 II 更安靜的前級放大器和更好的構建質量,使決策變得困難。

 

對那種 32 位浮動錄音機感興趣,將如何運用它的動態範圍?

 

Sound devices MixPre II 型號引入了 32 位浮點運算錄音 WAV 檔的功能。對於超高動態範圍錄音,32 位浮點運算是最理想的錄音格式。這些音檔的主要優點是它們能夠正常記錄超過 0 dBFS 的訊號。事實上,餘裕空間如此之大,從高傳真音響的角度來看,錄音時設置增益在那個位置,一點都不重要。使用主要的 DAW 軟體錄音後,32 位浮點運算WAV 檔中的音訊電平可以向上或向下調整,而不會增加噪音或失真。要瞭解 32 位元檔案的具體細節,請繼續閱讀。本文討論了16位元定點、24位元定點和32位元浮點運算檔案之間的差異。

 

16 位元檔案

傳統的 16 位元 WAV 檔存儲未壓縮的音訊樣本,其中每個樣本由一個 16 位元的二進位數字表示(二進位數 = “位元”)。這些數字是“定點”,因為它們是整數(沒有小數點)。二進位形式的16位元數表示從0到65535(2的16次方)的整數。

 

數值表示對應於訊號震幅的離散電壓電平。65535 表示訊號可以達到的最大幅度(最響亮),最低值表示音檔的本底雜訊,最低位元在 0 和 1 之間切換。由於有 65536 個電平,因此雜訊 = (1/65536)。
 

將此雜訊以dB形式表示:

dB雜訊 = 20 x log (1/65536) = -96.3 dB

dB形式的最大電平:

最大 dB = 20 x log (65536/65536) = 0 dB

16 位 WAV 檔可以表示的最大動態範圍為 (0 dB – (-96.3 dB)) = 96.3 dB

 

16 位 元WAV 檔案,無論是在數位錄音機還是 DAW 軟體中,都聲稱捕獲的最大訊號 為0 dBFS,這意味著相對最大音量為 0 dB。因此,16 位 元WAV 檔可以存儲從 0 dBFS 到 -96 dBFS 的音訊。每個音訊樣本在硬碟或記憶體上消耗 16 位元空間,在 48 kHz 採樣率下,這意味著需要 16 x 48,000 = 768,000 位元/秒來存儲單聲道 16 位元、48 kHz 檔。

 

24 位元檔案

24 位(定點)WAV 檔通過擴展 16 位元數位數字(增加 50%位元)來改進 16位元的振幅解析度,以形成 24 位元數位數字。

 

位元越多,分頻音訊訊號的離散電壓電平就越多。二進位表示法中的 24 位元範圍為 0 到 16,777,215 (2的24次方)

對24位元檔案進行相同的計算,來計算噪音水平和最大電平,結果如下:

dBnoise = 20 x log (1/16777216) = -144.5 dB

dBmax = 20 x log (16777216/16777216) = 0 dB

 

24位元(固定點)檔案的動態範圍是(0分貝-(-144.5分貝))= 144.5分貝

 

就像16位元檔案一樣,錄音機和DAW軟體錄製24位元WAV檔案以0 dBFS為最大訊號。 每個音訊樣本消耗24位元數位儲存空間,以48 kHz的取樣率,這意味著一個聲道、24位元、48 kHz的檔案每秒需要24 x 48,000 = 1,152,000位元的儲存空間。 與16位元檔案相比,儲存空間增加50%,捕獲的動態範圍從96分貝增加到144分貝,效能大幅提高。 目前,24位,48 kHz WAV檔案是專業音訊社群中最廣泛使用的檔案。

 

32位元浮點運算

 

與固定點檔案(16位元或24位元)相比,32位元浮點運算檔案以浮點格式儲存數字。 這與固定點有根本的不同,因為這些WAV檔案中的數字以“科學符號”儲存,使用十進位制點和指數(例如“1.4563 x 10的6次方”而不是“1456300”)。 
這種差異很大,因為與固定點表示相比,可以顯示更大和更小的數字。 32位元數位數字的格式和編碼並不直觀——它已經進行了最佳化,使電腦能夠在上面執行常見的數學功能,而不是人類可讀性。 第一個位元表示正值或負值,接下來的8位元表示指數,最後23位元表示mantissa曼蒂薩。 (此格式亦稱為IEEE-754)。

 

可以表示的最大數字是~3.4 x 10的38次方,最小數字是~1.2 x 10的-38次方。 做數學運算:

 

dB噪聲 = 20 x log (1.2 x 10的-38) = -758 dB

dBmax = 20 x log (3.4 x 10 的38次方 ) = 770 dB

 

32位(浮點運算)檔案可以顯示的動態範圍為1528分貝。 由於地球上聲壓的最大差異約為210分貝,從無響室到大規模衝擊波,1528分貝遠遠超出了在電腦檔案中,顯示聲學聲音振幅所需的範圍。

 

32位元浮點運算檔案還有一個方面並不明顯。 用32位元浮點運算錄製的聲音檔案,其中32位元檔案的0 dBFS與24位元或16位元檔案的0 dBFS對行。 請記住,它與24位元或16位元檔案不同,32位元檔案最高可達+770 dBFS。 因此,與24位元WAV檔案相比,32位元浮點運算WAV檔案的餘域空間增加了770分貝。

 

現代、專業的DAW軟體可以讀取32位元浮點運算檔案。 當DAW首次讀取32位元檔案時,大於0 dBFS的訊號,可能會首先顯示為削峰失真,因為預設情況下,檔案讀取是以0 dB為增益。 透過對DAW中的檔案訊號衰減,高於0 dBFS的訊號可以送致低於0 dBFS的位置,不失真,並與任何24位元或16位元檔案一樣使用。

 

對於32位元浮點運算錄音,從Hi-fi的角度來看,錄音時增益的確切設定,不再令人擔憂。 錄音時,錄製的水平可能很低或非常高,但錄音後,DAW軟體可以很容易地調整,而不會出現額外的噪音或失真。 這可以透過these sample files. 擋案看到。 

 

這是相同的音源,一個用24位元固定錄音,另一個用32位元浮點運算錄音。 這兩個檔案在最初讀入DAW軟體時,都會產生削峰失真,但32位元檔案的增益可以透過DAW調整。

 

32位元浮點運算檔案的每個音訊樣本,在硬碟或記憶體上消耗32位元空間,對於48 kHz取樣率,這意味著32位元、48 kHz檔案每秒需要32 x 48,000 = 1,536,000位元。 因此,與24位元檔案相比,儲存空間增加了33%,捕獲的動態範圍從144分貝到基本上是無限的(超過1500分貝)。 但更重要的是,超過0 dBFS的音訊可以正常的儲存在檔案中,使失真的憂慮成為過去。

 

用高效能類比和數位電子產品,錄製32位元浮點運算音訊檔案,可以利用其巨大動態範圍的優點,為音響設計師和混音器提供了一種錄製音訊的新方式。 這對於無需使用限幅器即可捕捉非常響亮、意想不到的聲音的應用方式特別有用。 與24位元檔案相比,使用32位元浮點運算檔案的缺點是更大的檔案大小。