Re: [閒聊] HTPC/CAT建構的自身經驗

Oswyn 發表於 2020/3/16 上午2:22:40

看板Headphone標題Re: [閒聊] HTPC/CAT建構的自身經驗作者

(Oswyn)時間Mar 16 02:22:40 2020推噓32 推:32 噓:0 →:59

WASAPI (push) 是較新的 WaveRT Port Driver、使用 cyclic buffers，Audio device
需要支援 DMA。有人不推是因為部分 Audio device 相容性不佳，為了省麻煩就叫你別
用，不用就不會有機會有問題。話說什麼年代了硬體還不支援 DMA（笑）、硬體相容性
、支援度不佳並不是這個模式的問題。用 WASAPI (push) 有問題該吐草的是兩光硬體
或其不良驅動程式。但你知道的做 Audio 設備的很多在這塊通常都....

WASAPI (event) 是舊式的 "ping-pong" buffers。

工作正常 Buffer 大小能滿足傳輸的話兩者沒有不同。不管是 WASAPI or ASIO 其功能
都只是在程式與 Audio interface 間傳遞 Audio data 並不決定聲音品質。

Buffer 是拿來緩衝的，夠大傳輸就不容易出包不易有 Pops、Clicks and Cracks 這些
音頻故障。只是聽個音樂而不是二、三十個音軌在混音＊ｎ個 plug-in 在 DSP，除非
硬體或驅動有問題啦...

in foobar【讀檔＞解碼＞ReplayGain＞DSP chain＞Output】＝＞Audio Device

一連串的 Audio playback stream，在其中一個地方強迫資料流變得零碎並不會讓它
變實時只是形成瓶頸，更容易發生音頻故障。

Audio interface 都有硬體最小 buffer size 限制與實際最大 buffer size。
一般常見的最小 size 是 30000 hundred-nanosecond、也就是 3 ms。但這不代表這硬
體在 3ms 一定能完美工作就是了，畢竟能不能操極限是要看整台設備的軟硬體。

而 foobar2000 的 foo_out_wasapi 寫的很陽春，它沒有互動也沒有防呆雖然功能上是
沒有問題啦。

在設定中向 WASAPI 提出的是 buffer size 的【請求】，實際上 WASAPI 會依據 audioframe 的大小（ch 數 * bit-depth * Sample rate）來回應一個可行 buffer size。

零是不可能的、也不能比硬體的最小 buffer size 要小。以上面的例子 3ms 會回給一
個能放 3.xx ms audio大小的 buffer。而 audio 的位元深與採樣率會影響實際大小。

太小的 buffer size 對 WASAPI (push) 的 cyclic buffers 不利。Cyclic buffers
是你追我跑的環形緩衝區，設太小＝跑道太短會很容易撞車。cyclic buffers 是先進
先出（FIFO）其延遲是看硬體自發性的讀取。foobar 是 music player 所以 audio
data 都是已知的，buffer size 設大點沒什負面問題但最好不要設的太小。

WASAPI (event) 的 "乒乓" buffers 則不能設太大，如上述沒有防呆。如果在此
設定了超過硬體的最大值，多出來的部分則會丟失。

極端例子如硬體最大 buffer size 只有 250ms 如果設了 500ms，foobar 每次會傳送
500ms 的 audio 但硬體只能實收 250ms 然後播放、多出來的 250ms audio 會被放生
。然後 foobar 會再送下一個 500ms...250ms 被播放 250ms 被放生。會聽到很嚴重的
輟音，然後進度條跑的飛快。以此例五分鐘的音樂會跳針成二分半就播完。

但如果只設成大了點，只丟失幾個 samples 輟音不夠嚴重，如不知原因可能只會聽出
比較不好聽。但根源上的問題是設定已經錯誤了，但 foo_out_wasapi 並沒有防呆也
沒有任何互動告知使用者的 buffer size 出問題。

應該些人聽信 push mode 不可用，用 event mode 設大有問題所以得出小＝好的結論

另如上述如果硬體的 buffer size 最小值是 3ms，這代表設成 0～3ms 之間的任何值
WASAPI 所回應的 buffer size 大小都會是相同的，所以聽起來不可能會有不同。

但如果使用者覺得設成 0ms 最棒，那有什麼理由不能說 3ms、5ms、10ms、50ms 到超
過最大值前聽起來都跟設成 0ms 一樣好？有人能挑戰用聽的聽出硬體的最小 buffer
size 值？如果小真的好音質真有差、盲測應該能分辨出最小 buffer size 這個界線才
是。

聽出硬體最大 buffer size 大致上的大小應該不難，基本上這就是嚴重的音頻故障。
因為就算每次只最小丟失一個 sample 也會因為定時定頻率重複發生而顯得明顯。參考
出問題／正常的分界適中的設定 event mode 的 buffer size 應該是不錯的選擇。

在這部分應只有 audio interface 耗盡 audio data 而後面的 audio data 來不及備
妥產生的音頻故障，而沒有正常備妥＆傳輸但影響音質的問題。

另外這的 32-bit 指的是 32-bit float？不論是整數或浮點，在 source audio data
一般最高只有 24-bit 的 playback 的狀況下這應該沒有什好處。只會增加無謂的資料
傳輸量，這會讓低延遲的設定環境更容易撞車。除非有進行 DSP 不然看不出會有好處
就是了。

--
人間五十年、化天のうちを比ぶれば、夢幻の如くなり
^,,,^ 一度生を享け、滅せぬもののあるべきか
(ミ‵ω′)\m/ NOBUMETAL DEATH!!(乂'ω')

※ PTT留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.45.253.183 (臺灣)

※ PTT 網址

→

max820103/16 05:21怎麼我感覺看了很多，但又不知道結論是什麼，我的問題嗎?

→

alanswill03/16 06:39看不懂QQ,不過我在網路上查到的都是說event比push還要

→

alanswill03/16 06:39新？

推

louis040703/16 08:12hi 感謝你的解釋，我其實沒能力知道driver底層的機制，

→

louis040703/16 08:12所以建議壓低buffer只是沿用過去CAT玩家的原則，在不出

→

louis040703/16 08:12事的情況下壓低各種buffer與latency

推

louis040703/16 08:19至於這樣對聽感的影響，就像我之前推文提到的，我只能

→

louis040703/16 08:19解釋到低延遲對SI有好處，然後音頻裝置吃到高品質數位

→

louis040703/16 08:19訊號對聽感有助益，至於是讓receiver工作的更好還是這

→

louis040703/16 08:19樣的SI品質會一路串到da線路影響解出來的類比訊號品質

→

louis040703/16 08:19就非我能解釋的了

推

louis040703/16 08:22然後32bit云云，就data層面確實就是補0，是不是真的有

→

louis040703/16 08:22差我也不確定，當心理作也可以

但以 32-bit 傳輸 24-bit 的資訊表示 data payload 無謂的增加更耗時耗功、事實上也增加了系統 DPC Latency DPC Latency 不佳最常見的狀況就是有問題的硬體或驅動佔了茅坑不拉屎卡住了後面排隊的，今天 24-bit 精度的 Audio 以 32-bit 傳送就表示３秒能傳完的要花４秒，多佔用了１／４的時間，然後只是沒用的零而且耗的點是直接加諸在 Audio interface & controller 所以說有沒有差也不確定，這跟原原PO 你把 WASAPI 兩個 mode 的 buffer 都設成了零一樣。既然不能確定就照不知道有什麼原理的經驗法則這不都只是心理用而已了嗎能真心肯定的說出設成 0ms 真的比 10ms 好，因為是 ABX 盲測出來的確定結果，而不是因為過去CAT玩家的原則所影響的？

推

ultimatevic03/16 09:10感謝資訊真複雜...

推

djboy03/16 10:08感謝，專業推！！

→

djboy03/16 12:12O大文，每次都讀的好開心

推

clioneurise03/16 12:14推好文

推

yamatai03/16 12:52可惜音響上面偏偏就是buffer小聲音比較真，buffer大聲音

→

yamatai03/16 12:52會變滑順浮腫

推

breadf03/16 13:25我想文章意思是，小有個極限，大的話event也是有極限

→

breadf03/16 13:25在軟體UI上看到的設定值不一定是實際值

推

louis040703/16 15:39底層機制一定是這樣，看願意開放多少彈性給應用層

其實在 Audio 的相關 Latency 出現在很多地方，也有不同的意義個人感想是可能很多玩家搞混了這些不同的 Latency 像合成樂器的 Latency About Latency / VST Instruments | Steinberg.help

https://bit.ly/3b2KOez

這的 Latency 就只是延遲，譬如樂創作者接到電腦的 Keyboard 琴鍵按下去要 400ms 後聲音才發出來。這延遲會讓人感到不舒適但不會影響音質同樣的在現場進行 RT監聽的狀況設備的 Latency 也會是重要的關鍵 DAC digital filters 的兩個主要分類 IIR & FIR 的重要參數 Latency

https://imgur.com/ZN6kYvy

Latency 較低的 IIR 系因較沒有 "pre-ringing" 受部分人士的喜好但這的 Latency 也只是 digital filters 的特性所表現出來的結果而不是因為低 Latency 所以聲音好但傳輸過程中的 Buffer 造成的 Latency... 我要說的是不管是 WASAPI or ASIO 都只是整個傳輸過程中的其中一段這就像用卡車在送貨，你可以只裝一、二箱就出車，也以裝幾十箱再出車但收貨方的需求如果是持續且定時定量的話，你就必需一直出貨每次送的少你就必需發更多車一次裝的多就可以少出點車次，但等貨裝貨的時間就＝Latency 為什麼車在跑的時間沒什麼人在計算 Latency？因為以現在的電腦來說這個時間太短了，有部分 DAW 如 PEAPER 有 Performance Monitor 計算實際時間但在路上每台車都會碰上各種交通狀況，這就是 DPC Latency 所反應給你的每次送的少、收貨方的備貨就少，容錯值就低。貨架空了就是音頻故障每次送的少＝Latency 低、是比較新鮮啦，但就如上述除了有互動需求的話早個幾 ms 聽到的音樂是會比較鮮啦、但 Audio data 又不是生鮮跟 SI 又有什麼關係就實在讓人搞不清楚了另外車次多、排放就高，所需要的總 CPU 時間也會更多產生的熱能也更多這方面的負面影響又要如何考量？這就又回到跟上面討論的 24-bit vs 32-bit 類似的狀況，一個感覺問題而已

推

ang72803/16 20:47精闢解析

推

louis040703/16 21:04嘿，針對32bit，我思考的角度是，wasapi會不會統一吃32

→

louis040703/16 21:04bit data也就是我說的預設格式，傳24給他，他還要再補0

→

louis040703/16 21:04，跟你舉例的情形剛好相反，但我也說了只是我猜的，我

→

louis040703/16 21:04也不排除是心理作用

推

louis040703/16 21:09另外感謝你解釋了DPC latency的含義，至於buffer大小，

→

louis040703/16 21:10我最早也不信，現在自己跟著用。但確實也不可能每個buf

→

louis040703/16 21:10fer設定都給他測試看看，你要這樣質疑我也無法反駁，

→

louis040703/16 21:10頂多爭辯一句這不是只有我自己在心裡感覺。實際上不管

→

louis040703/16 21:10是中文英文甚至是日文資訊，全世界在討論CAT的社群在

→

louis040703/16 21:10這幾部分的看法幾乎都是相似的，但要說誰有辦法解釋的

→

louis040703/16 21:10很嚴謹完整，我也沒見過就是

推

louis040703/16 21:14跟SI關係，看來我比較多是用dpc latency在想，單純buff

→

louis040703/16 21:14er大小部分，看來又是塊我是無法解釋的東西

推

goldie03/16 21:15推

系統在處理 audio data 幾乎都是以浮點數在處理，因為整數沒效率 foobar 也是、不管你的來源檔是什麼解碼後放到記憶體中都是浮點格式 foobar DSP chain 也是浮點，我想 WASAPI 也是但這跟【傳送】是兩碼子事，如上述 CPU & RAM 的速度不是 interface 可比為什麼現在 ITB 混音後製可以二三十個音軌＊Ｎ個 plug-in 進行大量的 DSP 計算後還來得及以幾百 ms 的 Latency 輸出？當然這些都是以浮點在計算但算完必然有量化的問題，會有抖動或噪聲整形的需求可如果沒進行任何會改變數據的 DSP 處理，USB & S/PDIF 都是 serial bus 這 8-bit 就是多出來的，多傳送沒必要的資訊有何益處？另外我也覺得沒可能也沒必要每個值都去設定試聽但 0ms、1ms、3ms 有沒有不同？10ms 真有比較差？還是根本無法肯定就只是隨波逐流？人耳的精度有限、尤其聲音是變動的不像視覺可以同時比較兩個畫面除非差異足夠大不然聽覺要分辨不同的難度很高不是嗎

推

louis040703/16 21:17提出一個猜想，buffer拉大，表示要等更多資料湊齊一個

→

louis040703/16 21:17標準單位，這時可能會讓送出的時間變得更不規律，也就

→

louis040703/16 21:17是我說的SI劣化

推

breadf03/16 21:19SI不是L1的東西嗎？還是我誤會你SI的意思XD

推

louis040703/16 21:49Signal Integrity,其實我只是長期以來覺得類比訊號

→

louis040703/16 21:50一樣一堆類比性質,後來才知道確實有這個概念

→

louis040703/16 21:50更正:"數位訊號"一樣有一堆類比性質

推

breadf03/16 21:53是這樣沒錯啊，L1來看本來就沒有純數位的東西

→

breadf03/16 21:54只是我覺得拉到L1來看，送不送出bus上都是always有東西跑

→

breadf03/16 21:54所以不明白不規律跟SI劣化關聯有這麼大嗎？當然duty不一樣

→

breadf03/16 21:55電源設計也許duty加重的時候PI變爛影響SI也是有可能

→

breadf03/16 21:55*電源設計不佳

推

louis040703/16 21:56那你當我腦補吧,畢竟是亂猜想的 DPC latency比較好連結

→

louis040703/16 21:58不過數位端的各種現象,不down到線路底層根本沒得討論

→

louis040703/16 21:59純data coding層面根本一堆玩意都是鬼扯

→

evadodoya03/16 22:06我就鬼扯(真的

推

lll156k152903/16 23:01訊號處理就很難一堆人愛直接拿資訊面的0101來講

是啊、所以我認為需要真正的 ABX 盲測有足夠正確的測試、充足的樣本來證實真能分辨出不同設定的差異與好壞（喜好如果沒、只是聽信他人言這樣設棒棒，不就只是隨波逐流嗎且如果真的能聽出差異，別人喜歡的一定是你喜歡的嗎？聲音這東西的好壞跟喜好不本就是各形各色嗎

→

evadodoya03/16 23:21不這樣子怎麼戰

推

lll156k152903/16 23:39的確是這樣才能戰XD 不然訊號與系統或訊號處理課大

→

lll156k152903/16 23:39部分人都是去被電的要戰三小XD

推

louis040703/17 08:06hi 簡單回一下，buffer大小當然是自己測過有效才會用，

→

louis040703/17 08:06記得比較清楚的是錄音介面的buffer，從預設512 samples

→

louis040703/17 08:06調到最低16 samples之類，但確實應該沒人會16 32 64 12

→

louis040703/17 08:068這樣試

推

louis040703/17 08:08另外我也同意人耳不是非常可靠，所以都是要找一些原則

→

louis040703/17 08:08出來，不然軟硬體設定多如牛毛，又藏著一堆改變非改善

→

louis040703/17 08:08的陷阱

推

louis040703/17 08:11另外針對人云亦云，其實也是在認同一些原則後，看人家

→

louis040703/17 08:11分享的東西你覺得值不值得試，因為有時候是單純不知道

→

louis040703/17 08:11可以這樣去動設定

推

louis040703/17 08:14最後每人喜好音色云云，我倒是覺得錄製階段有這回事，

→

louis040703/17 08:14那是藝術家的權利，但到了重播階段，改善與改變是不同

→

louis040703/17 08:14的兩回事，要能分辨需要累積聽感與對自然聲音的認知

推

f999903/17 09:23謝謝你的解釋, 可是我還是比較喜歡低Latency, 高bit rate

推

znew121903/17 16:10Buffer並非越小越好,最少要Payload Size的4倍

→

znew121903/17 16:13Payload Size又會影響Throughput,以8B/10B來計算

→

znew121903/17 16:14有25% overhead,Payload Size=256byte,throughput約92%

→

znew121903/17 16:15再加上Completion latency,Flow control update latency

→

znew121903/17 16:16另外像是BIOS中的CPU節能技術,會影響DMA讀寫

→

znew121903/17 16:17提高latency,這些設定是環環相扣

推

yuugen203/17 18:39這串太專業了，可以簡單說結論嗎

推

evadodoya03/17 18:56就其實還是回歸到自己最喜歡的聽感而已這些只是調整

→

evadodoya03/17 18:56參數之一供你玩

喜好這東西本就各形各色啦 NOS 這種嚴重失真的都會有些人覺得自然好聽了但設完是不是真能分辨就是另一回事了人耳不精準＆人腦是不可信的，換個盤子的顏色都會影響到味覺判斷了我並沒有想要戰什麼的意思，但沒有 ABX 就沒有真相只是走感覺流並不理性

→

evadodoya03/17 19:36唱一下莫文蔚的陰天一下

推

znew121903/17 21:05簡單說就是要依據worst-case來調整,就像船期最長間隔

→

znew121903/17 21:06會影響備貨數量,包裝大小也會影響,包裝大一個箱子能裝

→

znew121903/17 21:07的數量少,sample rate越高,Buffer也要越大

推

louis040703/17 21:44碎嘴一下，NOS也是有好處的，thd很差那是頻響域，對應

→

louis040703/17 21:44的時間域，NOS反倒表現的很好，而人耳比起頻響域，對

→

louis040703/17 21:44時間域反而更敏感

但 NOS 完全沒法重建原始 Audio 帶有大量的噪聲與失真及混疊，除了整體響度會下降且越往高頻越失真與衰減但有些人就喜歡失真跟討厭高頻啦XD Nyquist frequency 之所以能以離散數據重建 Audio 就是因為需要以正弦補值沒有 OS 以單單的 PCM 點所重建的階梯並不能說是完成了 DAC

→

justagame03/17 22:08ABX只能測聽不聽得出OS/NOS的差異阿

→

justagame03/17 22:08不能處理個體覺得哪一種好聽/哪個失真較高這類的問題

你熟的音樂不用 ABX 多半就能分辨 NOS 的聲音很特殊

推

breadf03/17 22:37應該用sync補吧XD

sinusoid 用 sinc 是因為計算問題啊如果有其它算法能補正弦波、沒震鈴又效能好那就發財了啊

→

justagame03/17 23:08OS跟NOS已經吵了很久啦我自己的DAC兩種都能切換

肥環燕瘦各有人愛啦但我舉 NOS 只是為了表示就訊號重建的角度 NOS 完全 OUT 以 Nyquist frequency 採樣的數據並沒有遵照 Nyquist frequency 重建

※ 編輯: Oswyn (220.129.177.54 臺灣), 03/17/2020 23:33:49