High bitrate audio är overkill: CD-kvaliteten är fortfarande bra

alla vill ha bra ljud, men ibland leder våra uppdrag för förbättring oss ner några riktigt mörka och… dumma… korridorer. Som det är med många discipliner, med musik går lite kunskap långt. Du kanske har sett diskussion online kring bitdjup och samplingsfrekvenser, men vad du förmodligen inte vet är att det inte finns någon magisk inställning som får allt att låta bättre. Det beror på att digital musik som den är idag redan har lämnat våra perceptuella gränser i backspegeln. Du behöver inte galna filer av hög kvalitet om du inte skapar musik som behöver tung redigering.

medan jag inte är främmande för att leverera dåliga nyheter, som någon bra journalist visar jag mina bevis. Sanningen är att människor bara inte kan uppfatta skillnaden mellan filer vid en viss punkt, och du borde inte sugas in i marknadsföringshype om det är dyrare än vad du redan har. Medan jag inte tvivlar på att format som MQA är tekniskt imponerande, kommer de flesta inte riktigt att kunna uppskatta den ökade trovärdigheten. Chansen är nära 100% att ditt nuvarande bibliotek är helt bra.

du behöver bara en samplingsfrekvens på 44,1 kHz

Om du har tittat på din musikspelares informationsflik kanske du märker att några av dina låtar har samplingsfrekvenser på 44,1 kHz eller 48 kHz. Du kanske också märker att din DAC eller en telefon som LG V30 stöder filer med samplingsfrekvenser upp till 384kHz.

det är overkill. Ingen på Guds gröna jord kommer att veta eller bry sig om skillnaden eftersom våra öron bara inte är så känsliga. Tror du mig inte? Det är dags för lite matte. För att förstå vad gränsen för mänsklig uppfattning är för samplingsfrekvenser måste vi identifiera tre saker:

  1. gränsen för frekvenser som du kan höra
  2. Vad är den minsta samplingsfrekvens som behövs för att möta det intervallet (2 x högsta ljudfrekvens i Hz)
  3. överskrider samplingsfrekvensen för dina musikfiler det numret?

låter enkelt nog, och det är. Det vanligaste utbudet av mänsklig hörsel toppar ut på cirka 20 kHz, vilket är 20 000 perioder per sekund. För argumentets skull, låt oss utöka det intervallet till de översta gränserna för vad vi vet är möjligt: 22 KHz. Om du vill kolla in gränserna för din hörsel, använd det här verktyget för att hitta de övre gränserna för din uppfattning. Se bara till att du inte ställer in volymen för högt innan du gör det. Om du är över 20, bör det numret vara ungefär 16-17khz, lägre om du är över 30, och så vidare.

om din hörsel inte kan nå något högre än 22.05khz, då kan 44.1 kHz-filen lösa upp frekvensområdet du kan höra.

med Nyquist-Shannon samplingsteorem vet vi att en samplingsfrekvens som ger två prover per period är tillräcklig för att reproducera en signal (i detta fall din musik). 2 x 22 000 = 44 000, eller strax under de 44 100 proverna per sekund som erbjuds av en samplingsfrekvens på 44,1 kHz. Allt över det numret kommer inte att erbjuda dig mycket förbättring eftersom du helt enkelt inte kan höra frekvenserna som en ökad samplingsfrekvens skulle låsa upp för dig.

varje samplingsfrekvens som överstiger två gånger frekvensen kommer att representeras perfekt (ovan). Det är bara när samplingsfrekvensen sjunker under den punkten där problem uppstår (nedan).

dessutom minskar frekvenserna du hör i högsta änden med tiden när du åldras, får öroninfektioner eller utsätts för höga ljud. Till exempel kan jag inte höra något över 16 kHz. Det är därför för äldre öron, musik har mindre hörbar distorsion om du använder ett lågpassfilter för att bli av med ljud som du inte kan höra-det kommer att göra ditt musikljud bättre även om det inte är tekniskt lika ”high—def” som originalfilen. Om din hörsel inte kan nå något högre än 22,05 kHz, kan 44,1 kHz-filen enkelt lösa upp frekvensområdet du kan höra.

16-bitars ljud är bra för alla

den andra ljudkvalitetsmyten är att 24-bitars ljud kommer att låsa upp någon form av audiofil nirvana eftersom det är så mycket mer datatät, men när det gäller perceptuellt ljud kommer någon förbättring att gå förlorad på mänskliga öron. Att fånga mer data per prov har fördelar för dynamiskt intervall, men fördelarna är ganska mycket uteslutande inom inspelningsområdet.

Även om det är sant att en 24-bitars fil kommer att ha mycket mer dynamiskt område än en 16-bitars fil, är 144db dynamiskt område tillräckligt för att lösa en mygga bredvid en Saturn V-raketlansering. Medan det är allt bra och bra, kan dina öron inte höra den skillnaden i ljud på grund av ett fenomen som kallas auditiv maskering. Din fysiologi gör tystare ljud dämpade av högre ljud, och ju närmare de är i frekvens till varandra: ju mer de maskeras ut av din hjärna. Med förbättringar som dithering kan 16-bitars ljud ”bara” lösa ovannämnda mygga bredvid en 120dB jetmotor start. Fortfarande dramatisk overkill.

Så här ser en 24-bitars musikfil ut innan data tas bort. Frekvensen är Y-axeln, tiden är X-axeln och intensiteten är färg.

det är dock tystare ljud som många ljudfiler hävdar är den stora skillnaden, och det är delvis sant. Med ett bredare dynamiskt intervall kan du till exempel höja volymen längre utan att höja hörbart ljud, och det är den stora stickpunkten här. Där 24 och till och med 32-bitars filer har sin plats i mixing booth, erbjuder de någon fördel för MP3 -, FLAC-eller OGG-filer?

Hej barn, prova det här hemma!

medan min kollega Rob på Android Authority redan bevisat detta med ett oscilloskop och lite hardcore forskning, kommer vi att utföra ett experiment som du kan göra själv—eller bara läsa om du inte har något emot spoilers. Efter skurning på webben hittade jag ett par filer på Bandcamp som faktiskt släpptes i 24-bitars förlustfria filer. Många av de som jag hittade på påstådda ”HD Audio”-webbplatser var helt enkelt uppkonverterade från 16-bitars, vilket betyder att de var identiska på alla sätt men Pris. Därefter följde jag denna procedur:

  1. gör en kopia av den ursprungliga 24-bitarsfilen
  2. Öppna i ditt val av ljudredigeringsprogram (jag föreslår Audacity) och invertera filen; Spara som 16-bit/44.1 kHz WAV
  3. öppna både den överordnade filen och din nyligen redigerade fil och exportera den som ett spår
  4. öppna det blandade spåret i vilket program som helst som låter dig se vad som kallas ett spektrogram
  5. fniss för dig själv att spendera mycket pengar på hi-res audio

i huvudsak vad vi just gjorde här är att ta en 96kHz/24-bitars fil och sedan subtrahera all data som du kan höra i en cd-kvalitetsversion av sig själv. Vad som finns kvar är skillnaden mellan de två! Detta är exakt samma princip som aktiv brusreducering bygger på. Detta är resultatet jag fick:

medan de små lila bitarna är synliga i spektrogrammet, ligger de långt under tröskeln för hörbarhet i närvaro av musik.

Okej, så det är lite skillnad i de översta delarna av filen, men det ligger utanför intervallet för mänsklig hörsel. Faktiskt, du borde nog bara filtrera bort det ändå. Så låt oss visa vad en människa faktiskt kan höra genom att tillämpa ett lågt pass på 20kHz bara för att täcka våra baser. Et voila: en sista topp på … – 85dB i bästa fall. Okej, vi är ganska skirting kanterna av hörbarhet här, men här är problemet—för att faktiskt höra någon av dessa extra data måste du:

  1. lyssna på musik på en nivå som är osäker att lyssna på i mer än 1 minut (96+dB)
  2. har mikrofoner för öron

medan den sista punkten kan tyckas lite snarky, vet vi att din hjärna filtrerar bort ljud som är nära i frekvens till varje Övrigt (se: auditiv maskering, länkad ovan). Så när du lyssnar på musik hör du faktiskt inte allt ljud på en gång, du hör bara vad din hjärna har separerat åt dig. Så för att höra skillnaden mellan 24-bitars/96kHz-filer och CD-kvalitetsljud: de enskilda ljuden kan bara uppta ett mycket smalt frekvensområde, vara mycket högt och de andra anteckningarna som förekommer under samma tidsperiod måste variera långt ifrån varandra när det gäller frekvens.

det finns ingen säker lyssningsnivå för att höra skillnaden mellan dessa filer.

Om vi har lärt oss något från denna Yanny/Laurel fiasko passar en mänsklig röst inte dessa kriterier (Redaktörens anmärkning: Det är”Laurel”). Så verkligen, de mest troliga platserna du faktiskt skulle kunna höra skillnaderna mellan de två är i lågfrekventa anteckningar med något dämpade övertoner. Men det finns en fångst: människor är riktigt dåliga på att höra lågfrekventa ljud. För att höra dessa anteckningar med samma ljudstyrka till högre frekvensnoteringar behöver du var som helst från 10 till 40 dB extra kraft. Så dessa toppar på-87dB i intervall från 20-90Hz kan lika gärna vara -97 till-127db, vilket ligger utanför området för mänsklig hörsel. Det finns ingen säker lyssningsnivå för att höra skillnaden mellan dessa filer.

coolt, va? Det är alltid bra att veta att någon som kommer och berättar att din musiksamling måste köpas igen eftersom den inte är ”high-def” nog är bevisligen fel. Om du är en spirande audiofil är det du behöver ta bort från detta att koppla av: Vi är i en guldålder av ljud här—CD-kvalitet är mer än bra nog, bara njut av din musik! Medan vissa kan söka ljud av högre kvalitet är det inte nödvändigt om allt du vill göra är att lyssna på bra musik.

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *