Questo sito utilizza cookie di terze parti per inviarti pubblicità in linea con le tue preferenze. Se vuoi saperne di più clicca QUI 
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie. OK

Valutazione della qualità audio percepita di segnali ricampionati

Questo elaborato si propone di contribuire al lavoro di valutazione oggettiva della qualità audio percepita relativa a formati compressi, e di stimare l’effetto del ricampionamento in tale ambito.
In particolare si cercherà di verificare quanto la modifica della frequenza di campionamento influisca sui test oggettivi conformi alla recommendation ITU-R BS.1387, utilizzati anche in altri studi.

Il metodo suggerito dall’ITU prevede infatti un’unica frequenza di campionamento a cui effettuare il test: 48000Hz. La maggior parte dei segnali di partenza utilizzati hanno invece una frequenza di campionamento di 44100Hz. E’ quindi necessario effettuare un ricampionamento per poter eseguire i confronti tra il segnale originale e le sue versioni compresse.
La valutazione verrà effettuata tramite Peaqevaludio, software sviluppato dall’università McGill conformemente alla recommendation e utilizzato in molti studi sulla valutazione della qualità audio percepita.

Nell’elaborato verrà spiegato il funzionamento dei test e verranno presentate alcune tecniche di ricampionamento. Si passerà poi alla definizione delle modalità di test, dai ricampionatori al trattamento dei segnali prima del test.

La scelta dei ricampionatori è caduta su 3 prodotti molto diversi tra loro come destinazione: un ricampionatore sviluppato da un’università (Resampaudio 2.0, sempre della McGill), uno incluso in un editor audio open source (Audacity 1.2.3) e un terzo facente parte di un sequencer a pagamento (Cool Edit Pro 3.0). Scopo dei test è anche stabilire quale dei tre ottiene risultati migliori per quanto riguarda la qualità audio percepita.

Sono state selezionate due modalità di test, definite Single Step e Transrating. La prima prevede la generazione o acquisizione di segnali a più frequenze di campionamento, ed un unico ricampionamento che le porti alla frequenza di test. La modalità Transrating parte da un singolo segnale a cui viene applicato un doppio ricampionamento per ognuna delle frequenze prese in esame.

Le frequenze di campionamento selezionate sono 10: 8000, 11025, 12000, 16000, 22050, 24000, 32000, 44100, 96000 e 192000Hz. Sono state scelte queste frequenze in quanto molto utilizzate nell’editing audio e nei formati compressi. Dai test ci si attende un calo della qualità audio sulle frequenze più basse dovuta alla perdita d’informazione frequenziale che consegue al sottocampionamento. Ci si attende inoltre risultati peggiori sulle frequenze di 44100, 22050 e 11025Hz, che non sono in rapporto diretto con la frequenza di test (48000hz).

Per i test sono stati selezionati 22 segnali, 16 naturali e 6 sintetici. I segnali ricampionati sono stati sottoposti al confronto con Peaqevalaudio 3 volte, con piccole differenze nel trattamento pre-test. Nel primo caso, non è stata apportata alcuna modifica; nel secondo test il numero di campioni dei segnali è stato portato in pari con il segnale di test; l’ultima modalità prevede l’eliminazione dei campioni iniziali e finali dei segnali di test e del segnale di riferimento.

In totale sono stati effettuati confronti su 102 gruppi di segnali ricampionati. I risultati sono stati recuperati ed elaborati tramite Matlab e Excel. In particolare sono stati presi in considerazione due dei parametri estratti da peaqevalaudio: l’ODG (Objective Difference Grade) che fornisce una valutazione riassuntiva della qualità audio percepita, e l’NMR (Noise to Mask Ratio) che stima il livello di rumore presente nel segnale rispetto alla soglia di mascheramento. Dai dati sono stati ricavati grafici che illustrano l’andamento dei due valori rispetto alle frequenze e ai ricampionatori.

I risultati ottenuti mostrano come tra i ricampionatori presi in esame Resampaudio rispetti maggiormente la qualità audio. I risultati medi del software della McGill sono infatti superiori su tutte le frequenze rispetto agli altri 2 resampler. Inoltre i valori alle frequenze più alte, e in particolare a 44100Hz, indicano una perdita minima di qualità audio, difficilmente percepibile all’orecchio. Il ricampionamento a tali frequenze dunque non apporta variazioni sensibili alla valutazione della qualità audio percepita.

Per quanto riguarda l’influenza delle frequenze di ricampionamento sulla qualità audio, si registrano come previsto valori peggiori di ODG e NMR alle frequenze più basse. Si evidenzia inoltre un degrado proporzionale maggiore alle frequenze di campionamento non compatibili con i 48000Hz, ovvero 44100 e sottomultiple. I dati raccolti portano a validare l’estensione dei test PEAQ, pensati per la codifica compressa dei segnali, alla valutazione dei ricampionatori.

Mostra/Nascondi contenuto.
1 Capitolo 1 Introduzione Questo elaborato si propone di contribuire al lavoro di valutazione oggettiva della qualità audio percepita relativa a formati compressi, e di stimare l’effetto del ricampionamento in tale ambito. Nei metodi più recenti per la valutazione della qualità audio sono stati introdotti molti parametri relativi alla percezione, ovvero a come il nostro orecchio elabora l’informazione sonora. Anche i formati compressi con perdita di informazione si basano su codifiche percettive, puntando ad eliminare ciò che l’uomo non può sentire. E’ giusto dunque andare ad analizzare la qualità sonora tenendo conto non tanto delle informazioni che vengono perdute o distorte dalla compressione, ma della loro influenza sulla percezione dei suoni. Il metodo di valutazione oggettivo utilizzato dai lavori presi in esame è quello specificato dalla recommendation ITU-R BS.1387[1], basato sull’analisi numerica dei segnali e l’estrazione di parametri percettivi. In base a tali parametri viene calcolato un punteggio riassuntivo, l’Objective Difference Grade (ODG). Tale valore dovrebbe riflettere la qualità audio percepita e coincidere con il risultato di eventuali test soggettivi sul segnale. La recommendation ITU purtroppo è in molti punti ambigua e incompleta, e questo comporta alcune imprecisioni e limitazioni. In particolare, il documento fornisce informazioni sulle modalità di test solo per segnali alla frequenza di 48000Hz. Il professor Kabal, dell’università McGill, ha proposto una revisione e un’interpretazione[2] dell’ITU-R BS.1387[1]; molte delle imprecisioni sono state risolte e i punti più ambigui specificati, ma è rimasta comunque un’unica frequenza possibile di test. Il lavoro del professor Kabal ha portato anche all’implementazione di un software che esegue il confronto tra 2 segnali, ne ricava i parametri percettivi specificati dall’ITU, e da essi estrae l’ODG. Questo programma, noto come Peaqevalaudio o PEAQ (Perceptual Evaluation of Audio Quality), accetta in input solo segnali campionati a 48000Hz. I segnali comunemente utilizzati per i test sulla qualità audio, e nello specifico per i formati compressi, sono per lo più in formato Cd Audio, che prevede una frequenza di campionamento di 44100Hz. Negli studi in esame, che utilizzano proprio Pqevalaudio per valutare la qualità audio percepita, si è reso necessario modificare la frequenza di campionamento per poter effettuare i test. Entra quindi in gioco un ricampionamento, ovvero una modifica del numero di campioni al secondo, che da 44100 devono essere portati a 48000. Questo elaborato si propone di andare a studiare il ricampionamento e la sua influenza sulla qualità audio percepita, per verificare quanto questo passaggio possa modificare i risultati dei test, e quale sia la modalità migliore di effettuarlo.

Laurea liv.I

Facoltà: Scienze Matematiche, Fisiche e Naturali

Autore: Michele Giacobazzi Contatta »

Composta da 148 pagine.

 

Questa tesi ha raggiunto 783 click dal 24/04/2009.

Disponibile in PDF, la consultazione è esclusivamente in formato digitale.