Valutazione della qualità audio percepita di segnali ricampionati

Michele Giacobazzi

Valutazione della qualità audio percepita di segnali ricampionati

Questo elaborato si propone di contribuire al lavoro di valutazione oggettiva della qualità audio percepita relativa a formati compressi, e di stimare l’effetto del ricampionamento in tale ambito.
In particolare si cercherà di verificare quanto la modifica della frequenza di campionamento influisca sui test oggettivi conformi alla recommendation ITU-R BS.1387, utilizzati anche in altri studi.

Il metodo suggerito dall’ITU prevede infatti un’unica frequenza di campionamento a cui effettuare il test: 48000Hz. La maggior parte dei segnali di partenza utilizzati hanno invece una frequenza di campionamento di 44100Hz. E’ quindi necessario effettuare un ricampionamento per poter eseguire i confronti tra il segnale originale e le sue versioni compresse.
La valutazione verrà effettuata tramite Peaqevaludio, software sviluppato dall’università McGill conformemente alla recommendation e utilizzato in molti studi sulla valutazione della qualità audio percepita.

Nell’elaborato verrà spiegato il funzionamento dei test e verranno presentate alcune tecniche di ricampionamento. Si passerà poi alla definizione delle modalità di test, dai ricampionatori al trattamento dei segnali prima del test.

La scelta dei ricampionatori è caduta su 3 prodotti molto diversi tra loro come destinazione: un ricampionatore sviluppato da un’università (Resampaudio 2.0, sempre della McGill), uno incluso in un editor audio open source (Audacity 1.2.3) e un terzo facente parte di un sequencer a pagamento (Cool Edit Pro 3.0). Scopo dei test è anche stabilire quale dei tre ottiene risultati migliori per quanto riguarda la qualità audio percepita.

Sono state selezionate due modalità di test, definite Single Step e Transrating. La prima prevede la generazione o acquisizione di segnali a più frequenze di campionamento, ed un unico ricampionamento che le porti alla frequenza di test. La modalità Transrating parte da un singolo segnale a cui viene applicato un doppio ricampionamento per ognuna delle frequenze prese in esame.

Le frequenze di campionamento selezionate sono 10: 8000, 11025, 12000, 16000, 22050, 24000, 32000, 44100, 96000 e 192000Hz. Sono state scelte queste frequenze in quanto molto utilizzate nell’editing audio e nei formati compressi. Dai test ci si attende un calo della qualità audio sulle frequenze più basse dovuta alla perdita d’informazione frequenziale che consegue al sottocampionamento. Ci si attende inoltre risultati peggiori sulle frequenze di 44100, 22050 e 11025Hz, che non sono in rapporto diretto con la frequenza di test (48000hz).

Per i test sono stati selezionati 22 segnali, 16 naturali e 6 sintetici. I segnali ricampionati sono stati sottoposti al confronto con Peaqevalaudio 3 volte, con piccole differenze nel trattamento pre-test. Nel primo caso, non è stata apportata alcuna modifica; nel secondo test il numero di campioni dei segnali è stato portato in pari con il segnale di test; l’ultima modalità prevede l’eliminazione dei campioni iniziali e finali dei segnali di test e del segnale di riferimento.

In totale sono stati effettuati confronti su 102 gruppi di segnali ricampionati. I risultati sono stati recuperati ed elaborati tramite Matlab e Excel. In particolare sono stati presi in considerazione due dei parametri estratti da peaqevalaudio: l’ODG (Objective Difference Grade) che fornisce una valutazione riassuntiva della qualità audio percepita, e l’NMR (Noise to Mask Ratio) che stima il livello di rumore presente nel segnale rispetto alla soglia di mascheramento. Dai dati sono stati ricavati grafici che illustrano l’andamento dei due valori rispetto alle frequenze e ai ricampionatori.

I risultati ottenuti mostrano come tra i ricampionatori presi in esame Resampaudio rispetti maggiormente la qualità audio. I risultati medi del software della McGill sono infatti superiori su tutte le frequenze rispetto agli altri 2 resampler. Inoltre i valori alle frequenze più alte, e in particolare a 44100Hz, indicano una perdita minima di qualità audio, difficilmente percepibile all’orecchio. Il ricampionamento a tali frequenze dunque non apporta variazioni sensibili alla valutazione della qualità audio percepita.

Per quanto riguarda l’influenza delle frequenze di ricampionamento sulla qualità audio, si registrano come previsto valori peggiori di ODG e NMR alle frequenze più basse. Si evidenzia inoltre un degrado proporzionale maggiore alle frequenze di campionamento non compatibili con i 48000Hz, ovvero 44100 e sottomultiple. I dati raccolti portano a validare l’estensione dei test PEAQ, pensati per la codifica compressa dei segnali, alla valutazione dei ricampionatori.

CONSULTA INTEGRALMENTE QUESTA TESI

La consultazione è esclusivamente in formato digitale .PDF

Acquista

Anteprima Indice Bibliografia

Mostra/Nascondi contenuto.

1 Capitolo 1 Introduzione Questo elaborato si propone di contribuire al lavoro di valutazione oggettiva della qualità audio percepita relativa a formati compressi, e di stimare l’effetto del ricampionamento in tale ambito. Nei metodi più recenti per la valutazione della qualità audio sono stati introdotti molti parametri relativi alla percezione, ovvero a come il nostro orecchio elabora l’informazione sonora. Anche i formati compressi con perdita di informazione si basano su codifiche percettive, puntando ad eliminare ciò che l’uomo non può sentire. E’ giusto dunque andare ad analizzare la qualità sonora tenendo conto non tanto delle informazioni che vengono perdute o distorte dalla compressione, ma della loro influenza sulla percezione dei suoni. Il metodo di valutazione oggettivo utilizzato dai lavori presi in esame è quello specificato dalla recommendation ITU-R BS.1387[1], basato sull’analisi numerica dei segnali e l’estrazione di parametri percettivi. In base a tali parametri viene calcolato un punteggio riassuntivo, l’Objective Difference Grade (ODG). Tale valore dovrebbe riflettere la qualità audio percepita e coincidere con il risultato di eventuali test soggettivi sul segnale. La recommendation ITU purtroppo è in molti punti ambigua e incompleta, e questo comporta alcune imprecisioni e limitazioni. In particolare, il documento fornisce informazioni sulle modalità di test solo per segnali alla frequenza di 48000Hz. Il professor Kabal, dell’università McGill, ha proposto una revisione e un’interpretazione[2] dell’ITU-R BS.1387[1]; molte delle imprecisioni sono state risolte e i punti più ambigui specificati, ma è rimasta comunque un’unica frequenza possibile di test. Il lavoro del professor Kabal ha portato anche all’implementazione di un software che esegue il confronto tra 2 segnali, ne ricava i parametri percettivi specificati dall’ITU, e da essi estrae l’ODG. Questo programma, noto come Peaqevalaudio o PEAQ (Perceptual Evaluation of Audio Quality), accetta in input solo segnali campionati a 48000Hz. I segnali comunemente utilizzati per i test sulla qualità audio, e nello specifico per i formati compressi, sono per lo più in formato Cd Audio, che prevede una frequenza di campionamento di 44100Hz. Negli studi in esame, che utilizzano proprio Pqevalaudio per valutare la qualità audio percepita, si è reso necessario modificare la frequenza di campionamento per poter effettuare i test. Entra quindi in gioco un ricampionamento, ovvero una modifica del numero di campioni al secondo, che da 44100 devono essere portati a 48000. Questo elaborato si propone di andare a studiare il ricampionamento e la sua influenza sulla qualità audio percepita, per verificare quanto questo passaggio possa modificare i risultati dei test, e quale sia la modalità migliore di effettuarlo.

CONSULTA INTEGRALMENTE QUESTA TESI

La consultazione è esclusivamente in formato digitale .PDF

Acquista

Il miglior software antiplagio

L'unico servizio antiplagio competitivo nel prezzo che garantisce l'aiuto della nostra redazione nel controllo dei risultati.
Analisi sicura e anonima al 100%!
Ottieni un Certificato Antiplagio dopo la valutazione.

Informazioni tesi

Autore:	Michele Giacobazzi
Tipo:	Laurea I ciclo (triennale)
Anno:	2005-06
Università:	Università degli Studi di Milano
Facoltà:	Scienze Matematiche, Fisiche e Naturali
Corso:	Scienze e tecnologie della comunicazione Musicale
Relatore:	Goffredo Haus
Lingua:	Italiano
Num. pagine:	148

Forse potrebbe interessarti la tesi:

Studio della percezione musicale in rapporto al supporto fonografico utilizzato

Lo studio della qualità dei supporti audio di consumo entro una certa fascia temporale può fornire dati significativi riguardo l'evoluzione delle abitudini di ascolto. Ogni supporto audio evidenzia o attenua un certo numero di attributi qualitativi, andando a influenzare la percezione musicale. Negli ultimi decenni si sono registrate successivamente l'affermazione di alcuni formati analogici (LP, 45 giri e...

FAQ

Come consultare una tesi

Per consultare la tesi è necessario essere registrati e acquistare la consultazione integrale del file, al costo di 29,89€.
Il pagamento può essere effettuato tramite carta di credito/carta prepagata, PayPal, bonifico bancario.
Confermato il pagamento si potrà consultare i file esclusivamente in formato .PDF accedendo alla propria Home Personale. Si potrà quindi procedere a salvare o stampare il file.
Maggiori informazioni

Perché consultare una tesi?

Ingiustamente snobbata durante le ricerche bibliografiche, una tesi di laurea si rivela decisamente utile:

perché affronta un singolo argomento in modo sintetico e specifico come altri testi non fanno;
perché è un lavoro originale che si basa su una ricerca bibliografica accurata;
perché, a differenza di altri materiali che puoi reperire online, una tesi di laurea è stata verificata da un docente universitario e dalla commissione in sede d'esame. La nostra redazione inoltre controlla prima della pubblicazione la completezza dei materiali e, dal 2009, anche l'originalità della tesi attraverso il software antiplagio Compilatio.net.

Clausole di consultazione

L'utilizzo della consultazione integrale della tesi da parte dell'Utente che ne acquista il diritto è da considerarsi esclusivamente privato.
Nel caso in cui l’utente che consulta la tesi volesse citarne alcune parti, dovrà inserire correttamente la fonte, come si cita un qualsiasi altro testo di riferimento bibliografico.
L'Utente è l'unico ed esclusivo responsabile del materiale di cui acquista il diritto alla consultazione. Si impegna a non divulgare a mezzo stampa, editoria in genere, televisione, radio, Internet e/o qualsiasi altro mezzo divulgativo esistente o che venisse inventato, il contenuto della tesi che consulta o stralci della medesima. Verrà perseguito legalmente nel caso di riproduzione totale e/o parziale su qualsiasi mezzo e/o su qualsiasi supporto, nel caso di divulgazione nonché nel caso di ricavo economico derivante dallo sfruttamento del diritto acquisito.

Vuoi tradurre questa tesi?

L'obiettivo di Tesionline è quello di rendere accessibile a una platea il più possibile vasta il patrimonio di cultura e conoscenza contenuto nelle tesi.
Per raggiungerlo, è fondamentale superare la barriera rappresentata dalla lingua. Ecco perché cerchiamo persone disponibili ad effettuare la traduzione delle tesi pubblicate nel nostro sito.
Per tradurre questa tesi clicca qui »
Scopri come funziona »

DUBBI? Contattaci

Contatta la redazione a
[email protected]

Ci trovi su Skype (redazione_tesi)
dalle 9:00 alle 13:00

Oppure vieni a trovarci su

Parole chiave

audio

campionamento

formati compressi

mp3

musica

nmr

odg

peaq

qualità audio

ricampionamento

segnali audio

test oggettivi

valutazione

Tesi correlate

Non hai trovato quello che cercavi?

Abbiamo più di 45.000 Tesi di Laurea: cerca nel nostro database

Oppure consulta la sezione dedicata ad appunti universitari selezionati e pubblicati dalla nostra redazione

Ottimizza la tua ricerca:

individua con precisione le parole chiave specifiche della tua ricerca
elimina i termini non significativi (aggettivi, articoli, avverbi...)
se non hai risultati amplia la ricerca con termini via via più generici (ad esempio da "anziano oncologico" a "paziente oncologico")
utilizza la ricerca avanzata
utilizza gli operatori booleani (and, or, "")

Idee per la tesi?

Scopri le migliori tesi scelte da noi sugli argomenti recenti

Come si scrive una tesi di laurea?

A quale cattedra chiedere la tesi? Quale sarà il docente più disponibile? Quale l'argomento più interessante per me? ...e quale quello più interessante per il mondo del lavoro?

Scarica gratuitamente la nostra guida "Come si scrive una tesi di laurea" e iscriviti alla newsletter per ricevere consigli e materiale utile.

Leggi la guida

La tesi l'ho già scritta,
ora cosa ne faccio?

La tua tesi ti ha aiutato ad ottenere quel sudato titolo di studio, ma può darti molto di più: ti differenzia dai tuoi colleghi universitari, mostra i tuoi interessi ed è un lavoro di ricerca unico, che può essere utile anche ad altri.

Il nostro consiglio è di non sprecare tutto questo lavoro:

È ora di pubblicare la tesi

Scopri di più

Chi siamo

Contattaci

Valutazione della qualità audio percepita di segnali ricampionati

CONSULTA INTEGRALMENTE QUESTA TESI

La consultazione è esclusivamente in formato digitale .PDF

CONSULTA INTEGRALMENTE QUESTA TESI

La consultazione è esclusivamente in formato digitale .PDF

Informazioni tesi

Forse potrebbe interessarti la tesi:

Studio della percezione musicale in rapporto al supporto fonografico utilizzato

FAQ

Come consultare una tesi

Perché consultare una tesi?

Clausole di consultazione

Vuoi tradurre questa tesi?

DUBBI? Contattaci

Parole chiave

Tesi correlate

Non hai trovato quello che cercavi?

Ottimizza la tua ricerca:

Idee per la tesi?

Come si scrive una tesi di laurea?

La tesi l'ho già scritta,ora cosa ne faccio?

Login

La tesi l'ho già scritta,
ora cosa ne faccio?