Skip to content

Classificazione della conoscenza sul web e modelli di ricerca e navigazione

Per parlare di classificazioni è necessario che il sistema preveda un forma di indicizzazione semantica = relativa al contenuto o al soggetto di ciò che si intende classificare.
Nel web si parla di classificazioni “faceted” quando posso accedere a una stessa risorsa da più categorie.
Che differenza con i database relazionali? Per definirsi tale, una classificazione deve riferirsi ad aspetti semantici degli oggetti classificati. Non sempre un database relazionale incarna un classificazione a faccette. Es. 1 )il primo caso non è descrittivo e si parla di caratteristiche fisiche del libro (titolo, editore, pagine); il secondo caso è descrittivo e si parla di aspetti semantici legati al contenuto del libro (argomento, attività, livello).
Abbiamo quindi:
- classificazioni a faccette pure: modelli che si rifanno alla teoria di Ranganathan o CRG con accesso mediante più faccette all’informazione-ordine conveniente di faccette - sistema di notazione appropriato;
- classificazioni a faccette spurie: modelli che si rifanno alla teoria delle faccette solo per quel che riguarda la logica pluridimensionale dell'accesso all’informazione.
- classificazioni apparenti: modelli di organizzazione delle informazioni di tipo relazionale che offrono accesso all’informazione mediante più parametri, di tipo descrittivo e non semantico.

Esempio del motore di ricerca Flamenco. Uno dei rischi di un motore di ricerca è la possibilità di estrarre risorse o documenti poco inerenti o non trovare nulla o capire male la relazione tra un item e item limitrofi. Per ovviare a questo problema servono le ontologie, ovvero sistemi che mettano in relazione tra loro i concetti. Ci permettono di associare concetti diversi. Nel sito Flamenco possiamo fare ricerche dirette o tramite una directory di link. Ogni ramo della directory è un descrittore semantico (una proprietà o un aspetto), ed è un percorso alternativo agli oggetti della collezione. Scelgo una voce nella directory, ma poi la ricerca si può raffinare utilizzando le altre faccette che appaiono con i risultati. Viene specificato l’intero percorso. La collocazione dei risultati non è spaziale in senso fisico ma semantico, ovvero il collocamento dell'oggetto è specificato nei termini di caratteristiche o relazioni semantiche che possiede rispetto ad altri elementi della collezione. Qui l’utente, insomma, può fare sia searching che browsing. Il sito Getty usa un sistema di metatadati per archiviare le immagini. Tale sistema si rifà alla classificazione a faccette. Il sistema contiene sia metadati descrittivi (relativi al soggetto) che semantici (relativi al contenuto dell'opera). Se cerco Lego ci viene chiesto se lo cerchiamo nel senso di autore (metadato descrittivo) o di contenuto di una foto (metadato semantico).
RDF come formato semantico per lo scambio dei dati.  Nei casi su analizzati la classificazione a faccette è applicata in forma spuria. È quello che molti definiscono logica multidimensionale, la possibilità di accedere a uno stesso item mediante percorsi alternativi, ciascuno rappresentante un aspetto o faccia dell’oggetto. Minor attenzione è dedicata agli schemi generali. La troviamo in FAKTS.

Circolarità dell'informazione

Comunque l’esigenza è quella di fornire al visitatore, una volta che abbia raggiunto un item, ulteriori spunti di navigazione e approfondimento tramite un meccanismo di collegamenti incrociati, che chiamiamo circolarità dell’informazione. Non sempre chi fa una ricerca vuole trovare un oggetto specifico, ma a volte vuole solo acquisire maggiore informazione su un dato argomento, o non sa bene cosa sta cercando. Così un sistema a faccette può suggerire item semanticamente vicini a quello corrente. Si parla di known-item seeking e exploratory seeking.

Satisfacing e accessibilità

Krug ci dice che in situazioni di stress o quando andiamo di fretta non compiamo scelte ottimali ma tendiamo a cavarcela: è il concetto di satisfacing. Cerchiamo conoscenza (= informazione messa in relazione con altre conoscenze), non informazione, ma occorre che l’informazione sia reperibile e fruibile.
È il concetto di accessibilità. Ma a che vale accedere se poi non trovo? Quindi l’accessibilità non è garanzia di accessibilità reale, ha a che fare con la semantica, con la fruibilità delle informazioni a tutti i livelli. È necessario fornire al navigatore anche indicatori logico-semantici che lo aiutino nel percorso e nei processi decisionali. Parliamo qui di raccolta delle bacche e profumo dell’informazione.

Raccolta delle bacche e profumo dell'informazione

Marcia Bates usa il modello della raccolta delle bacche per parlare di come cerchiamo informazioni nel web. L’utente inizia con un termine generico, poi procede esaminando molte risorse, ed ogni nuova informazione gli suggerisce altre idee e percorsi (berrypicking model). Questa cosa si lega al paradigma di Pirolli del profumo dell’informazione: operando diverse cernite tra i link da cliccare, l’utente realizza una sorta di mappatura astratta e personale dell’ipertesto, facendosi una vaga idea del contesto in cui si muove. L’information scent si riferisce agli indicatori locali che il fruitore usa per anticipare le pagine successive nella sua mente (come l’animale che decide dove dirigersi in base agli odori nell'ambiente).
Mancanza di information scent (ossia intuire che il sito ci condurrà a qualcosa di buono) può indurre a lasciare il sito. Per Krug è importante che i click dell’utente siano spensierati. I siti su analizzati, comunque, favoriscono un modello berrypicking e consentono di muoversi in più direzioni nel sito, diffondendo anche information scent.

La navigazione degli utenti sul web

La classificazione a faccette serve a classificare/integrare oggetti di una collezione. Ma è diversa dalla navigazione. La navigazione può mantenere un impianto tassonomico gerarchico e le faccette essere usate solo per correlare gli item (circolarità dell’informazione). Anche la sezione di Google gruppi ibrida un sistema di classificazione gerarchico-enumerativo con un sistema a faccette. Essi usano un modello a directory tradizionale per il primo livello del sito, mentre usano un modello spurio a faccette per il secondo livello. Nel primo livello gli oggetti sono eterogenei, nel secondo omogenei. La classificazione a faccette si presta bene a collezione di oggetti omogenei. Poi si tiene conto dei modelli mentali degli utenti, conservando ad impatto un’impostazione alla Yahoo!

Molte realtà software oggi si stanno muovendo verso approcci analitico-sintetici. Come Windows Vista o il pacchetto iLife di Apple. iLife abolisce la logica gerarchica di cartelle per archiviare i file, preferendo un logica semantico-relazionale. Le risorse sono così delocalizzate: i files si possono recuperare indipendentemente dalla collocazione fisica. Scompare l’idea di cartella, rimpiazzata da quella di raggruppamento logico o semantico. Sfuma così la distinzione tra searching e browsing, tra interfaccia software e interfaccia web. In Windows Vista al concetto di cartella (raggruppamento di item) si sostituisce quello di cartella virtuale, che corrisponde a un processo di sintesi. Essa rappresenta una query eseguita su tutte le risorse del sistema che restituisce gli item che corrispondono a certi parametri. Una stessa risorsa si può dunque recuperare da percorsi differenti e comparire in più cartelle virtuali.

Tratto da ORGANIZZARE LA CONOSCENZA di Dario Gemini
Valuta questi appunti:

Continua a leggere:

Dettagli appunto:

Altri appunti correlati:

Per approfondire questo argomento, consulta le Tesi:

Puoi scaricare gratuitamente questo appunto in versione integrale.