Questo sito utilizza cookie di terze parti per inviarti pubblicità in linea con le tue preferenze. Se vuoi saperne di più clicca QUI 
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie. OK

Link analysis algorithm per task di concept location: una validazione empirica

Tesi di Laurea Magistrale

Facoltà: Ingegneria

Autore: Daniele Pascale Contatta »

Composta da 72 pagine.

 

Questa tesi ha raggiunto 76 click dal 26/10/2016.

Disponibile in PDF, la consultazione è esclusivamente in formato digitale.

 

 

Estratto della Tesi di Daniele Pascale

Mostra/Nascondi contenuto.
Università degli studi della Basilicata A.A. 2013-2014 Corso di Laurea Magistrale in Ingegneria Informatica 5. Estrazione di dipendenze nel software. Il sistema software è rappresentato come un grafo orientato G = (V , E). V è l'insieme dei metodi nel sistema, mentre E è l'insieme di archi (coppie ordinate di vertici di V). Ciascun arco rappresenta una relazione orientata tra due metodi. Si è tenuto un approccio conservativo i questo approccio e si è considerato solo riferimenti diretti tra metodi. Vale a dire (m i , m j ) E, se c'è un ∈ riferimento al metodo m j nel corpo del metodo m i . Queste dipendenze sono state identificate utilizzando jRipples. 6. Clustering. Il grafo G è stato trasformato in un grafo pesato orientato G' = (V , E, ω). In particolare, la similarity lessicale (cosine similarity) tra due metodi m i e m j è utilizzata come peso (cioè ω(m i , m j )) dell'arco (se presente) tra i nodi corrispondenti a questi metodi. G' riassume sia le informazioni strutturali sia le informazioni lessicali di un sistema. Viene applicato al grafo G' l'algoritmo di clustering BorderFlow. L'algoritmo è un algoritmo di clustering su grafi con scopo generale. Può essere utilizzato per il soft clustering (un nodo di un grafo di input può essere in uno o più cluster) e per l'hard clustering (ogni nodo di un grafo di input può essere in un solo cluster). In CLC è stato utilizzato l'hard clustering. L'idea dietro BorderFlow è quella di massimizzare il flusso dal bordo di ciascun cluster ai nodi interni, mentre viene massimizzato il flusso dal cluster ai nodi fuori di esso. Perciò un cluster X è un sottoinsieme di V , in modo che il cluster massimizza il rapporto di border flow: F( X)= Ω(b(X), X) Ω(b( X), n( X)) dove b(X) è l'insieme dei nodi al confine di X, mentre n(X) è una 26
Estratto dalla tesi: Link analysis algorithm per task di concept location: una validazione empirica