We define a new class of random probability measures, approximating the well-known normalized generalized gamma (NGG) process. Our new process is defined from the representation of NGG processes as discrete measures where the weights are obtained by normalization of the jumps of a Poisson process, and the support consists of iid points, however considering only jumps larger than a thresh- old e . Therefore, the number of jumps of this new process, called e-NGG process, is a.s. finite. A prior distribution for e can be elicited. We will assume the e-NGG process as the mixing measure in a mixture model for density and cluster estima- tion. Moreover, a efficient Gibbs sampler scheme to simulate from the posterior is provided. Finally, the performance of our algorithm on the Galaxy dataset will be illustrated.
Introduciamo una nuova classe di misure di probabilit`a aleatorie che ap- prossimano il noto processo gamma generalizzata normalizzato (NGG). Il nuovo processo qui definito `e costruito a partire dalla rappresentazione del processo NGG come misura discreta, in cui i pesi sono ottenuti dalla normalizzazione dei punti di un processo di Poisson, e il cui supporto `e costituito da punti iid, ma considerando nella somma che definisce il nuovo processo solo salti pi`u grandi di una certa soglia e . Pertanto, questo processo `e una misura di probabilit`a aleatoria discreta con un numero finito (q.c.) di punti di supporto. Alla soglia e pu`o essere assegnata una prior. Considereremo tale nuovo processo come la misura integrale in un modello mistura per la stima di densit`a e l'analisi di cluster. Uno dei principali risultati di questo lavoro `e la costruzione di un algoritmo Gibbs sampler per simulare dalla posterior del modello considerato. Infine, illustreremo il nostro algoritmo utilizzando il dataset Galaxy.
A Bayesian nonparametric model for density and cluster estimation: the epsilon-NGG process mixture
R Argiento;I Bianchini;
2014
Abstract
We define a new class of random probability measures, approximating the well-known normalized generalized gamma (NGG) process. Our new process is defined from the representation of NGG processes as discrete measures where the weights are obtained by normalization of the jumps of a Poisson process, and the support consists of iid points, however considering only jumps larger than a thresh- old e . Therefore, the number of jumps of this new process, called e-NGG process, is a.s. finite. A prior distribution for e can be elicited. We will assume the e-NGG process as the mixing measure in a mixture model for density and cluster estima- tion. Moreover, a efficient Gibbs sampler scheme to simulate from the posterior is provided. Finally, the performance of our algorithm on the Galaxy dataset will be illustrated.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.