La diffusione di Internet e dei social network ha rivoluzionato la società moderna, creando una sovrastruttura virtuale della vita reale nella quale gli individui risultano interconnessi. Una sorta di nonluogo (Augé, 1993), caratterizzato dalla concezione hic et nunc, che annulla le distanze fisiche creando uno spazio di interazione virtuale, fatto di scambi frenetici e relazioni fluide (Bauman, 2012). La vita di tutti i giorni è ormai condizionata dall’essere sempre presenti online, dalla disponibilità di reti wi-fi e dalla continua interazione sui social network in cui si è coinvolti. Ogni individuo ha la possibilità di gestire le proprie relazioni con gli altri attraverso l’utilizzo del computer o dello smartphone, in tempo reale e a costo zero, e mediante tutta una serie di strumenti di comunicazione, quali chat, blog, email, forum e social network. La tecnologia e gli automatismi a essa connessi sono diventati parte integrante della quotidianità dell’essere umano. L’avvento dei social network, primo fra tutti Facebook, ha non solo annullato i limiti spaziali, ma ha contribuito sensibilmente all’aumento della velocità della comunicazione, dello scambio di informazioni e della condivisione di notizie, di contatti, di foto, di video, di messaggi. In altre parole, grazie a questo vastissimo intreccio di reti sociali virtuali, le informazioni viaggiano a ritmi sostenuti, le idee si diffondono rapidamente e altrettanto velocemente subiscono modifiche. Se, da un lato, le nuove tecnologie digitali, i motori di ricerca, la diffusione di Internet e i social network hanno avuto un fortissimo impatto sulla vita di tutti i giorni nel modo di relazionarsi e di comunicare degli individui, rendendo i rapporti umani sempre più intangibili, dall’altro lato, la loro diffusione ha reso disponibile una grande mole di dati da analizzare. In particolare, si parla di Big Data (Kshetri, 2014; Kitchin, 2014a; 2014b) facendo riferimento all’immensa quantità di dati, strutturati e non, generati dagli utenti del Web quotidianamente (attraverso gli aggiornamenti di status su Facebook, i tweet postati su Twitter, le foto e i video inseriti su Instagram e YouTube, gli spostamenti registrati da sistemi di geolocalizzazione, gli acquisti fatti su Amazon ecc.) e archiviati in database di grandi dimensioni. I Big Data, e nello specifico i Social Big Data basati sull’analisi di una vasta gamma di dati provenienti da molteplici fonti ma con un forte focus sui social media (Bello-Orgaz et al., 2016), diventano la sfida metodologica dei ricercatori impegnati nello sviluppo della Computational Social Science (Lazer et al., 2009; McFarland et al., 2016) e, nello specifico, della Sociologia digitale (Lupton, 2014; Marres, 2017), alla ricerca della cassetta degli attrezzi adatti a rilevare i dati dal Web (Corposanto e Molinari, 2015), limitando le distorsioni metodologiche (Tufekci, 2014) del loro utilizzo nella ricerca sociale e i rischi nella qualità del dato rilevato (Lombi, 2015). Gli spazi digitali, in cui lo scambio di informazioni avviene tra più attori che si connettono per effetto dei messaggi scambiati direttamente o per gli spazi che condividono attraverso l’utilizzo di keyword comuni, sono attivi produttori di dati e il dato relazionale è, certamente, una delle tipologie di informazioni più diffuse. A differenza dei dati attributo, considerati come proprietà dei singoli individui, i dati relazionali si riferiscono ai contatti, agli scambi, ai vincoli, ai collegamenti, alle appartenenze, agli incontri di gruppo (Wasserman e Faust, 1994; Chiesi, 1999; Salvini, 2007; Scott, 2017). In altre parole, tutto ciò che mette in relazione coppie di attori può generare un dato relazionale. Pertanto, non è possibile ridurre le relazioni alle proprietà dei singoli attori, ma esse si configurano come proprietà di un più ampio sistema relazionale, come, per esempio, una conversazione tra utenti che interagiscono su un social network, nel quale le relazioni sono espresse mediante i legami che intercorrono tra gli attori stessi. La quantità di dati relazionali che è possibile estrarre oggi dal Web è aumentata in modo esponenziale. Le azioni di ogni singolo individuo su Internet lasciano, infatti, una traccia digitale, siano esse un semplice scambio di email, un commento a un post su Facebook, un tweet, l’utilizzo degli hashtag, la condivisione di un link, una recensione su TripAdvisor, il commento su un blog, un acquisto online, una ricerca effettuata su un motore di ricerca e così via. Alcune di queste tracce digitali contribuiscono alla creazione di strutture reticolari. Dai vari tipi di dati estratti online derivano differenti tipologie di reti: reti di utenti, reti di parole, reti di hashtag, e così via. Questi rappresentano solo degli esempi delle tipologie di rete che è possibile definire a partire da tali tracce digitali lasciate dagli individui sul Web. Per analizzare reti generate dall’estrazione di informazioni online, i metodi tradizionali di rilevazione e analisi dei dati risultano essere non adatti. Essi si limitano a descrivere le caratteristiche degli attori che entrano a far parte di tali strutture, ma non trattano in modo adeguato il dato relazionale, tipico di una struttura di rete. In tale contesto, i metodi della prospettiva metodologica della Social Network Analysis (SNA, Wasserman e Faust, op. cit.) permettono di dare una prima lettura della struttura delle interazioni mediante la visualizzazione dei reticoli con grafi e la costruzione di indici di centralità (Freeman, 1979) che descrivono la posizione dell’attore nella rete. Mediante l’utilizzo di software specifici (Csardi e Nepusz, 2006; Butts, 2008), è possibile visualizzare e descrivere enormi quantità di dati relazionali estratti dal Web, evidenziando l’evoluzione delle relazioni nel tempo così da poter studiare i cambiamenti in termini di ruolo e posizione degli attori in essa. Il presente capitolo, dopo una breve descrizione dei concetti di Social Big Data, social media e social network (paragrafo 2), illustra le possibilità di estrazione dei dati relazionali dal Web e le differenti tipologie di dato relazionale, la loro organizzazione in matrici di dati e l’analisi condotta grazie all’utilizzo della prospettiva metodologica della Social Network Analysis, definendo a livello esplorativo indici di centralità e algoritmi di community detection per l’individuazione, da un lato, degli attori centrali e, dall’altro, di gruppi di attori per lo studio dei dati estratti dal Web, con particolare attenzione agli strumenti di visualizzazione del reticolo (paragrafo 2.1). Il paragrafo 3 presenta un’applicazione su dati relazionali estratti da Twitter con una breve guida all’utilizzo del software Gephi per visualizzare “reti di parole”. Il paragrafo 4 fornisce brevi note conclusive.

Social Big Data e Network Analysis Tools

Ilaria Primerano;
2020

Abstract

La diffusione di Internet e dei social network ha rivoluzionato la società moderna, creando una sovrastruttura virtuale della vita reale nella quale gli individui risultano interconnessi. Una sorta di nonluogo (Augé, 1993), caratterizzato dalla concezione hic et nunc, che annulla le distanze fisiche creando uno spazio di interazione virtuale, fatto di scambi frenetici e relazioni fluide (Bauman, 2012). La vita di tutti i giorni è ormai condizionata dall’essere sempre presenti online, dalla disponibilità di reti wi-fi e dalla continua interazione sui social network in cui si è coinvolti. Ogni individuo ha la possibilità di gestire le proprie relazioni con gli altri attraverso l’utilizzo del computer o dello smartphone, in tempo reale e a costo zero, e mediante tutta una serie di strumenti di comunicazione, quali chat, blog, email, forum e social network. La tecnologia e gli automatismi a essa connessi sono diventati parte integrante della quotidianità dell’essere umano. L’avvento dei social network, primo fra tutti Facebook, ha non solo annullato i limiti spaziali, ma ha contribuito sensibilmente all’aumento della velocità della comunicazione, dello scambio di informazioni e della condivisione di notizie, di contatti, di foto, di video, di messaggi. In altre parole, grazie a questo vastissimo intreccio di reti sociali virtuali, le informazioni viaggiano a ritmi sostenuti, le idee si diffondono rapidamente e altrettanto velocemente subiscono modifiche. Se, da un lato, le nuove tecnologie digitali, i motori di ricerca, la diffusione di Internet e i social network hanno avuto un fortissimo impatto sulla vita di tutti i giorni nel modo di relazionarsi e di comunicare degli individui, rendendo i rapporti umani sempre più intangibili, dall’altro lato, la loro diffusione ha reso disponibile una grande mole di dati da analizzare. In particolare, si parla di Big Data (Kshetri, 2014; Kitchin, 2014a; 2014b) facendo riferimento all’immensa quantità di dati, strutturati e non, generati dagli utenti del Web quotidianamente (attraverso gli aggiornamenti di status su Facebook, i tweet postati su Twitter, le foto e i video inseriti su Instagram e YouTube, gli spostamenti registrati da sistemi di geolocalizzazione, gli acquisti fatti su Amazon ecc.) e archiviati in database di grandi dimensioni. I Big Data, e nello specifico i Social Big Data basati sull’analisi di una vasta gamma di dati provenienti da molteplici fonti ma con un forte focus sui social media (Bello-Orgaz et al., 2016), diventano la sfida metodologica dei ricercatori impegnati nello sviluppo della Computational Social Science (Lazer et al., 2009; McFarland et al., 2016) e, nello specifico, della Sociologia digitale (Lupton, 2014; Marres, 2017), alla ricerca della cassetta degli attrezzi adatti a rilevare i dati dal Web (Corposanto e Molinari, 2015), limitando le distorsioni metodologiche (Tufekci, 2014) del loro utilizzo nella ricerca sociale e i rischi nella qualità del dato rilevato (Lombi, 2015). Gli spazi digitali, in cui lo scambio di informazioni avviene tra più attori che si connettono per effetto dei messaggi scambiati direttamente o per gli spazi che condividono attraverso l’utilizzo di keyword comuni, sono attivi produttori di dati e il dato relazionale è, certamente, una delle tipologie di informazioni più diffuse. A differenza dei dati attributo, considerati come proprietà dei singoli individui, i dati relazionali si riferiscono ai contatti, agli scambi, ai vincoli, ai collegamenti, alle appartenenze, agli incontri di gruppo (Wasserman e Faust, 1994; Chiesi, 1999; Salvini, 2007; Scott, 2017). In altre parole, tutto ciò che mette in relazione coppie di attori può generare un dato relazionale. Pertanto, non è possibile ridurre le relazioni alle proprietà dei singoli attori, ma esse si configurano come proprietà di un più ampio sistema relazionale, come, per esempio, una conversazione tra utenti che interagiscono su un social network, nel quale le relazioni sono espresse mediante i legami che intercorrono tra gli attori stessi. La quantità di dati relazionali che è possibile estrarre oggi dal Web è aumentata in modo esponenziale. Le azioni di ogni singolo individuo su Internet lasciano, infatti, una traccia digitale, siano esse un semplice scambio di email, un commento a un post su Facebook, un tweet, l’utilizzo degli hashtag, la condivisione di un link, una recensione su TripAdvisor, il commento su un blog, un acquisto online, una ricerca effettuata su un motore di ricerca e così via. Alcune di queste tracce digitali contribuiscono alla creazione di strutture reticolari. Dai vari tipi di dati estratti online derivano differenti tipologie di reti: reti di utenti, reti di parole, reti di hashtag, e così via. Questi rappresentano solo degli esempi delle tipologie di rete che è possibile definire a partire da tali tracce digitali lasciate dagli individui sul Web. Per analizzare reti generate dall’estrazione di informazioni online, i metodi tradizionali di rilevazione e analisi dei dati risultano essere non adatti. Essi si limitano a descrivere le caratteristiche degli attori che entrano a far parte di tali strutture, ma non trattano in modo adeguato il dato relazionale, tipico di una struttura di rete. In tale contesto, i metodi della prospettiva metodologica della Social Network Analysis (SNA, Wasserman e Faust, op. cit.) permettono di dare una prima lettura della struttura delle interazioni mediante la visualizzazione dei reticoli con grafi e la costruzione di indici di centralità (Freeman, 1979) che descrivono la posizione dell’attore nella rete. Mediante l’utilizzo di software specifici (Csardi e Nepusz, 2006; Butts, 2008), è possibile visualizzare e descrivere enormi quantità di dati relazionali estratti dal Web, evidenziando l’evoluzione delle relazioni nel tempo così da poter studiare i cambiamenti in termini di ruolo e posizione degli attori in essa. Il presente capitolo, dopo una breve descrizione dei concetti di Social Big Data, social media e social network (paragrafo 2), illustra le possibilità di estrazione dei dati relazionali dal Web e le differenti tipologie di dato relazionale, la loro organizzazione in matrici di dati e l’analisi condotta grazie all’utilizzo della prospettiva metodologica della Social Network Analysis, definendo a livello esplorativo indici di centralità e algoritmi di community detection per l’individuazione, da un lato, degli attori centrali e, dall’altro, di gruppi di attori per lo studio dei dati estratti dal Web, con particolare attenzione agli strumenti di visualizzazione del reticolo (paragrafo 2.1). Il paragrafo 3 presenta un’applicazione su dati relazionali estratti da Twitter con una breve guida all’utilizzo del software Gephi per visualizzare “reti di parole”. Il paragrafo 4 fornisce brevi note conclusive.
2020
Istituto di Ricerche sulla Popolazione e le Politiche Sociali - IRPPS - Sede Secondaria Fisciano (SA)
9788891791238
Social Media, Social Big Data, traccia digitale. Social Network Anlaysis
File in questo prodotto:
File Dimensione Formato  
estratto Vitale_Primerano_Vitale in Maretti Fontanella La ricerca sociale.pdf

solo utenti autorizzati

Tipologia: Versione Editoriale (PDF)
Licenza: NON PUBBLICO - Accesso privato/ristretto
Dimensione 1.55 MB
Formato Adobe PDF
1.55 MB Adobe PDF   Visualizza/Apri   Richiedi una copia

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/524728
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact