domenica 10 marzo 2013

Quanto sei famoso? Twitter (forse) lo sa.

   Il social network twitter si presta in modo particolare a misurare la popolarità di un utente. Se andate a controllare i profili di personaggi pubblici famosi scoprite che normalmente hanno un gran numero di seguaci (detti "follower") ma che è piuttosto ridotto il numero di persone che essi seguono ("following"). Per esempio, il giornalista Michele Serra segue una quarantina di persone ed è seguito da più di cinquemila utenti. Damon Lindelof, uno degli autori di "Lost", ha più di 200 mila follower e un centinaio di following. Barack Obama segue più di 600 mila persone ed ha oltre 28 milioni di seguaci.


Si potrebbe suporre che il rapporto tra il numero di follower e il numero di following dia una misura della popolarità della persona. Ma questo valore è molto grossolano. Nei tre casi analizzati si ottiene 125 per Michele Serra, 2000 per Lindelof, 47 per Obama. Chiaramente non è realistico attribuire a Serra una popolarità maggiore di quella del presidente degli Stati Uniti. A falsare il dato è il fatto che Obama (o chi per lui) segue (stranamente) moltissime persone. Seguire molte persone è effettivamente un fattore che non accresce la propria popolarità (nel nostro calcolo la fa anzi decrescere) ma indubbiamente i 28 milioni di seguaci di Obama sono un segnale di popolarità indiscutibile. Il rapporto tra i due numeri però cancella l'informazione sul valore assoluto dei dati. Un altro problema che si può presentare è il seguente: per accrescere la propria popolarità, ad un utente basterebbe decide di non seguire nessuno; se il numero di following è zero, e il numero dei follower è maggiore di zero, infatti, il nostro calcolo darebbe addirittura infinito.
E' quindi necessario raffinare il criterio con cui raggiungere il nostro scopo. La prima cosa da fare è aumentiamo di un'unità il numero di utenti seguiti, come a dire che ogni utente è seguito almeno da se stesso. Ed è logico, a questo punto, aumentare di un'unità anche il numero dei following di ogni utente (perchè, appunto, ogni utente segue anche se stesso)
Perveniamo alla formula seguente:  Popolarità=(follower+1)/(following+1) che ha di buono che nella ipotesi in cui qualcuno non segue nessuno non dà infinito ma il numero di seguaci.
Come già detto questo approccio non è molto significativo. Aggiustiamo la nostra definizione in questo modo: per misurare il valore del pubblico di un utente, attribuiamo un peso ad ognuno dei suoi seguaci e anzichè sommarne il numero sommiamo i pesi. Ma quale peso è più adatto, nel calcolare la popolarità di qualcuno, se non la stessa popolarità di chi lo segue?
Definiamo allora in questo modo l'indice di popolarità su twitter (IPT):
IPT=(Somma degli IPT dei propri seguaci+1)/(Numero dei propri Following +1) 
Se vogliamo calcolare il nostro IPT quindi è importante non solo quante persone ci seguono ma da quante persone è seguito ognuno di coloro che ci segue (e in realtà il processo continua a livelli più profondi: quanti seguono chi segue chi ci segue? E così via).

Per capirci con un esempio, se Alice e Bruno hanno entrambi due seguaci e non seguono nessuno, il loro indice di popolarità non sarà automaticamente uguale; si dovrà sommare per ognuno di loro l'indice di popolarità delle due persone da cui sono seguiti. Supponiamo che i seguaci di Alice abbiano a loro volta 100 seguaci ognuno e non seguano nessun'altro oltre Alice, mentre i due seguaci di Bruno abbiano un solo seguace a testa. Probabilmente la popolarità di Alice sarà maggiore di quella di Bruno perche i due seguaci di Alice hanno molti più seguaci rispetto a quelli di Bruno. Mmmmh... Non è così scontato; forse il seguace di un seguace di Bruno (potrebbe essere Obama in persona) conta di più dei 200 seguaci dei seguaci di Alice.
Insomma la cosa si complica parecchio e sorge un problema di autoconsistenza. Determinare il proprio IPT "a mano" è del tutto impossibile, ma Twitter potrebbe implementare un algoritmo che lo calcoli automaticamente. Se la cosa avesse una qualsiasi utilità.

Rimanendo ad un livello controllabile, i grafi seguenti rappresentano dei gruppi isolati su twitter, per i quali gli IPT si possono calcolare risolvendo un sistema lineare in cui il numero di incognite e di equazioni è uguale al numero dei partecianti al gruppo. L'IPT di ciascun utente è indicato con la lettera che lo rappresenta. Le frecce vanno dal follower al following.








Se non avete voglia di imbarcarvi in risoluzioni di complicati sistemi di equazioni, una considerazione molto più semplice che potete fare subito è questa: quanti sono i vostri seguaci che hanno più follower che following? Maggiore è il loro numero, maggiore è la vostra popolarità sul web (e non solo).

3 commenti:

  1. In pratica, è il Google-algoritmo Page-rank (applicato ai link) del duo Brin & Page ;-)

    RispondiElimina
    Risposte
    1. Hai ragione, Carlo, l'algoritmo, nella sostanza, è lo stesso; anche se la mia è una versione semplificata.

      Elimina
  2. L'asso nella manica: avere Obama come follower...

    RispondiElimina