Quando James Shinn stava lavorando per la CIA come esperto senior nell'Asia orientale più di un decennio fa, desiderava ardentemente gli strumenti di un meteorologo. Voleva essere in grado di prevedere che la probabilità che la Corea del Nord sparasse un missile entro un mese era, diciamo, 60 percento. Rimase una fantasia, dice, fino ad ora.
Shinn e il suo team di persone 14 a Predata hanno sviluppato un software che descrive numericamente la volatilità e il rischio politico. Elimina enormi quantità di dati da conversazioni e commenti online, li confronta con modelli passati e sputa una probabilità . (Una versione del servizio di Predata è accessibile su Servizio professionale Bloomberg.) Shinn paragona il suo prodotto alla sabermetria, la strategia del baseball basata sulle statistiche resa popolare da Michael Lewis Moneyball. "Raccogliendo un sacco di statistiche sulle loro prestazioni passate da tutti gli angoli di Internet, stiamo prevedendo come un gran numero di giocatori in una squadra giocherà o lancerà in futuro", dice Shinn, per analogia.
Predata non sostituisce gli analisti umani tanto quanto offre loro un nuovo strumento. Senza che le persone scelgano cosa seguire, il raschiamento dei metadati ha un uso limitato. Inoltre, sostiene Shinn, mentre le società di analisi del rischio offrono sempre più ai clienti percentuali numeriche, i dati vengono spesso estratti dall'aria. "Questo è un indice di rischio guidato dalla macchina e accuratamente calcolato", afferma Shinn, fondatore e amministratore delegato dell'azienda. "Non esiste un punteggio arbitrario da parte di un analista umano."
Ogni giorno, Predata monitora i feed 1,000 di Twitter, le pagine 10,000 di Wikipedia, i video 50,000 di YouTube e diverse dozzine di giornali e riviste in alcuni paesi 200. Copre gli argomenti di 300, comprese le notizie sulle singole società , il dibattito sul Regno Unito che lascia l'Unione Europea e le decisioni sui tassi di interesse delle banche centrali.
I dati storici sono di primaria importanza. Ad esempio, Predata non ha fatto una previsione statisticamente utile per l'22 di marzo attacchi a Bruxelles, in parte perché il Belgio ha avuto pochi incidenti di questo tipo. Il software ha bisogno di almeno cinque eventi precedenti per trovare una correlazione tra conversazioni digitali e un atto di terrorismo, secondo Shinn. La Francia, d'altra parte, aveva assistito a incidenti 13 prima degli attacchi di Parigi a novembre 13; la società afferma che il suo modello indicava la probabilità che un evento fosse almeno 61 percento al mese in anticipo. Allo stesso modo, su Dec. 27, Predata afferma di aver calcolato una probabilità del 68 per cento che la Corea del Nord si impegnerebbe in qualche attività riguardante le armi di distruzione di massa entro 45 giorni. Quasi due settimane dopo, il gennaio 6, il regime di Kim Jong Un ha condotto la nazione quarto test nucleare.
Shinn, che ha lavorato come assistente segretario per l'Asia orientale presso il Dipartimento della Difesa degli Stati Uniti dopo il suo periodo presso la CIA, ha iniziato a sviluppare la tecnologia in 2014 mentre insegnava alla sua alma mater, Princeton, e faceva parte del comitato consultivo di Kensho Technologies, un software di analisi sviluppatore per la gestione degli investimenti. Il CEO di Kensho, Daniel Nadler e Shinn hanno sperimentato nel loro tempo libero un prototipo rozzo che ha monitorato le conversazioni online tra i sindacati in Sudafrica, pensando che i dati offrissero un controllo sulla volatilità del paese. Hanno scoperto che l'argomentazione avanti e indietro in inglese e in afrikaans su siti pubblici come le pagine Wikipedia dei sindacati sono aumentate prima degli attacchi minerari, dopo di che i prezzi dell'oro e del platino sono aumentati.
Leggi la storia completa qui ...