Sono stati scoperti tre bucket AWS S3 configurati in modo errato aperti sulla rete Internet pubblica contenenti "dozzine di terabyte" di post sui social media e pagine simili, tutti estratti da tutto il mondo dalle forze armate statunitensi per identificare e profilare le persone di interesse.
Gli archivi sono stati trovati by cacciatore di violazioni della sicurezza Chris Vickery di UpGuard durante una scansione di routine di silos di dati aperti ospitati da Amazon, e questi non erano esattamente nascosti. I bucket sono stati denominati centcom-backup, centcom-archive e pacom-archive.
CENTCOM è l'abbreviazione comune del comando centrale degli Stati Uniti, che controlla le operazioni dell'esercito in Medio Oriente, Nord Africa e Asia centrale. PACOM è il nome del US Pacific Command, che copre il resto dell'Asia meridionale, della Cina e dell'Australasia.
Disse Vickery Il registro oggi si è imbattuto in loro per caso durante la scansione della parola "COM" in bucket S3 accessibili pubblicamente. Dopo aver perfezionato la sua ricerca, è apparso l'archivio CENTCOM, e all'inizio pensava che fosse collegato alla multinazionale cinese Tencent, ma si rese presto conto che si trattava di un archivio militare statunitense di dimensioni sbalorditive.
"Per la ricerca ho scaricato 400 GB di campioni ma c'erano molti terabyte di dati lassù", ha detto. "Si tratta principalmente di file di testo compressi che possono espandersi di un fattore dieci, quindi ci sono dozzine e dozzine di terabyte là fuori e questa è una stima prudente."
Solo uno dei secchi conteneva 1.8 miliardi di post sui social media recuperati automaticamente negli ultimi otto anni fino ad oggi. Contiene principalmente pubblicazioni effettuate in Asia centrale, tuttavia Vickery ha notato che parte del materiale è tratto da commenti fatti da cittadini americani.
I database rivelano anche alcuni indizi interessanti sull'utilizzo di queste informazioni. I documenti fanno riferimento al fatto che l'archivio è stato raccolto come parte del programma Outpost del governo degli Stati Uniti, che è una campagna di monitoraggio e influenza sui social media progettata per prendere di mira i giovani stranieri e allontanarli dal terrorismo.
Vickery ha trovato i file di configurazione dello sviluppo di Outpost nell'archivio, così come gli indici di parole chiave di Apache Lucene progettati per essere utilizzati con il motore di ricerca open source Elasticsearch. Un altro file si riferisce a Coral, che potrebbe essere un riferimento al programma di data mining Coral Reef delle forze armate statunitensi.
"Coral Reef è un modo per analizzare un'importante fonte di dati per fornire all'analista la capacità di estrarre quantità significative di dati e fornire associazioni suggestive tra individui per costruire quel social network", Mark Kitz, direttore tecnico per l'Esercito Distributed Common Ground System - Esercito, detto la rivista dell'Associazione delle forze armate di comunicazione ed elettronica Signal torna in 2012.
"In precedenza, avremmo analizzato quei rapporti di intelligence o qualsiasi altro dato fosse disponibile, e questo sarebbe stato molto laborioso."