Dimentica Siri e Alexa: la "NSA Reigns Supreme" nell'identificazione vocale

Per favore, condividi questa storia!
Perché i sensori di ascolto vengono installati nei pali della luce, nelle fermate degli autobus e nelle telecamere di tutte le città intelligenti? "Non appena riesci a identificare la voce di qualcuno, puoi trovarlo immediatamente ogni volta che sta conversando." I tecnocrati fanno affidamento sulla sorveglianza totale per l'ingegneria sociale completa dell'intera popolazione. ⁃ TN Editor

At l'altezza della guerra fredda, durante l'inverno di 1980, gli agenti dell'FBI registrarono una telefonata in cui un uomo organizzò un incontro segreto con l'ambasciata sovietica a Washington, DC Il giorno della sua nomina, tuttavia, gli agenti non furono in grado di scorgere il uomo che entra nell'ambasciata. A quel tempo, non avevano modo di dare un nome al chiamante solo dal suono della sua voce, quindi la spia rimase anonima. Nel corso dei successivi cinque anni, ha venduto all'URSS i dettagli su diversi programmi segreti statunitensi.

Fu solo quando 1985 che l'FBI, grazie all'intelligence fornita da un disertore russo, fu in grado di stabilire chi chiamava Ronald Pelton, un ex analista della National Security Agency. L'anno successivo, Pelton fu condannato per spionaggio.

Oggi, agenti dell'FBI e dell'NSA avrebbero identificato Pelton in pochi secondi dalla sua prima chiamata ai sovietici. UN nota riservata alla NSA da gennaio 2006 descrive gli analisti della NSA che usano una "tecnologia che identifica le persone con il suono delle loro voci" per abbinare con successo vecchi file audio di Pelton. "Se tali tecnologie fossero state disponibili venti anni fa", affermava il promemoria, "la diagnosi precoce e l'apprensione avrebbero potuto essere possibili, riducendo il notevole danno che Pelton ha fatto alla sicurezza nazionale".

Questi e altri documenti classificati forniti dall'ex appaltatore della NSA Edward Snowden rivelano che la NSA ha sviluppato una tecnologia non solo per registrare e trascrivere conversazioni private ma per identificare automaticamente i relatori.

Gli americani incontrano più frequentemente questa tecnologia, nota come riconoscimento degli oratori o identificazione degli oratori, quando svegliano Alexa di Amazon o chiamano la loro banca. Ma un decennio prima che comandi vocali come "Hello Siri" e "OK Google" diventassero comuni frasi familiari, l'NSA stava usando il riconoscimento degli oratori per monitorare terroristi, politici, signori della droga, spie e persino impiegati delle agenzie.

La tecnologia funziona analizzando le caratteristiche fisiche e comportamentali che rendono distintiva la voce di ogni persona, come il tono, la forma della bocca e la lunghezza della laringe. Un algoritmo crea quindi un modello computerizzato dinamico delle caratteristiche vocali dell'individuo. Questo è ciò che viene comunemente chiamato "impronta vocale". L'intero processo - catturare alcune parole pronunciate, trasformarle in un'impronta vocale e confrontare tale rappresentazione con altre "impronte vocali" già memorizzate nel database - può avvenire quasi istantaneamente. Sebbene sia noto che la NSA si affida alle impronte digitali per identificare gli obiettivi, le impronte vocali, secondo un documento dell'agenzia 2008, sono "dove la NSA regna sovrana".

Non è difficile capire perché. Intercettando e registrando milioni di conversazioni telefoniche all'estero, teleconferenze video e chiamate via Internet - oltre a catturare, con o senza warrants, le conversazioni domestiche degli americani - la NSA ha costruito una collezione senza eguali di voci distinte. Documenti dall'archivio Snowden rivela che gli analisti hanno alimentato alcune di queste registrazioni con algoritmi di riconoscimento degli oratori che potevano collegare le persone alle loro espressioni passate, anche quando avevano usato numeri di telefono sconosciuti, parole in codice segreto o più lingue.

Già nell'operazione Iraqi Freedom, analisti stavano usando riconoscimento degli oratori per verificare che l'audio "che sembrava essere il leader deposto Saddam Hussein fosse davvero suo, contrariamente alle credenze prevalenti". I memo mostrano inoltre che gli analisti della NSA hanno creato impronte vocali per Osama bin Laden, la cui voce era "inconfondibile e notevolmente coerente in diverse trasmissioni ; ”Per Ayman al-Zawahri, l'attuale leader di Al Qaeda; e per Abu Musab al-Zarqawi, allora il terzo al comando del gruppo. Hanno usato l'impronta vocale di Zarqawi per identificarlo come oratore nei file audio pubblicati online.

I documenti classificati, che vanno da 2004 a 2012, mostrano la NSA che affina le iterazioni sempre più sofisticate della sua tecnologia di riconoscimento degli altoparlanti. Confermano gli usi del riconoscimento degli oratori nelle operazioni antiterrorismo e nei busti di droga all'estero. E suggeriscono che l'agenzia ha pianificato di implementare la tecnologia non solo per identificare retroattivamente spie come Pelton ma per prevenire informatori come Snowden.

Sempre in ascolto

Gli esperti della libertà civile sono preoccupati che questi e altri usi in espansione del riconoscimento degli oratori mettano in pericolo il diritto alla privacy. "Ciò crea una nuova capacità di intelligence e una nuova capacità di abuso", ha spiegato Timothy Edgar, ex consigliere della Casa Bianca del direttore delle informazioni nazionali. “La nostra voce viaggia attraverso tutti i tipi di canali di comunicazione dove non siamo lì. In un'epoca di sorveglianza di massa, questo tipo di capacità ha profonde implicazioni per tutta la nostra privacy ".

Edgar e altri esperti hanno sottolineato la natura relativamente stabile della voce umana, che è molto più difficile da modificare o camuffare di un nome, indirizzo, password, numero di telefono o PIN. Questo rende "molto più facile" rintracciare le persone, secondo Jamie Williams, un avvocato della Electronic Frontier Foundation. "Non appena riesci a identificare la voce di qualcuno", ha detto, "puoi trovarlo immediatamente ogni volta che sta conversando, supponendo che tu lo stia registrando o ascoltando".

La voce è un biometrico unico e facilmente accessibile: a differenza del DNA, può essere raccolto passivamente e da grande distanza, senza la conoscenza o il consenso del soggetto. La precisione varia notevolmente a seconda di quanto le condizioni della voce raccolta corrispondono a quelle delle registrazioni precedenti. Ma in ambienti controllati, con un basso rumore di fondo, un ambiente acustico familiare e una buona qualità del segnale, la tecnologia può utilizzare poche frasi pronunciate per abbinare con precisione le persone. E più campioni di una data voce vengono immessi nel modello del computer, più forte e "maturo" diventa quel modello.

Leggi la storia completa qui ...

Sottoscrivi
Notifica
ospite

0 Commenti
Feedback in linea
Visualizza tutti i commenti