Tecnologia

Memex: il motore di ricerca che vi svela il Deep Web

Da quando i giornali hanno scoperto il deep Web e il dark Web per descrivere l’Internet viene spesso usata la metafora dell’iceberg. La parte del Web visibile ai motori di ricerca è come la parte emersa dell’iceberg. Ma ce n’è un’altra, molto più grande e nascosta e – si lascia intendere – pericolosa che né Google, né Bing, né Yahoo possono farvi vedere. I motori di ricerca tradizionali riescono a farci vedere circa il 5% dell’Internet, spiega il direttore del progetto Memex, Chris White. Il nuovo motore di ricerca sviluppato da DARPA (il centro ricerche dell’esercito USA) promette di dare l’accesso al restante 95%.

Chris White, il direttore del progetto Memex, ad una conferenza (fonte: @DARPA via Twitter.com)
Chris White, il direttore del progetto Memex, ad una conferenza (fonte: @DARPA via Twitter.com)

WHAT HAS BEEN SEEN CANNOT BE UNSEEN
Il problema principale è stato trovare un modo per riuscire a far vedere ciò che su Internet è sostanzialmente invisibile. E Chris White è convinto che Memex sarà un nuovo potente strumento per fare ricerche su tutti i contenuti di Internet. Ma perché è così importante poter “vedere” cosa c’è nel Web con un motore di ricerca? Ad esempio per aiutare le forze dell’ordine a raccogliere informazioni nelle indagini relative a crimini che hanno luogo on-line. Spesso infatti seguire le tracce delle attività criminali on-line è un lavoro che deve essere svolto “manualmente”, nel senso che una buona parte del lavoro di indagine consiste nel cercare di risalire alle connessioni tra diversi siti o tra diversi “pezzetti” di informazione sparsi nella Rete. E quando queste informazioni “spariscono” nel deep Web le cose si fanno più complicate perché non è possibile utilizzare i motori di ricerca. Un’altra delle caratteristiche di Memex sarà la capacità di aggregare automaticamente i dati dopo averli comparati e di essere quindi in grado di ricostruire la rete di relazioni tra i diversi siti o le connessioni tra i risultati della ricerca. Sulla pagina dedicata a Memex sul sito della DARPA specificano anche quello che Memex non farà: accedere ad informazioni che non sono pubbliche e fornire servizi di anonimizzazione e di de-anonimizzazione. Il programma 60 Minutes della CBS ha dedicato una puntata a Memex e il video può essere visto qui

COME È NATA L’IDEA DI MEMEX
Il progetto prende il nome da una pubblicazione del 1945 di Vannevar Bush dal titolo As we may think. Nell’articolo Bush immagina una macchina (memex appunto) in grado di “integrare” la memoria umana indicizzandola e stabilendo delle relazioni (o dei link) tra i vari dati memorizzati. Tra le altre cose il testo di Bush è stato alla base dell’idea che ha portato alla nascita dell’ipertesto. Chris White spiega che Memex è nato per contrastare lo sfruttamento della prostituzione online e tracciare lo sfruttamento degli sfruttatori della prostituzione. Ad esempio a partire dagli annunci postati su Internet per pubblicizzare servizi di escort e di prostituzione. Analizzare con i metodi tradizionali le decine di migliaia di annunci (ad esempio 373.000 in un anno a New York) per cercare di stabilire ad esempio, quante vittime ci siano ad un determinato domicilio, se e quanto spesso vengono trasferite da un luogo all’altro (ad esempio se l’annuncio di una ragazza appare in successione in città diverse) è un lavoro molto lungo. Memex invece promette di analizzare automaticamente (secondo i criteri definiti dall’utente) le relazioni tra diversi annunci e di aggregare i risultati in modo da fornire una localizzazione e, si suppone, risalire a chi gestisce ogni singolo “hub”, risalendo anche a chi si occupa di “reclutare” le vittime. Perché proprio il traffico di esseri umani e lo sfruttamento della prostituzione? Perché, e qui ritorna la metafora iniziale, è solo la punta dell’iceberg di organizzazioni criminali che usano i proventi della prostituzione per finanziare altre attività illecite.
Lo schema dello sfruttamento della prostituzione ricostruito da Memex (Fonte: DARPA via wsj.com)
Lo schema dello sfruttamento della prostituzione ricostruito da Memex (Fonte: DARPA via wsj.com)

Il gruppo di ricerca guidato da White ha analizzato circa 60 milioni di annunci online che offrono servizi sessuali e ha stimato che il costo per pubblicare questi annunci sia di un paio di centinaia di milioni di dollari e per sostenere solo questo costo il business deve avere dimensioni molto maggiori. Ma non si tratta solo di smantellare i network della prostituzione: grazie alla sua capacità di analizzare i dati nel deep Web Memex potrà essere uno strumento efficace per aiutare le ONG che si occupano di fornire assistenza alle vittime del racket. Secondo White infatti una parte del reclutamento si svolge sui siti che offrono servizi come i matrimoni combinati dove le ragazze entrano in contatto con le organizzazioni criminali. Riuscire ad intercettare quello scambio di domanda e offerta consentirebbe alle ONG e ai servizi sociali di impedire che una ragazza finisca nelle mani della criminalità organizzata.