Há um ano, a DARPA – agência do governo americano que desenvolve tecnologias militares – anunciou uma missão inspirada pela ficção científica: criar um motor de busca que pudesse encontrar coisas na deep web, que rastreadores do Google não conseguem ver.
O projeto Memex já está em andamento e, pela primeira vez, pudemos ver em ação esta ferramenta para combate ao crime. A DARPA demonstrou a tecnologia para a Scientific American e o programa de TV 60 Minutes, e os recursos parecem alucinantes. O Memex – combinação das palavras “memória” e “índice” em inglês – parece vagamente algo que você veria em Minority Report.
Deep web
Na superfície, o Memex funciona como um motor de busca qualquer. A diferença é que ele espalha seus tentáculos pela deep web: isto é, pelos 90% a 95% da web pública que Google e Bing não indexam. Isso inclui de tudo, desde páginas temporárias inofensivas até conteúdo pirata e sinais de atividade ilegal.
São informações que podem não importar muito para um usuário comum, mas podem ser cruciais para investigadores. Dessa forma, o Memex consegue acompanhar criminosos, especialmente os traficantes de pessoas que se mantêm tão discretos quanto possível.
Tráfico de pessoas
Por que focar no tráfico de pessoas? Chris White explica que criminosos usam essa atividade para financiar outras atividades ilícitas; e como eles se movimentam pelos EUA, estão dispostos a transportar drogas e armas.
Além disso, este tipo de crime é muito difícil de provar às autoridades, devido ao uso de anúncios temporários e conexões peer-to-peer dentro da deep web – é difícil coletar as provas necessárias. Por isso, as condenações são poucas.
Isso já está mudando. Em 2012, uma mulher ficou presa em cativeiro em Nova York; no ano passado, um dos homens responsáveis foi condenado à prisão – a pena vai variar entre 50 anos e perpétua. Isso aconteceu graças a evidências descobertas na deep web através do Memex. A ferramenta está sendo usada em outras 20 investigações.
Como funciona
Imagine esta situação: se um investigador criminal tem o link para um anúncio publicado por um traficante de pessoas, seria difícil encontrar pistas de outros traficantes, porque estes anúncios são eliminados antes que o Google tenha a chance de indexá-los. O Memex contorna isso.
A tecnologia consulta uma amostra muito mais ampla da internet, incluindo links da deep web, para encontrar conexões entre o termo de pesquisa e os seus resultados, além de conexões entre um resultado e outro.
Após a pesquisa inicial, o Memex então produz uma “esteira de dados”, que mostra todas as outras páginas relacionadas aos links em que você clicou, mas que não veria de outra forma. É assim: