Se você tem alguma dúvida sobre segurança da informação (antivírus, invasões, cibercrime, roubo de dados etc.) vá até o fim da reportagem e utilize o espaço de comentários ou envie um e-mail para [email protected]. A coluna responde perguntas deixadas por leitores no pacotão, às quintas-feiras.

"G1 Explica" é uma série da coluna Segurança Digital que explica conceito, ataques e tecnologias em uma forma de perguntas e respostas. O assunto de hoje é a "deep web", ou "web profunda" . Confira:

Rede Tor permite a navegação anônima na internet.1. O que é a deep web?
O termo "deep web" ("web profunda") tornou-se um termo geral para se referir a todo um conjunto de sites e servidores de internet. Explicar o termo, portanto, não é mais tão simples.

Originalmente, a "deep web" eram os sites "invisíveis" - páginas que, por qualquer motivo, não apareciam em mecanismos de busca, especialmente no Google. Eram páginas que, para serem encontradas, necessitavam do uso de diversos mecanismos de busca em conjunto, além de ferramentas adicionais e ferramentas de pesquisa individuais de cada site.

O termo se popularizou com uma definição mais compacta para se referir aos sites que necessitam do uso de programas específicos para serem acessados. O mais popular entre eles é o Tor, mas existem outros softwares, como Freenet e I2P. O emprego do termo "deep web" é incorreto neste contexto - o termo certo seria "dark web" (web escura).

 

Porém, como esses sites precisavam de ferramentas especiais para serem acessados, eles não apareciam em mecanismos de pesquisa e, assim, as duas definições não eram incompatíveis. No entanto, com o passar do tempo, parte desses sites de acesso exclusivo via Tor foi disponibilizada (via "pontes de acesso") na web normal - que não necessita de software especial. Com isso, o conteúdo que antes era dessa web "inacessível" foi parar até mesmo no Google. Acessar esse conteúdo, portanto, é tão fácil quanto acessar qualquer outro site.

 

É muito difícil saber com certeza se o termo deep web está sendo usado para se referir a um canal de acesso via Tor ou a páginas e serviços de acesso realmente limitado e restrito, independentemente da tecnologia.

 

Logotipo do Projeto Tor.2. Qual a diferença entre deep web e dark web?
Com base nas definições mais puras, um site da "deep web" não tem seu conteúdo disponibilizado em mecanismos de pesquisa e, portanto, não pode ser encontrado, exceto caso por quem conhece o endereço do site.

 

A "dark web" consiste dos sites que existem primariamente em redes anônimas e que necessitam de programas especiais. O Facebook, por exemplo, tem uma versão de seu serviço na dark web. No entanto, o meio de acesso principal não é este. Mas há outros sites que existem exclusivamente nessa dark web e não podem ser acessados sem o uso de programas como Tor, I2P e Freenet.

 

3. Que tipo de conteúdo há na deep web?
Como a "deep web" se refere a qualquer conteúdo fora dos mecanismos de pesquisa, a definição é bastante ampla. Existe muito conteúdo legítimo disponível na web e que nem sempre pode ser encontrado com uma pesquisa em mecanismos de pesquisa geral. Um exemplo disso são decisões judiciais, que muitas vezes exigem pesquisas diretas nos tribunais onde tramitaram.

 

A deep web também pode consistir de sites com conteúdo pessoal, páginas cujos donos decidiram não incluir em mecanismos de pesquisa por qualquer motivo, páginas que nunca receberam links de outros sites (porque só foram compartilhadas por e-mail, por exemplo) e também espaços para a troca de conteúdo ilícito, como pirataria. Como esses sites muitas vezes fornecem arquivos grandes para download, não é sempre prático manter esse conteúdo na "dark web", onde as velocidades costumam ser menores.

 

4. Que tipo de conteúdo há na dark web?
A dark web, por fornecer mecanismos de anonimato, é atraente para ativistas políticos, hacktivistas e criminosos virtuais, além pessoas que buscam compartilhar conteúdo que foi censurado. Com ações policiais que derrubaram sites de abuso sexual infantil da web comum, parte desse conteúdo também passou a ser disponibilizado pela dark web.

 

A dark web também é notória por oferecer lojas virtuais de mercadorias proibidas ou de difícil acesso, inclusive drogas (lícitas e ilícitas) e armas.

 

Como a dark web também serve como meio anônimo para acesso à web comum, ela pode ser usada para burlar bloqueios de rede (como os que existem na China). Em outras palavras, nem todo mundo que utiliza a tecnologia da dark web pode estar interessado nos conteúdos que estão presentes nela, mas sim no anonimato que ela fornece para o acesso a qualquer conteúdo.

 

5. Por que alguns sites ficam fora dos mecanismos de busca?
Os mecanismos de busca, como o Google, precisam, em primeiro lugar, encontrar um site. Isso normalmente ocorre com links. Quando uma página que o Google já conhece coloca um "link" para outra página, o Google segue esse link e passa a incluir essa página em sua busca (um processo chamado de "indexação").

 

Porém, mesmo que haja um link para a página, ela pode ainda bloquear mecanismos de pesquisa. Isso pode ser feito via rede (bloqueando os endereços IP da rede dos mecanismos de pesquisa) ou utilizando mecanismos oferecidos pelos próprios sites de busca que permitem a um site indicar qual conteúdo pode ser indexado. Um site pode facilmente determinar que a indexação de suas páginas é proibida e, nesse caso, elas não aparecerão nos mecanismos de busca mais comuns, que honram essas configurações.

 

Alguns conteúdos exigem buscas específicas. As decisões Judiciais, por exemplo, só podem ser encontradas por alguém que sabe um número de processo ou a OAB de um advogado para pesquisar nos sites dos tribunais. Os mecanismos de pesquisa não têm essas informações e não "sabem" preencher o formulário. Por isso, esse conteúdo tende a ficar fora do alcance.

 

Certos conteúdos também não podem ser indexados por causa do formato em que estão armazenados. Um conteúdo pode existir na web como um arquivo de áudio ou vídeo que o mecanismo de busca não consegue transcrever para texto. Nesse caso, o conteúdo também não vai ser encontrado, a não ser que você saiba especificamente o nome do arquivo ou título do arquivo multimídia.

 

6. Por que a dark web necessita de programas específicos?
A internet só funciona graças a um grande acordo que existe na web: todos os sites, navegadores e sistemas operacionais "falam" um conjunto de "línguas" em comum. Esses são os "protocolos de rede".

 

A dark web estabelece uma camada de protocolo nova que o computador não conhece. E, com isso, automaticamente esses sites se tornam incomunicáveis.

 

O objetivo dessa camada adicional é normalmente a garantia do anonimato dos usuários. Os detalhes técnicos variam em cada protocolo, mas a maioria estabelece uma série de intermediários em cada conexão. Certos participantes da rede (que podem ser todos ou só alguns) tornam-se intermediários das conexões dos demais usuários e, com isso, qualquer visita ou acesso fica em nome desses usuários e não em nome do verdadeiro internauta.

 

7. É possível quebrar o anonimato da dark web?
De modo geral, sim. Mas as técnicas exigem certos recursos tecnológicos avançados e, às vezes, um pouco de sorte.

 

Uma delas é conseguir controlar um grande número de sistemas intermediários na rede. Se o número de sistemas controlados for grande o bastante, o interessado pode conseguir fazer alguma ligação entre o usuário e o conteúdo acessado. Essa é uma operação de médio prazo, já que é preciso monitorar os acessos por um bom tempo até que as ligações possam ser feitas sem depender da sorte.

 

Outro meio, que vem sendo bastante empregado pelo FBI, é a instalação de programas espiões. A autoridade policial faz isso após conseguir uma autorização da justiça para tomar o controle de um serviço disponibilizado na rede anônima (a identificação deste depende de outros métodos, como o mencionado acima ou então cooperação de um delator). Uma vez podendo controlar o site, um código especial é colocado na página para tentar contaminar os usuários com vírus e relatar as informações ao FBI. Isso, no entanto, depende de vulnerabilidades no software do possível investigado, o que nem sempre pode ser fácil de explorar.

 

Essa técnica foi utilizada em um site com imagens de pornografia infantil, por exemplo. O FBI foi criticado por temporariamente ter mantido o site no ar em vez de retirá-lo imediatamente, mas a Justiça americana entendeu que a medida foi necessária para colher mais informações sobre os visitantes da página.

 

Imagens: Thinkstock e Tor (Reprodução)

Não se esqueça de deixar sua dúvida na área de comentários, logo abaixo, ou enviar um e-mail para [email protected]. Você também pode seguir a coluna no Twitter em @g1seguranca. Até a próxima!