Por que a 'deep web' não pode ser rastreada: pacotão de segurança
Se você tem alguma dúvida sobre segurança da informação (antivírus, invasões, cibercrime, roubo de dados etc.) vá até o fim da reportagem e utilize o espaço de comentários ou envie um e-mail para [email protected]. A coluna responde perguntas deixadas por leitores no pacotão, às quintas-feiras.
>>> Perguntas sobre a web
Poderia me ajudar com as dúvidas abaixo?
1) Páginas web que estão na Deep Web devem ser construídas de forma diferente das que estão na internet normal, ou seja, é necessária uma linguagem diferente de HTML?
2) Na internet normal, você precisa registrar um domínio para ter um site. Como funciona isto na Deep Web?
3) Existem sites de busca na Deep Web, como um Google por exemplo?
4) Qual é o protocolo utilizado na deep web, http ou outros?
5) Qual é o motivo de ninguém conseguir rastrear os donos dos sites na Deep Web?
6) Como funcionam os IP das máquinas na Deep Web? Eles ficam de alguma forma escondidos?
Obrigado,
Sérgio Luís Melchiori
Suas perguntas envolvem uma série de detalhes técnicos, Sérgio. Mas, antes, é preciso esclarecer o seguinte: o termo "deep web" se refere a qualquer conteúdo existente na rede e que não é fácil de ser encontrado.
Recentemente, esse termo tem sido confundido com o termo "dark web" ou "darknet", que se refere a sites ou recursos que exigem software específico para serem acessados. De maneira ainda mais grosseira, o termo "deep web" tem sido usado como sinônimo da rede Tor. Por causa desse uso incorreto dos termos, eles têm perdido o seu sentido original e até a sua utilidade.
Por exemplo, não há dificuldade nenhuma para que uma autoridade policial rastreie um acesso simples em um conteúdo da "deep web" que esteja disponível na web comum (sentido original). Mas o Tor, que é considerado a "deep web", é uma rede projetada para evitar rastreamentos desse tipo. Os termos, tais como são usados hoje, confudem a tecnologia e o propósito.
De fato, quem pensa que a "deep web" se restringe ao Tor acaba não percebendo a grande quantidade de informações que está na web comum e fora do alcance de mecanismos de pesquisa.
Pelo teor das suas perguntas, que envolvem bastante a questão do rastreamento, me parece que você está interessado no funcionamento do Tor e não da deep web ou darknet como conceito. Mas a coluna vai buscar responder as perguntas nesses três sentidos.
Feito esse esclarecimento, podemos prosseguir com as respostas:
1. Estritamente falando, a "web" se refere a documentos de hipertexto, ou seja, "HTML". Nesse sentido, todo o conteúdo da "deep web" utiliza alguma forma de hipertexto HTML. No entanto, existem diversos outros meios para transmissão de dados na rede. No caso do Tor, as páginas usam HTML, sim; a única diferença é que essas páginas tendem a evitar certas tecnologias consideradas perigosas para rastreamento, de modo a desobrigar o navegador dos visitantes a suportar esses recursos e aumentar a segurança do ambiente. Mas o Tor também pode transferir outros tipos de dados e protocolos.
2. Como explicado acima, "Deep Web" pode ser conteúdo da web normal, inclusive conteúdo disponível somente em um endereço IP, por exemplo, e não em domínio. A disponibilidade de conteúdo em redes secundárias (darknet) depende da tecnologia de cada rede. No Tor, existe um procedimento específico para disponibilizar um serviço oculto com base em uma chave criptográfica e não é preciso comprar nada. Na verdade, também não é preciso adquirir domínios na web comum - você só teria que divulgar o endereço IP do acesso. No caso do Tor, o que mantém a identidade do site é a chave criptográfica associada a ele, de modo que o IP da conexão não seja relevante.
3. Mais ou menos. Em definição estrita, a "deep web" é tudo que não pode ser facilmente encontrado. Logo, um conteúdo que existe em um mecanismo de pesquisa deixaria de ser parte da "deep web". No caso do Tor e outras redes da dark web, existem mecanismos de pesquisa. E também o próprio Google consegue indexar várias páginas do Tor, graças a serviço que fazem a intermediação do Tor para a web comum. Mas nem todas as páginas podem ser encontradas por esses recursos, claro.
4. Novamente, na definição estrita da "deep web", essa pergunta não faz sentido, porque o conceito de "web" envolve especificamente tecnologias como o HTTP. Já programas da "dark web", como o Tor, utilizam protocolos próprios para transportar outros protocolos, inclusive o HTTP, mas nem todos os programas precisam necessariamente funcionar assim e por isso existe também o termo "dark net".
5. Em redes de dark web, como o Tor, a principal dificuldade são os sistemas intermediários. No caso específico do Tor, os sistemas com informação mais privilegiada sobre o local desses sites são escolhidos com base em um sistema de reputação. Se esse sistema de reputação for enganado, é possível que uma máquina de espionagem ocupe posições sensíveis na rede para identificar os endereços verdadeiros dos sites. Quanto mais sistemas intermediários relevantes um atacante controlar, mais fácil será o rastreamento da conexão.
Imagem demonstra funcionamento de intermediação e criptografia na rede Tor. (Foto: EFF/Creative Commons)
6. Em redes "dark net", é normalmente comum que todos os acessos sejam intermediados por um ou mais sistemas. Nessa intermediação, o IP verdadeiro da origem e do destino da comunicação ficam ocultados e cada sistema intermediário sabe muito pouco da conexão - ou eles não sabem o conteúdo, ou não sabem o destino, ou não sabem a origem, por exemplo. Mas, novamente, se um espião conseguir controlar vários desses sistemas, ele pode acabar conseguindo juntar as peças do quebra-cabeças e rastrear a comunicação.
Espero que as respostas tenham esclarecido suas dúvidas, Sérgio!
O pacotão da coluna Segurança Digital vai ficando por aqui. Não se esqueça de deixar sua dúvida na área de comentários, logo abaixo, ou enviar um e-mail para [email protected]. Você também pode seguir a coluna no Twitter em @g1seguranca. Até a próxima!