Este post é um pouco diferente. Ao invés de escrever sobre o assunto aqui, simplesmente encaminho o link para um artigo no CodeProject. O texto relata os meus passos e aprendizado na implementação do teste de unicidade de URLs (URL-seen test) em um web crawler. Especificamente, o foco é na técnica conhecida como DRUM (Disk Repository with Update Management), utilizada para armazenamento de pares chave/valor e verificações assíncronas. Se você tem interesse no tópico e não está com muita preguiça (ou muito trabalho) neste momento, boa leitura! Ah… é claro. Sugestões são sempre bem-vindas.
Leandro T. C. Melo
Deixe um comentário