Resumo — O serviço de correio electrónico assume uma crescente importância na sociedade actual e, em particular, no âmbito dos serviços de comunicação que hoje em dia são alvo preferencial de utilização por parte dos utilizadores da Internet. No entanto, são ainda muitos os desafios que se colocam a este serviço, nomeadamente no que diz respeito à crescente proliferação do fenómeno de correio electrónico não solicitado. Desta forma, este trabalho posiciona-se no desenvolvimento de um sistema colaborativo, o qual permite aos utilizadores finais contribuir para a obtenção de mecanismos de detecção de spam mais eficientes. Isto será realizado através do desenvolvimento de um sistema que possibilite, de uma forma simples e flexível, o envio de filtros de spam dos utilizadores finais para servidores especializados, de modo a tornar possível o acesso e a troca colaborativa de filtros entre os diferentes utilizadores de rede. Esses filtros serão posteriormente combinados, de diferentes formas, nos clientes dos utilizadores finais, com vista a uma melhoria dos processos de classificação e detecção de spam. Palavras-chave: Correio Electrónico, Spam, Filtros Colaborativos. I. INTRODUÇÃO crescente proliferação de correio electrónico não solicitado (spam) é um problema grave que afecta actualmente as redes de comunicações. Este problema tem inúmeras razões, entre as quais uma forte motivação económica, que advém da possibilidade de aceder a um elevado número de consumidores a um baixo custo [1,2]. A título exemplificativo alguns estudos apontam para que nos dias de hoje aproximadamente 50% a 80% de todo o tráfego mundial de e-mail seja spam [3,4]. Assim, este problema atinge os indivíduos e as organizações, devido à invasão de privacidade, à divulgação de burlas e vírus informáticos [5] e ao aumento do tráfego na rede e ao tempo gasto a ler mensagens indesejadas [1,6]. Para minorar este problema existem diferentes abordagens, como as colaborativas (e.g. blacklists) e as baseadas em processos de filtragem (análise de conteúdo de e-mail via técnicas de text mining) [7]. Assim, é neste contexto que se posiciona este trabalho, e os seus contributos estão associados à definição e ao desenvolvimento de uma arquitectura distribuída que permita auxiliar no desenvolvimento de estratégias colaborativas de filtragem de correio electrónico. No que se refere à estrutura básica do sistema a desenvolver, este deverá basear-se em extensões a clientes do serviço de correio electrónico usualmente utilizados na Internet. Estas extensões, que deverão ser fáceis de instalar e configurar, permitirão o desenvolvimento de funcionalidades adicionais nos clientes de correio electrónico através de uma fácil interface com o utilizador [8]. Estas extensões deverão então permitir a interacção com servidores específicos, quer para submissão de amostras de spam recebido, quer para troca de filtros de e- mail. A disponibilização e organização dos filtros nos servidores poderão ter em conta a classificação dos diferentes participantes em diversos grupos de interesse por forma a se constituírem como comunidades e redes sociais de indivíduos que, quer pessoal quer profissionalmente, partilham interesses e objectivos comuns. Desta forma, a partir do sistema projectado neste trabalho, será então possível desenvolver diferentes estratégias colaborativas de detecção e filtragem de spam e estudar a eficácia das mesmas. II. A PROBLEMATICA DO SPAM A. O que é o Spam e como se distribui? Um utilizador que use o e-mail com uma elevada frequência geralmente recebe dois grupos distintos de mensagens: as que são solicitadas (ham) e as que não são solicitadas (spam) como já foi referido anteriormente. As mensagens solicitadas são aquelas que o utilizador espera receber, ou até mesmo não esperando receber, são mensagens que o utilizador quererá ler, tendo pois um grau significativo de importância para ele. Por oposição, as mensagens chamadas spam ,ou não solicitadas, são mensagens de publicidade contendo por vezes vírus, worms, ou com algum prejuízo para o sistema, sendo distribuídas em massa e sobre as quais o utilizador não possui controlo relacionado com a sua recepção. O spam, geralmente enviado e controlado por indivíduos denominados por spammers, tem como principais objectivos: • A divulgação para venda de produtos por vezes ilícitos, como medicamentos (de prescrição obrigatória) ou drogas; • Os actos de phishing, i.e. fraude electrónica com o intuito de se obter informações pessoais tais como passwords ou números de cartões de crédito, fazendo-se passar por empresas de confiança; • A intrusão no sistema do utilizador, para que seja roubada informação deste ou, por vezes, usar o sistema como porta para distribuição de mais spam; • Destruição do sistema do utilizador por via de vírus. Estas intenções na distribuição do spam atingem não só os utilizadores (como alvo primário), mas também os ISPs por serem as entidades responsáveis por controlar os servidores Filtragem Colaborativa de Correio Electrónico não Solicitado Artur Machado 1 , Paulo Cortez 2 , Pedro Sousa 3 1,3 Departamento de Informática/CCTC Universidade do Minho, Braga, Portugal email: ajpcm1@gmail.com, pns@di.uminho.pt 2 Departamento de Sistemas de Informação/ALGORITMI Universidade do Minho, Guimarães, Portugal email: pcortez@dsi.uminho.pt A