Spam
Enviado por EddyuxDark93 • 11 de Diciembre de 2012 • Informe • 373 Palabras (2 Páginas) • 413 Visitas
http://dialnet.unirioja.es/servlet/articulo?codigo=2326676
Este artículo presenta un sistema de detección automática de Spam, o correo no deseado, aplicando Regresión Logística Bayesiana (BBR) como técnica de aprendizaje automático, sobre la colección de correos electrónicos PAMBASE. A modo de comparativa se han aplicado otros dos algoritmos de aprendizaje: el algoritmo SVM (Support Vector Machine), y el algoritmo PLAUM (Perceptron Algorithm with Uneven Margins). La finalidad de este estudio es comprobar la eficiencia y efectividad del algoritmo BBR en la tarea concreta de filtrado de Spam. Como muestran los experimentos, el algoritmo BBR no solo obtiene unos resultados satisfactorios en cuanto a precisión , sino que además es el algoritmo más rápido de los estudiados
http://sedici.unlp.edu.ar/handle/10915/19434
El correo electrónico es quizás la aplicación que más tráfico genera en la Internet. Es utilizado por millones de personas para comunicarse alrededor del mundo y es una aplicación de misión crítica para muchos negocios. En la última década la avalancha de correo no deseado (Spam) ha sido el mayor problema para los usuarios del correo electrónico, ya que diariamente una cantidad arrolladora de spam entra en las bandejas de los usuarios. En 2004, se estimó que el 62% de todos los correos que se generaron fueron spam. El spam no solo es frustrante para muchos usuarios, sino que también compromete a la infraestructura tecnológica de las empresas, costando dinero a causa de la pérdida de productividad. En los últimos años, el spam ha evolucionado desde ser una molestia a ser un serio riesgo en la seguridad, llegando a ser el principal medio para el robo de información personal, así como también para la proliferación de software malicioso.
http://dialnet.unirioja.es/servlet/articulo?codigo=2386320
Este artículo presenta una revisión general de los modelos de detección y filtrado de correo spam existentes en la actualidad. En concreto, se realiza una subdivisión de las técnicas existentes en dos grandes tipos: modelos basados en la colaboración de usuarios y modelos basados en el análisis de contenido. Se presentan las características específicas del problema y se analizan los corpus públicos disponibles, así como las técnicas habituales empleadas en su preprocesamiento. Además, se realiza una revisión de los distintos sistemas implementados destacando las características distintivas de cada uno de ellos. El trabajo finaliza con la exposición de las conclusiones más destacables acerca del estado del arte actual.
...