jueves, 10 de marzo de 2011

CSI: Correo electrónico--desenmascarando a mensajeros anónimos

Un nuevo algoritmo identifica el estilo de escritura única oculto en las comunicaciones digitales.

fingerprint

El mundo de correos electrónicos anónimos y comentarios podría llegar pronto a un final de estrellarse. Investigadores en la Universidad Concordia han descubierto una manera matemáticamente descubrir el estilo de escritura única (y a menudo subconsciente), o "escribir la impresión," de cada individuo. La más inmediata aplicación ayudará a ley aplicación identificar al autor de correos electrónicos anónimos de una línea de sospechosos. Por ahora, el programa es de aproximadamente 85% preciso y confinado al rastreo de correo electrónico, pero es concebible que la tecnología eventualmente podría descubrir la identidad de los remitentes de spam, trolls o incluso los terroristas.

"En los últimos años, hemos visto un alarmante aumento en el número de cibercrímenes con correos electrónicos anónimos," profesor de información ingeniería de sistemas, Benjamin Fung, dice ScienceDaily. A través de correo electrónico, pedófilos se aprovechan de los niños, matones acosar a compañeros de clase y transmitir información de criminales--todo bajo la tapa hermética de la comunicación digital. Trabajo de detective tradicional puede descubrir la ubicación general de un grupo de sospechosos, ya sea por rastrear la dirección IP de un equipo o en pistas contextuales, pero el autor real todavía puede aluden a las autoridades.

Para el modelado de Estadística normal, que a menudo involucran a cientos de miles de personas, un puñado de sospechosos es conjunto miserable de datos. Así, los investigadores decidieron cavar en la psique humana y descubrir todos los procesos ocultos en reunir juntos una frase: riqueza de vocabulario, patrones de puntuación, uso de espacios--incluso la frecuencia de ciertas letras. Los miles de micro-decisiones que tomamos en cada frase es una mezcla heterogénea de datos científicos que debe encontrar el conjunto único de la superposición de elementos a una personalidad particular de bandera roja.

El campo de pruebas para el algoritmo de detective del equipo fue 200.000 correos electrónicos de la vida real de 150 empleados de Enron. Desde una pequeña muestra de 10 temas y 100 mensajes de correo electrónico, la técnica correctamente identificada entre 80 a 90% de los sujetos. Por lo tanto, no es lo suficientemente preciso como para un Tribunal (porque el 20% de los sujetos que falsamente acusado), pero es enormemente beneficioso para detectives atado de recursos.

Aún más importante, comunicación por correo electrónico no es a diferencia de los comentarios o mensajes de texto--todos tienen sus propios patrones comunes de gramática y carta. De hecho, un algoritmo más refinado podría ser capaz de usar un motor de búsqueda para extraer datos de los comentaristas políticos desagradables o los trolls foro que docenas de sitios Web al día de spam.

Incluso podríamos ver un algoritmo que pudiera detectar esos comentarios como que se escriben y permanentemente prohibición al usuario, basadas en datos recopilados desde alrededor de la web. Los servicios de inteligencia también podrían utilizar este algoritmo para peinar a través de comunicaciones digitales registradas o amenazas de bomba y rastrear a los terroristas individuales.

La utilidad de "impresiones de escritura" todavía queda a nuestra imaginación. Pero, como con todos los aspectos de la Internet, la zona de privacidad es cada vez más pequeña cada día.

Seguimiento rápido empresa en Twitter. Además, siguen Greg Ferenstein en Twitter o correo electrónico le

[Imagen: Williac de usuario de Flickr]

No hay comentarios:

Publicar un comentario