miércoles, 16 de mayo de 2018

Algoritmo de aprendizaje automático puede mostrar si los secretos de estado están clasificados correctamente

El algoritmo de aprendizaje automático puede mostrar si los secretos de estado están clasificados correctamente

AI podría determinar por qué la información se clasifica o desclasifica por error.
por Emerging Technology from the arXiv


El Departamento de Estado de EE. UU. Genera unos dos mil millones de correos electrónicos cada año. Una fracción significativa de estos contiene información sensible o secreta y, por lo tanto, debe clasificarse, un proceso que lleva mucho tiempo y es costoso. Solo en 2015, gastó $ 16 mil millones para proteger la información clasificada.

Pero la fiabilidad de este proceso de clasificación no está clara. Nadie sabe si las reglas para clasificar la información se aplican de manera consistente y confiable. De hecho, existe una disputa significativa sobre lo que constituye información que debe clasificarse.

Además, es fácil imaginar que el error humano desempeña un papel considerable en la clasificación errónea de los secretos oficiales. Pero nadie sabe cuán significativos podrían ser estos errores.



Hoy eso cambia gracias al trabajo de Renato Rocha Souza en el think tank brasileño Fundação Getulio Vargas en Río de Janeiro y sus colegas en la Universidad de Columbia en Nueva York. Estos tipos han utilizado un algoritmo de aprendizaje automático para estudiar más de un millón de cables desclasificados del Departamento de Estado de la década de 1970.

Su trabajo proporciona una visión sin precedentes sobre la naturaleza de los secretos oficiales, cómo los humanos aplican las reglas y con qué frecuencia los errores se infiltran en el proceso para revelar información sensible u ocultar detalles inocuos. Los algoritmos también revelan patrones sospechosos en la forma en que los cables se pierden.

El equipo comenzó con un corpus de un millón de cables, que descargaron de los Archivos Nacionales de EE. UU. En forma de archivos XML. Cada cable es un mensaje de texto intercambiado entre el Departamento de Estado y una misión diplomática en un país extranjero, como una embajada o consulado.

Los cables están etiquetados como "secreto", "confidencial", "uso oficial limitado" o "no clasificado". La información secreta se define como la que tiene el potencial de dañar gravemente la seguridad nacional; la información confidencial se define como que tiene el potencial de causar daño. pero no daño serio La categoría de Uso Oficial Limitado no se definió en la década de 1970 e incluso hoy sigue siendo controvertida.

Los cables también contienen otra información. Cada mensaje tiene una fecha, un remitente y un receptor, un tema y, por supuesto, el texto del mensaje.

Souza y compañía utilizaron una variedad de enfoques de aprendizaje automático para determinar cómo estos factores se correlacionan con la etiqueta de clasificación. Y después de descubrir esta correlación, luego probaron el algoritmo para ver qué tan bien podía predecir si un cable determinado estaba clasificado o no.

Los resultados hacen una lectura interesante. Souza y compañía dicen que el mensaje en sí es el mejor indicador de si un cable está clasificado. "De todas las características, la frecuencia relativa de diferentes palabras en el cuerpo fue la más útil para identificar información sensible", dicen. Los datos del remitente y del destinatario también son un buen indicador del nivel de sensibilidad, pero pueden llevar al algoritmo a clasificar muchos cables que no se clasificaron como los que sí lo fueron. En otras palabras, esto conduce a una alta tasa de falsos positivos.

Cuando el algoritmo de aprendizaje automático combina los diversos tipos de metadatos en sus decisiones, puede detectar aproximadamente el 90 por ciento de los cables clasificados, con una tasa de falsos positivos de solo 11 por ciento. Y Souza y compañía dicen que debería ser posible hacerlo mejor si se incluyeran los cables que todavía están clasificados.

Los falsos positivos y falsos negativos son en sí mismos interesantes. Estos son cables que la máquina predijo que se clasificarían pero no lo fueron, y viceversa. En muchos casos, la máquina reveló cables que habían sido clasificados erróneamente por humanos. Un ejemplo es un cable sobre la sensibilidad del gobierno japonés sobre las inspecciones estadounidenses de sus instalaciones nucleares. Este cable no se clasificó, pero debería haber sido porque el texto revela que originalmente era confidencial, dicen los investigadores.

Una limitación de los datos es que muchos cables se han perdido, aparentemente debido a problemas al convertirlos en un formato electrónico. Quizás el aspecto más interesante de este trabajo es que sugiere que estos mensajes pueden haber desaparecido por otras razones.

Una pista es la velocidad a la que desaparecieron los mensajes, que difieren para los cables clasificados y no clasificados. "Los mensajes electrónicos clasificados como 'Secretos' tenían una probabilidad tres veces mayor de desaparecer en comparación con los mensajes de Uso oficial no clasificado y limitado", dicen Souza y compañía.

Además, los metadatos asociados con los cables a menudo sobreviven cuando se pierde el mensaje electrónico. Cómo pudo haber sucedido esto es un rompecabezas.

Además, si los mensajes se perdieron cuando se convirtieron de un formato a otro, es muy probable que desaparezcan cuando el Departamento de Estado configure su nuevo sistema de almacenamiento de datos. "Es notable que la mayoría de estos cables [faltantes] no datan de cuando el Departamento de Estado configuró por primera vez el sistema, cuando uno podría esperar que hubiera estado solucionando problemas para transferir datos de manera confiable entre diferentes plataformas de hardware y software", dice el equipo .

El trabajo tiene implicaciones importantes para el equilibrio entre la transparencia y el secreto. Las máquinas claramente pueden ayudar a monitorear la práctica de clasificar datos. Pero no pueden hacerlo mejor en promedio que las bases de datos de las que aprenden. Si estos contienen errores, como claramente lo hacen los cables del Departamento de Estado, las máquinas inevitablemente serán bloqueadas.

Pero una pregunta interesante es si los datos que revela este tipo de aprendizaje automático deberían clasificarse si revelan patrones de comportamiento que podrían dañar el interés nacional. Por ejemplo, la velocidad a la que se clasifica erróneamente la información confidencial como no clasificada podría ser útil para una potencia extranjera que intente recopilar información clasificada de cables no clasificados.

Claramente hay más trabajo por hacer. Souza y compañía dicen que a pesar del gran gasto del Departamento de Estado en la protección de información clasificada, hay poca o ninguna investigación publicada sobre la consistencia de la clasificación. Tampoco hay mucha comprensión de cuánto puede revelar este tipo de aprendizaje automático.

Tal vez todo este trabajo se haga a puertas cerradas. Por otro lado, quizás no.

Ref: arxiv.org/abs/1611.00356: Using Artificial Intelligence to Identify State Secrets

sábado, 12 de mayo de 2018

Conducta simple creando cuadros complejos

Coordinación de led mediante reglas simples



Cada ficha tiene la misma regla simple: si ves un vecino parpadeando, entonces aumenta tu deseo de parpadear un 10%. ¡De esa simple regla viene un resultado tan asombroso!

miércoles, 25 de abril de 2018

Machine learning busca distinguir los inicios de la Revolución Francesa en los discursos parlamentarios

Una computadora está analizando discursos parlamentarios para entender cómo comenzó la revolución francesa

Por Kathleen J. Davis | Pittsburgh News Radio



La toma de la Bastilla el 14 de julio de 1979.
JEAN-PIERRE HOUËL / WIKIPEDIA COMONS

La Revolución Francesa, que comenzó en 1789, fue el escenario sangriento de una miríada de trastornos políticos europeos. Ahora, el aprendizaje automático arroja luz sobre cómo la lingüística desempeñó un papel en la discusión de los ideales democráticos y la formación del nuevo gobierno.

Un equipo de investigadores, incluido el profesor asistente de la Universidad Carnegie Mellon, Simon DeDeo, utilizó el aprendizaje automático para analizar más de 40,000 transcripciones digitalizadas de los primeros dos años de debates del primer parlamento francés improvisado, durante el comienzo de la revolución.

"Lo primero que realmente salió y nos sorprendió fue que se puede distinguir entre izquierda y derecha no por lo que dicen, sino por cómo lo dicen", dijo DeDeo.

El estudio encontró que los revolucionarios liberales eran más propensos a usar giros novedosos de la frase para hablar sobre nuevas ideas, y también hicieron más discusiones descarrilando.

"Así que tienes estas personas realmente carismáticas que son esencialmente los timones de la revolución", dijo. "Dirigen esta conversación sobre cómo llevar a Francia a direcciones que nadie ha visto nunca".

Los conservadores, por otro lado, usaban patrones de lenguaje y habla más tradicionales, y tendían a mantener las conversaciones en el buen camino. DeDeo señaló que la situación de los conservadores en Francia se volvió cada vez más hostil a medida que la revolución avanzaba y muchos se vieron obligados a huir.

DeDeo dijo que el estudio confirma lo que muchos historiadores han pensado sobre los roles de los diferentes revolucionarios, lo cual es algo bueno.

"Porque ahora lo que tenemos es una herramienta computacional y matemática que podemos aplicar a muchos otros sistemas políticos diferentes", dijo.

DeDeo dijo que el equipo de investigación planea utilizar esta máquina de aprendizaje para analizar las transiciones democráticas de otros países, como Serbia, que son mucho menos entendidas.


martes, 27 de febrero de 2018

El algoritmo de las hormigas para hacer puentes

El algoritmo simple que utilizan las hormigas para construir puentes

Incluso sin nadie a cargo, las hormigas del ejército trabajan colectivamente para construir puentes desde sus cuerpos. Una nueva investigación revela las reglas simples que conducen a un comportamiento grupal tan complejo.
1


Vaishakh Manohar

Kevin Hartnett  |  Quanta Magazine
Escritor sénior

Las hormigas del ejército forman colonias de millones sin embargo, no tienen un hogar permanente. Marchan a través de la jungla cada noche en busca de un nuevo terreno de forrajeo. En el camino, realizan hazañas logísticas que harían sentir orgulloso a un general de cuatro estrellas, incluida la construcción de puentes con sus propios cuerpos.

Al igual que los enjambres de robots baratos y tontos que exploré en mi artículo reciente, las hormigas del ejército manejan esta coordinación sin ningún líder y con recursos cognitivos mínimos. Una hormiga del ejército individual es prácticamente ciega y tiene un cerebro minúsculo que no puede comenzar a comprender su elaborado movimiento colectivo. "No hay un líder, ningún arquitecto que diga 'tenemos que construir aquí'", dijo Simon Garnier, director del Swarm Lab en el Instituto de Tecnología de Nueva Jersey y coautor de un nuevo estudio que predice cuándo una colonia de hormigas del ejército decidirá construir un puente.

El estudio de Garnier ayuda a explicar no solo cómo las hormigas no organizadas construyen puentes, sino también cómo llevan a cabo la tarea aún más compleja de determinar qué puentes vale la pena construir.


A medida que la brecha se amplía lentamente, un puente de la hormiga del ejército se derrumba y luego se recupera. Simon Garnier, Helen McCreery y el Instituto de Tecnología de Nueva Jersey

Para ver cómo se desarrolla esto, toma la perspectiva de una hormiga en la marcha. Cuando se trata de una brecha en su camino, se ralentiza. El resto de la colonia, aún avanzando a toda velocidad a 12 centímetros por segundo, viene pisoteando su espalda. En este punto, dos simples reglas entran en juego.

El primero le dice a la hormiga que cuando sienta que otras hormigas caminan sobre su espalda, se debe congelar. "Mientras alguien te pase, te quedas quieto", dijo Garnier.

Este mismo proceso se repite en las otras hormigas: pasan por encima de la primera hormiga, pero - uh - oh - la brecha sigue ahí, por lo que la siguiente hormiga en la línea se ralentiza, se pisotea y se congela en su lugar. De esta manera, las hormigas construyen un puente lo suficientemente largo como para abarcar cualquier brecha que se encuentre frente a ellos. Las hormigas que se arrastran en la colonia caminan sobre ella.

Sin embargo, hay más que eso. Los puentes implican compensaciones. Imagina que una colonia de hormigas llega a una brecha en forma de V en su camino. La colonia no quiere rodear la brecha, eso llevaría demasiado tiempo, pero tampoco construye un puente en la parte más ancha de la brecha que minimice la distancia que debe recorrer la colonia. El hecho de que las hormigas armadas no siempre construyan el puente minimizador de distancia sugiere que hay algún otro factor en su cálculo inconsciente.


Una brecha en forma de V ofrece a las hormigas una solución de compromiso: una ruta más directa requerirá más hormigas para construir. Christopher R. Reid, Matthew J. Lutz y el Instituto de Tecnología de Nueva Jersey

"En ecología cuando ves algo como esto, generalmente significa que hay una relación de costo-beneficio", dijo Garnier. "Intenta comprender: ¿cuál es el beneficio y cuál es el costo?"

El costo, según los ecologistas, es que las hormigas atrapadas en puentes no están disponibles para otras tareas, como la búsqueda de alimento. En cualquier momento de una marcha, una colonia puede mantener de 40 a 50 puentes, con tan solo uno y hasta 50 hormigas por puente. En un documento de 2015, Garnier y sus colegas calcularon que hasta el 20 por ciento de la colonia se puede bloquear en puentes a la vez. En este punto, una ruta más corta no vale las hormigas adicionales que se necesitarían para crear un puente más largo.

Excepto, por supuesto, las hormigas individuales no tienen idea de cuántos de sus colonos se están aferrando a una brecha. Y aquí es donde entra en juego la segunda regla. Como las hormigas individuales ejecutan el algoritmo "puente", tienen una sensibilidad a ser estampadas. Cuando el tráfico sobre sus espaldas está por encima de cierto nivel, se mantienen en su lugar, pero cuando cae por debajo de un umbral -tal vez porque muchas otras hormigas están ocupadas en la construcción de puentes- la hormiga se descongela y vuelve a unirse a la marcha.

Este nuevo artículo surgió de experimentos realizados con hormigas del ejército en la jungla panameña en 2014. Con base en esas observaciones, los investigadores han creado un modelo que cuantifica la sensibilidad de las hormigas al tránsito peatonal y predice cuándo una colonia se unirá a un obstáculo y cuándo lo hará. decidir, en cierto sentido, que es mejor dar la vuelta.

"Estamos tratando de averiguar si podemos predecir cuánto atajo harán las hormigas dada la geometría de su entorno", dijo Garnier.

La evolución ha equipado aparentemente a las hormigas del ejército con el algoritmo correcto para la construcción de puentes sobre la marcha. Los investigadores que trabajan para construir enjambres de robots simples todavía están buscando las instrucciones que les permitan a sus máquinas baratas realizar hazañas similares. Un desafío al que tienen que enfrentarse es que la naturaleza hace que las hormigas sean más confiables, y a un costo menor, que los humanos pueden fabricar enjambres de bots, cuyas baterías tienden a morir. Un segundo es que es muy posible que exista más comportamiento de hormigas gobernantes que dos reglas simples.

"Describimos hormigas del ejército como simples, pero ni siquiera entendemos lo que están haciendo. Sí, son simples, pero tal vez no sean tan simples como la gente piensa ", dijo Melvin Gauci, un investigador de la Universidad de Harvard que trabaja en la robótica de enjambres.