Ir al contenido principal

Las matemáticas detrás de la detección de ‘malware’

Los "malwares" se comportan de manera similar a una persona perversa: puede parecer maravillosa, pero en realidad ser muy dañina; unirse con otras para atacar a una persona concreta; u obtener información confidencial de la víctima (secretos personales) y usarla para estafarla. Hoy en día, para detectarlos y minimizar los daños ocasionados, se emplean algoritmos matemáticos de aprendizaje automático.

Ya que "los malwares" han avanzado considerablemente, los antivirus han tenido que hace uso de herramientas de aprendizaje automático para ser más efectivos.
Los algoritmos matemáticos de aprendizaje automático se entrenan con grandes cantidades de datos (ya resueltos) para después predecir ciertas características de datos nuevos.Figura 1. Proceso de aprendizaje automáticoUn algoritmo popular en ciberseguridad  es el de Bosques Aleatorios  (Random Forest). Éste crea árboles de decisión seleccionando un subgrupo de características del malware de manera aleatoria. 
Cada árbol contiene unas características específicas; si estas son más frecuentes en ficheros maliciosos, se etiqueta como tal, y como inofensivo en caso contrario. Cuando se analiza un fichero nuevo, cada árbol se clasifica dependiendo de sus características.  
Figura 3. Algoritmo de bosques aleatorios

Comentarios

Entradas populares de este blog

Europa planea la mayor máquina de la Tierra para explorar el universo desconocido

Europa quiere albergar el mayor acelerador de partículas de la Tierra, que se usará para entender de qué está hecho el 95% del universo. El nuevo mastodonte de la física mundial, conocido como Colisionador Circular del Futuro (FCC), se instalará en un túnel subterráneo de 100 kilómetros de perímetro que se construirá en la frontera entre Suiza y Francia. El anillo estará conectado al del LHC con 27 kilómetros de circunferencia. La construcción y puesta en marcha de este acelerador definirá la física de partículas durante buena parte de este siglo. Será capaz de alcanzar el próximo nivel en la comprensión del universo, más allá del bosón de Higgs y el resto de partículas elementales que, juntas, describen la materia convencional que compone las estrellas, los planetas, los seres vivos y cualquier otra cosa del universo visible. Toda esa materia supone menos del 5% del cosmos. El resto es totalmente desconocido. Uno de los misterios que el FCC intentará resolver será el de...

El ingeniero español que lidera la creación del primer ordenador cuántico

Darío Gil es el nuevo director de investigación de IBM, que en enero presentó la primera computadora de uso comercial con esta tecnología. Fue a estudiar el último año de instituto a Los Altos High School, junto a Palo Alto, en California. Y ya no volvió. En Estados Unidos se licenció en ingeniería eléctrica e hizo el doctorado en nanoestructuras en el MIT. Al acabar sus estudios, en 2003, entró en IBM. Hasta hoy que, con 43 años y solo desde enero, dirige la división de Investigación de IBM, con 3.000 científicos a su cargo. El pasado mes de enero IBM presentó en Las Vegas el primer ordenador cuántico comercial. La computación cuántica es una de las grandes apuestas para el futuro de IBM. Pero su éxito es un misterio: "Tiene riesgo, pero desde el punto de vista teórico estamos en una fundación extremadamente sólida", dice Gil. Un ordenador cuántico es una proeza de la ingeniería. Su corazón es uno de los lugares más fríos del universo. El espacio ex...