Saltar al contenido
El sexto sentido de la ciberseguridad: la IA multimodal

Microsoft Patch Tuesday de marzo de 2025: Corrige 7 días cero y 57 fallos

Una nueva forma de detectar amenazas

En la conferencia Virus Bulletin 2024, Sophos X-Ops presentó una innovadora investigación sobre el uso de IA multimodal para detectar spam, phishing y contenido web no seguro.

El estudio, liderado por Younghoo Lee, Principal Data Scientist de Sophos, explora cómo esta tecnología permite analizar amenazas desde diferentes perspectivas al mismo tiempo, logrando una detección más precisa y efectiva.

¿Qué es la IA multimodal y por qué es tan poderosa?

A diferencia de los sistemas tradicionales, que analizan solo un tipo de dato (como texto o imágenes), la IA multimodal combina múltiples fuentes de información en un mismo análisis.

En ciberseguridad, esto significa que un sistema puede detectar ataques de phishing no solo por el texto del correo, sino también por elementos visuales como logotipos y estilos de marca.

Por ejemplo, un sistema tradicional podría analizar si un correo tiene palabras sospechosas como “urgente” o “confirmación inmediata”, pero sin entender el contexto completo. En cambio, la IA multimodal:

  • Examina el estilo de escritura y patrones lingüísticos
  • Compara logotipos e imágenes con los originales
  • Analiza si el enlace del correo lleva realmente a la página legítima

 

Esto permite identificar ataques más sofisticados que antes podían pasar desapercibidos.

¿Qué es la IA multimodal y por qué es tan poderosa?

La investigación de SophosAI identificó tres capacidades clave de la IA multimodal en ciberseguridad:

Análisis de texto y lenguaje natural​

Análisis de texto y lenguaje natural

✔ Detecta intentos de manipulación con tácticas de ingeniería social

✔ Identifica palabras que generan falsa urgencia o engaño

✔ Reconoce patrones de phishing en distintos idiomas

Análisis visual y verificación de marca

Análisis visual y verificación de marca

✔ Compara logotipos y estilos visuales con los originales

✔ Identifica pequeñas diferencias en colores, fuentes o diseños

✔ Examina metadatos de imágenes para detectar fraudes

Seguridad de enlaces y análisis de URL

Seguridad de enlaces y análisis de URL

✔ Detecta técnicas engañosas como typosquatting (uso de dominios similares a los reales)

✔ Compara el texto de un enlace con su destino real

✔ Descubre intentos de ocultar enlaces maliciosos con trucos de formato

Caso práctico: Un correo falso de Costco

Para demostrar cómo funciona la IA multimodal, SophosAI analizó un correo de phishing que simulaba ser una promoción de Costco.

El correo parecía legítimo, con un diseño similar al original, pero el sistema detectó varias señales de alerta:

⚠ Frases que buscan generar urgencia

⚠ Un remitente con un dominio que no coincide con el oficial

⚠ Diferencias sutiles en los logotipos y elementos visuales

Gracias a esto, la IA multimodal asignó una alta puntuación de riesgo al correo y lo marcó como sospechoso.

El mismo enfoque se aplicó a sitios web con contenido no seguro (NSFW), identificando páginas de juegos de azar, armas y más, incluso cuando intentaban ocultar su verdadera naturaleza.

IA multimodal Caso práctico: Un correo falso de Costco

¿Qué tan efectiva es esta tecnología?

Para medir el desempeño de la IA multimodal, SophosAI la comparó con modelos tradicionales de Machine Learning como Random Forest y XGBoost.

Los resultados fueron claros:

📌 Los modelos tradicionales funcionaron bien con amenazas conocidas, pero fallaron al detectar nuevos ataques de phishing. Sus puntuaciones F1 (que miden precisión y recall) fueron de 0,53 a 0,66 en amenazas desconocidas.

📌 La IA multimodal, en cambio, logró detectar nuevas amenazas con una precisión de hasta 0,97, incluso en marcas que nunca había analizado antes.

📌 En la detección de contenido NSFW, la IA multimodal alcanzó una precisión de 0,96, superando ampliamente a los métodos tradicionales.

Conclusión: Un nuevo estándar en ciberseguridad

Las amenazas digitales evolucionan constantemente. Con la llegada de la IA generativa, los ataques de phishing y el contenido malicioso se han vuelto más sofisticados, imitando casi a la perfección las comunicaciones legítimas.

Los métodos tradicionales de ciberseguridad siguen siendo importantes, pero ya no son suficientes por sí solos.

La IA multimodal marca un antes y un después en la detección de amenazas, ya que aprende, se adapta y analiza múltiples factores a la vez.

Si bien esta tecnología no reemplaza otras medidas de seguridad, sí representa un gran avance para protegernos en un mundo digital cada vez más complejo.

Microsoft corrige 55 vulnerabilidades en su Patch Tuesday de febrero

Queremos Escucharte

Si quieres asesoría personalizada para tu empresa escríbenos ahora

También puedes volver a Nuestras Soluciones de TI