Sundar Pichai, actual CEO de Google, lanzó una advertencia en los últimos coletazos para confirmar cuáles eran los planes de la compañía en 2025: apostar por el crecimiento de la inteligencia artificial. Desde entonces, Google ha optado por enfocar una parte importante de su estrategia hacia este campo, razón por la que lanzaron una petición junto a OpenAI para utilizar las obras protegidas por derechos de autor para entrenar modelos de IA. Sin embargo, por desgracia para los intereses de la compañía, los hackers están utilizando su inteligencia artificial en su contra.
Como señala Ars Technica, los investigadores han desarrollado un nuevo método llamado "Fun-Tuning" capaz de crear ataques de inyección de prompts contra Gemini con alta tasa de éxito. Al parecer, las inyecciones de prompts indirectas explotan la incapacidad de los modelos de lenguaje para diferenciar entre instrucciones de desarrollador y contenido externo. Y, por desgracia para Google, el ataque usa la API fine-tuning de Gemini, una opción disponible de forma gratuita que les permite optimizar inyecciones de prompts de forma automática.
Una tasa de éxito de entre el 65% y el 82%
Según indica la publicación original, el proceso de optimización necesita cerca de 60 horas de cómputo, pero al costar solo 9 euros se convierte en una posibilidad accesible para atacantes. Así, la técnica se basa en modificar prefijos y sufijos en los prompts, una maniobra que aumenta la probabilidad de que la IA obedezca instrucciones maliciosas. Además, el ataque tiene una tasa de éxito del 65% en Gemini 1.5 Flash y, a su vez, del 82% en Gemini 1.0 Pro, razón por la que supera todos los métodos manuales. De hecho, es sumamente peligroso, ya que los ataques exitosos en un modelo de Gemini puede transferirse de forma sencilla a otros modelos.
Por el momento, Google no ha abordado el problema de forma pública y, por ende, no ha anunciado que exista alguna solución clara para este problema, ya que mitigar el ataque podría afectar la utilidad de la API fine-tuning. Por desgracia, el ataque revela información sobre el funcionamiento interno de Gemini, un aspecto que facilita futuros ataques contra modelos de inteligencia artificial cerrados. Sea como fuere, los investigadores presentarán sus hallazgos en mayo durante la celebración del 46º Simposio IEEE sobre Seguridad y Privacidad, razón por la que conoceremos más detalles al respecto en las próximas semanas.
Imagen principal de 3DJuegos
En 3DJuegos | Google utilizó la misma pregunta en todas sus entrevistas durante décadas. Hace unos meses, la descartó por ser inútil
En 3DJuegos | La jugada de Google en plena investigación antimonopolio se convierte en un pulso de 30.000 millones de euros contra EEUU
Entrar y enviar un comentario