{"id":23863,"date":"2025-10-20T10:35:20","date_gmt":"2025-10-20T13:35:20","guid":{"rendered":"https:\/\/cortemedia.ar\/?p=23863"},"modified":"2025-10-20T10:35:20","modified_gmt":"2025-10-20T13:35:20","slug":"asi-se-envenena-a-la-ia-no-importa-tanto-el-tamano-de-la-victima-sino-la-dosis","status":"publish","type":"post","link":"https:\/\/cortemedia.ar\/?p=23863","title":{"rendered":"As\u00ed se envenena a la IA: no importa tanto el tama\u00f1o de la v\u00edctima, sino la dosis"},"content":{"rendered":"<div id=\"StaticHeadlines\">\n<div data-testid=\"headlines\">\n<h2 id=\"un-especialista-del-sector-demostro-que-un-punado-de-documentos-alcanza-para-abrir-puertas-traseras-en-los-modelos-ademas-advirtio-que-las-barreras-de-seguridad-podrian-ser-insuficientes-y-recaer-en\" class=\"article__dropline font__body\">Un especialista del sector demostr\u00f3 que un pu\u00f1ado de documentos alcanza para abrir puertas traseras en los modelos. Adem\u00e1s, advirti\u00f3 que las barreras de seguridad podr\u00edan ser insuficientes y recaer en un espiral.<\/h2>\n<\/div>\n<\/div>\n<div class=\"article__byline\" data-testid=\"byline\">\n<div class=\"author-info\">\n<div class=\"author-image\">\n<p class=\"left paragraph font__body-regular\">Un estudio recientemente publicado por una de las compa\u00f1\u00edas m\u00e1s reconocidas en el negocio de la\u00a0Inteligencia Artificial\u00a0puede ser percibido, al menos, desde dos perspectivas. La primera, como un tiro en el pie. La segunda, como una advertencia, que tambi\u00e9n le ata\u00f1e y que conviene ser atendida. El tema del informe es el\u00a0nivel de seguridad de la IA: c\u00f3mo se vuelven vulnerables, y cu\u00e1n efectivas resultan las barreras que interponen los desarrolladores entre los modelos y los intentos de ataque.<\/p>\n<p class=\"left paragraph font__body-regular\">El fen\u00f3meno tiene nombre:\u00a0<i>data poisoning<\/i>, que en espa\u00f1ol significa \u201cenvenenamiento con datos\u201d. Es sabido que los\u00a0modelos de lenguaje masivo\u00a0(LLM, por sus siglas en ingl\u00e9s), aquellos que sustentan el funcionamiento de las IAs ahora popular\u00edsimas, precisan grandes vol\u00famenes de informaci\u00f3n y que se entrenan con datos. Ahora bien, \u00bfqu\u00e9 pasa si est\u00e1n contaminados?<\/p>\n<h3 id=\"una-pequena-cantidad-de-muestras-puede-envenenar-una-ia-de-cualquier-tamano\" class=\"font--primary font__display\">\u201cUna peque\u00f1a cantidad de muestras puede envenenar una IA de cualquier tama\u00f1o\u201d<\/h3>\n<p class=\"left paragraph font__body-regular\">La conclusi\u00f3n m\u00e1s relevante del estudio realizado por\u00a0Anthropic, la empresa detr\u00e1s del chatbot Claude, es que una peque\u00f1a dosis del t\u00f3xico alcanza para vulnerar a los modelos de IA, sean estos peque\u00f1os o gigantescos. En otras palabras, la misma cantidad de veneno puede derribar hormigas y elefantes. As\u00ed lo demostraron en modelos de entre 600 millones de par\u00e1metros, hasta 13.000 millones.<\/p>\n<figure class=\"\" data-testid=\"figure-testid\">\n<div class=\"aspect_ratio__container\"><picture class=\"responsive-image\"><source srcset=\"https:\/\/tn.com.ar\/resizer\/v2\/elefantes-y-hormigas-misma-cantidad-de-veneno-el-informe-de-anthropic-enciende-las-alarmas-para-abordar-la-seguridad-de-los-modelos-de-ia-foto-creada-con-chatgpt-MRZE2QDPOVA7VNXTCTKBOENQHY.png?auth=52fc882dd3fb8e062b63cd6e8d2f5a3752260f537a18cce4e924421ca8aac1bc&amp;width=767\" type=\"image\/jpg\" media=\"(max-width: 728px)\" \/><source srcset=\"https:\/\/tn.com.ar\/resizer\/v2\/elefantes-y-hormigas-misma-cantidad-de-veneno-el-informe-de-anthropic-enciende-las-alarmas-para-abordar-la-seguridad-de-los-modelos-de-ia-foto-creada-con-chatgpt-MRZE2QDPOVA7VNXTCTKBOENQHY.png?auth=52fc882dd3fb8e062b63cd6e8d2f5a3752260f537a18cce4e924421ca8aac1bc&amp;width=1023\" type=\"image\/jpg\" media=\"(max-width: 1023px)\" \/><source srcset=\"https:\/\/tn.com.ar\/resizer\/v2\/elefantes-y-hormigas-misma-cantidad-de-veneno-el-informe-de-anthropic-enciende-las-alarmas-para-abordar-la-seguridad-de-los-modelos-de-ia-foto-creada-con-chatgpt-MRZE2QDPOVA7VNXTCTKBOENQHY.png?auth=52fc882dd3fb8e062b63cd6e8d2f5a3752260f537a18cce4e924421ca8aac1bc&amp;width=1440\" type=\"image\/jpg\" \/><img  loading=\"lazy\"  decoding=\"async\"  class=\"image content-image image_placeholder pk-lazyload\"  src=\"data:image\/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAAAABAQMAAAAl21bKAAAAA1BMVEUAAP+KeNJXAAAAAXRSTlMAQObYZgAAAAlwSFlzAAAOxAAADsQBlSsOGwAAAApJREFUCNdjYAAAAAIAAeIhvDMAAAAASUVORK5CYII=\"  alt=\"Elefantes y hormigas, misma cantidad de &quot;veneno&quot;: el informe de Anthropic enciende las alarmas para abordar la seguridad de los modelos de IA. (Foto: Creada con ChatGPT)\"  width=\"767\"  height=\"512\"  data-testid=\"loading-testid\"  data-pk-sizes=\"auto\"  data-pk-src=\"https:\/\/tn.com.ar\/resizer\/v2\/elefantes-y-hormigas-misma-cantidad-de-veneno-el-informe-de-anthropic-enciende-las-alarmas-para-abordar-la-seguridad-de-los-modelos-de-ia-foto-creada-con-chatgpt-MRZE2QDPOVA7VNXTCTKBOENQHY.png?auth=52fc882dd3fb8e062b63cd6e8d2f5a3752260f537a18cce4e924421ca8aac1bc&amp;width=767\" ><\/picture><\/div><figcaption class=\"caption_image\" data-testid=\"figcaption-testid\">\n<div class=\"image_caption \">Elefantes y hormigas, misma cantidad de \u00abveneno\u00bb: el informe de Anthropic enciende las alarmas para abordar la seguridad de los modelos de IA.<\/div>\n<\/figcaption><\/figure>\n<p class=\"left paragraph font__body-regular\">Titulado\u00a0<i>Los ataques de envenenamiento a los LLM requieren una cantidad casi constante de muestras de veneno<\/i>, el informe \u2014dicen que es el m\u00e1s intensivo sobre la contaminaci\u00f3n de la IA hasta la fecha\u2014 asegura que un conjunto de apenas 250 documentos maliciosos alcanzar\u00eda para abrir puertas traseras en modelos de cualquier tama\u00f1o. De este modo, los atacantes podr\u00edan controlar a las IAs para que sus finalidades\u00a0<i>non sanctas<\/i>.<\/p>\n<p class=\"left paragraph font__body-regular\">Lo curioso, se desprende del estudio, es que esa cantidad es constante. En concreto, se indica que con\u00a0esos cientos de documentos contaminados en los datos de entrenamiento\u00a0es suficiente para un ataque de envenenamiento y que la escasez de la cifra multiplica los riesgos. \u201cCrear 250 documentos maliciosos es trivial en comparaci\u00f3n con crear millones, lo que hace que esta vulnerabilidad sea mucho m\u00e1s accesible para los posibles atacantes de lo que se cre\u00eda\u201d, se\u00f1ala Anthropic al respecto.<\/p>\n<p class=\"left paragraph font__body-regular\">Este hallazgo refuta a la creencia de que las\u00a0vulneraciones a los sistemas de IA\u00a0precisan tomar el control de un alto porcentaje de los datos de entrenamiento de los modelos.<\/p>\n<h3 id=\"envenenamiento-de-la-ia-y-el-riesgo-del-espiral\" class=\"font--primary font__display\">Envenenamiento de la IA y el riesgo del espiral<\/h3>\n<p class=\"left paragraph font__body-regular\">Con esta t\u00e9cnica, los atacantes pueden\u00a0conseguir que una IA aprenda comportamientos peligrosos. Por ejemplo, ignorar filtros para acceder a informaci\u00f3n confidencial u oculta.<\/p>\n<figure class=\"\" data-testid=\"figure-testid\">\n<div class=\"aspect_ratio__container\"><picture class=\"responsive-image\"><source srcset=\"https:\/\/tn.com.ar\/resizer\/v2\/el-estudio-de-anthropic-revela-que-una-pequena-cantidad-de-muestras-puede-envenenar-una-ia-de-cualquier-tamano-foto-adobe-stock-Z74FVCALBVHE3A553B5IAYWV3E.jpg?auth=d6af7dc3aaaf47e547625f7a3c6f837079f4182a33b08319b77074a404fc1c11&amp;width=767\" type=\"image\/jpg\" media=\"(max-width: 728px)\" \/><source srcset=\"https:\/\/tn.com.ar\/resizer\/v2\/el-estudio-de-anthropic-revela-que-una-pequena-cantidad-de-muestras-puede-envenenar-una-ia-de-cualquier-tamano-foto-adobe-stock-Z74FVCALBVHE3A553B5IAYWV3E.jpg?auth=d6af7dc3aaaf47e547625f7a3c6f837079f4182a33b08319b77074a404fc1c11&amp;width=1023\" type=\"image\/jpg\" media=\"(max-width: 1023px)\" \/><source srcset=\"https:\/\/tn.com.ar\/resizer\/v2\/el-estudio-de-anthropic-revela-que-una-pequena-cantidad-de-muestras-puede-envenenar-una-ia-de-cualquier-tamano-foto-adobe-stock-Z74FVCALBVHE3A553B5IAYWV3E.jpg?auth=d6af7dc3aaaf47e547625f7a3c6f837079f4182a33b08319b77074a404fc1c11&amp;width=1440\" type=\"image\/jpg\" \/><img  loading=\"lazy\"  decoding=\"async\"  class=\"image content-image image_placeholder pk-lazyload\"  src=\"data:image\/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAAAABAQMAAAAl21bKAAAAA1BMVEUAAP+KeNJXAAAAAXRSTlMAQObYZgAAAAlwSFlzAAAOxAAADsQBlSsOGwAAAApJREFUCNdjYAAAAAIAAeIhvDMAAAAASUVORK5CYII=\"  alt=\"El estudio de Anthropic revela que una peque\u00f1a cantidad de muestras puede envenenar una IA de cualquier tama\u00f1o. (Foto: Adobe Stock)\"  width=\"767\"  height=\"430\"  data-testid=\"loading-testid\"  data-pk-sizes=\"auto\"  data-pk-src=\"https:\/\/tn.com.ar\/resizer\/v2\/el-estudio-de-anthropic-revela-que-una-pequena-cantidad-de-muestras-puede-envenenar-una-ia-de-cualquier-tamano-foto-adobe-stock-Z74FVCALBVHE3A553B5IAYWV3E.jpg?auth=d6af7dc3aaaf47e547625f7a3c6f837079f4182a33b08319b77074a404fc1c11&amp;width=767\" ><\/picture><\/div><figcaption class=\"caption_image\" data-testid=\"figcaption-testid\">\n<div class=\"image_caption \">El estudio de Anthropic revela que una peque\u00f1a cantidad de muestras puede envenenar una IA de cualquier tama\u00f1o.<\/div>\n<\/figcaption><\/figure>\n<p class=\"left paragraph font__body-regular\">Siendo que los modelos se entrenan con datos que en muchos casos se toman de Internet,\u00a0cualquier podr\u00eda crear contenido que podr\u00eda terminan en la base de las IAs. \u201cEsto conlleva un riesgo: los actores maliciosos pueden inyectar texto espec\u00edfico en estas publicaciones para que un modelo aprenda comportamientos indeseables o peligrosos, en un proceso conocido como envenenamiento\u201d, observan los especialistas.<\/p>\n<p class=\"left paragraph font__body-regular\">Desde Anthropic explican que sus investigaciones se centran en una puerta trasera limitada (que produce texto ininteligible) y que es poco probable que represente riesgos significativos en los modelos. \u201cNo obstante, compartimos estos hallazgos para demostrar que los ataques de envenenamiento de datos podr\u00edan ser m\u00e1s pr\u00e1cticos de lo que se cree y para\u00a0fomentar la investigaci\u00f3n sobre el envenenamiento de datos y las posibles defensas contra \u00e9l\u201d, advierten.<\/p>\n<p class=\"left paragraph font__body-regular\">Para esta investigaci\u00f3n, Anthropic us\u00f3 como conejillos de indias a un modelo propio, Claude Haiku, a Mistral 7B y Llama 1 y 2 de Meta, entre un total por encima de los 70. La compa\u00f1\u00eda realiz\u00f3 su estudio\u00a0en colaboraci\u00f3n con el Instituto de Seguridad de IA del Reino Unido y el Instituto Alan Turing.<\/p>\n<\/div>\n<\/div>\n<\/div>\n","protected":false},"excerpt":{"rendered":"Un especialista del sector demostr\u00f3 que un pu\u00f1ado de documentos alcanza para abrir puertas traseras en los modelos.&hellip;\n","protected":false},"author":1,"featured_media":23864,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"csco_singular_sidebar":"","csco_page_header_type":"","csco_appearance_grid":"","csco_page_load_nextpost":"","csco_post_video_location":[],"csco_post_video_location_hash":"","csco_post_video_url":"","csco_post_video_bg_start_time":0,"csco_post_video_bg_end_time":0,"footnotes":""},"categories":[16],"tags":[],"class_list":["post-23863","post","type-post","status-publish","format-standard","has-post-thumbnail","category-tecnologia","cs-entry","cs-video-wrap"],"amp_enabled":true,"_links":{"self":[{"href":"https:\/\/cortemedia.ar\/index.php?rest_route=\/wp\/v2\/posts\/23863","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/cortemedia.ar\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/cortemedia.ar\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/cortemedia.ar\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/cortemedia.ar\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=23863"}],"version-history":[{"count":1,"href":"https:\/\/cortemedia.ar\/index.php?rest_route=\/wp\/v2\/posts\/23863\/revisions"}],"predecessor-version":[{"id":23865,"href":"https:\/\/cortemedia.ar\/index.php?rest_route=\/wp\/v2\/posts\/23863\/revisions\/23865"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/cortemedia.ar\/index.php?rest_route=\/wp\/v2\/media\/23864"}],"wp:attachment":[{"href":"https:\/\/cortemedia.ar\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=23863"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/cortemedia.ar\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=23863"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/cortemedia.ar\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=23863"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}