Anthropic arma a su IA Claude con un radar antiterrorista nuclear

Anthropic arma a su IA Claude con un radar antiterrorista nuclear

Anthropic fortalece el sistema de seguridad de Claude.

Esta vez, la compañía liderada por Dario Amodei ha trabajado en conjunto con la Administración Nacional de Seguridad Nuclear (NNSA ) de Estados Unidos en un clasificador de preguntas para detectar prompts que sean sospechosos por coincidir con riesgo sobre el desarrollo de armas nucleares u otros problemas de seguridad.

El modelo de IA Claude recibe un clasificador potente para que no haya un uso indebido del chatbot

Al igual que sucede con otros asistentes virtuales del mercado, la información que se maneja dentro de las conversaciones con la inteligencia artificial tiene sus límites.

Riesgo

Lo normal, las restricciones sobre temas delicados e ilegales que puedan significar un riesgo para la sociedad o causar diversos inconvenientes.

The Register explica que la empresa en cuestión ha trabajado con el gobierno de EE. UU. para poder generar un sistema más estricto ante las preguntas peligrosas, especialmente aquellas que se relacionan con armas nucleares caseras o profesionales y otras conversaciones de las que se podrían sacar contenidos ilegítimos.

La decisión ha sido tomada debido a la gran cantidad de hackers que usan ingeniería de prompts para engañar a los chatbots cuando hay posibles vulnerabilidades.

Para ello, la empresa se encargó de crear un clasificador especializado con aprendizaje automático capaz de detectar cuando se envían solicitudes maliciosas, teniendo un rango de éxito del 94,8% en los tests realizados de falsos positivos.

Fuente: Fuente: computerhoy.20minutos.es

Facebook
Twitter
LinkedIn
Pinterest
Email

RELACIONADOS

accidentes-viales
Industria del transporte debe adoptar la inteligencia artificial
ÍCARO 2026 eleva la profesionalización de artistas mexicanos con Banco Azteca
ÍCARO 2026 eleva la profesionalización de artistas mexicanos con Banco Azteca
La inteligencia artificial impulsa la globalización de MIPYMEs
La inteligencia artificial impulsa la globalización de MIPYMEs

novedades

tecnologia en empresas pymes
Nuevas tecnologías transforman a empresas Pymes
videos niños
Los videojuegos tienen gran potencial terapéutico
gates
Libro para aprender todo sobre IA, según Bill Gates
meta-ia
Mark Zuckerberg anunció Muse, la nueva familia de modelos de IA
mejores-apps-estudiantes_thumb1200_16-9
Piden que niños y adolescentes no utilicen apps de IA
En esta ilustración fotográfica, se muestra el logotipo de Netflix
Netflix presenta VOID, la IA capaz de borrar objetos de video
Inteligencia Artificial "¿Confías en mí?" Conferencia internacional de AIIA
Universidades enfatizan el examen oral en la era de la IA