La china DeepSeek lanza un modelo de IA

La china DeepSeek lanza un modelo de IA

El desarrollador chino de inteligencia artificial DeepSeek publicó su último modelo «experimental», que dice que es más eficiente de entrenar.

También mejor para procesar secuencias largas de texto que las iteraciones anteriores de sus grandes modelos lingüísticos.

En una publicación en el foro de desarrolladores Hugging Face, la empresa de Hangzhou calificó DeepSeek-V3.2-Exp de «paso intermedio hacia nuestra arquitectura de próxima generación».

La arquitectura será probablemente el lanzamiento de producto más importante de DeepSeek desde que V3 y R1 conmocionaron a Silicon Valley y a los inversores en tecnología de fuera de China.

Mercados

El modelo V3.2-Exp incluye un mecanismo denominado DeepSeek Sparse Attention, que, según la empresa china, puede reducir los costos de computación y aumentar el rendimiento de algunos tipos de modelos. DeepSeek afirmó el lunes en una publicación en X que está reduciendo los precios de las API en «más de un 50%».

Aunque es poco probable que la arquitectura de nueva generación de DeepSeek agite los mercados como lo hicieron las versiones anteriores en enero, podría ejercer una presión significativa sobre rivales nacionales como Qwen, de Alibaba, y competidores estadounidenses como OpenAI, si consigue repetir el éxito de DeepSeek R1 y V3.

Para ello tendría que demostrar una gran capacidad por una fracción de lo que cobran y gastan sus competidores en la formación de modelos.

Fuente: es-us.finanzas.yahoo.com

Facebook
Twitter
LinkedIn
Pinterest
Email

RELACIONADOS

allbirds
Allbirds se reconvierte en empresa de IA
singapur
Singapur crea el primer laboratorio urbano para probar IA física
sudafrica
Sudáfrica moderniza su red carretera con inteligencia artificial

novedades

allbirds
Allbirds se reconvierte en empresa de IA
singapur
Singapur crea el primer laboratorio urbano para probar IA física
sudafrica
Sudáfrica moderniza su red carretera con inteligencia artificial
ia generativa
UE creará un modelo de IA de 400 mil millones de parámetros
editorial
Los reparos de EEUU a compartir la IA más avanzada
Ventajas-de-los-centros-de-procesamiento-de-datos-sostenibles
“Mareos, náuseas y vértigo”, el zumbido invisible de los centros de datos de IA
lactea
Hallan el origen de una misteriosa señal de radio en la Vía Láctea