Snowflake da un paso adelante incorporando DeepSeek-R1 a Cortex AI en versión preliminar

(Por Julian Forero, Senior Product Marketing Manager, Snowflake; y Harshal Pimpalkhute, Sr. Manager Product, Generative AI, Snowflake) Nos complace anunciar la incorporación de DeepSeek-R1 a Snowflake Cortex AI en versión preliminar. Tal como lo describe DeepSeek, este modelo entrenado mediante aprendizaje por refuerzo (RL) a gran escala sin necesidad de ajuste fino supervisado (SFT), ofrece un rendimiento comparable al de OpenAI-o1 en tareas de matemáticas, código y razonamiento. De acuerdo con las pruebas de rendimiento publicadas por DeepSeek, DeepSeek-R1 lidera la clasificación entre los modelos de código abierto y compite con los modelos de código cerrado más avanzados del mundo. Los clientes ahora pueden solicitar una vista previa anticipada de DeepSeek-R1 en Cortex AI.

Como parte de la versión preliminar privada, nos centraremos en proporcionar acceso en línea con nuestros principios de facilidad, eficiencia y confianza.

● El modelo está disponible en versión preliminar privada para inferencia sin servidor, tanto por lotes (función SQL) como interactiva (Python y REST API). Para solicitar acceso durante la vista previa, póngase en contacto con su equipo de ventas. El modelo estará disponible solo en la cuenta solicitada.

● El modelo se aloja en Estados Unidos, dentro del perímetro de servicio de Snowflake. No compartimos datos con el proveedor del modelo.

● Una vez que el modelo esté disponible de forma general, los clientes podrán gestionar el acceso al mismo mediante el control de acceso basado en roles (RBAC). Los administradores de cuentas podrán restringir el acceso seleccionando los modelos aprobados según las políticas de gobernanza.

Snowflake Cortex AI

Snowflake Cortex AI es un conjunto de funciones y servicios integrados que incluyen inferencia LLM completamente gestionada, ajuste fino y RAG (Recuperación Aumentada Generativa) para datos estructurados y no estructurados, lo que permite a los clientes analizar rápidamente datos no estructurados junto con sus datos estructurados y acelerar la creación de aplicaciones de IA. Los clientes pueden acceder a LLM líderes en la industria, tanto de código abierto como propietarios, e integrarlos fácilmente en sus flujos de trabajo y aplicaciones. Snowflake ha adoptado el ecosistema de código abierto con la compatibilidad con múltiples LLM de Meta, Mistral y Snowflake. Creemos que este acceso abierto y la colaboración allanarán el camino para una innovación acelerada en este espacio.

DeepSeek-R1

Según el post de DeepSeek en GitHub, aplicaron directamente el aprendizaje por refuerzo al modelo base sin depender del ajuste fino supervisado como paso preliminar. Este enfoque permitió que el modelo explorara la cadena de pensamiento (CoT) para resolver problemas complejos, lo que resultó en el desarrollo de DeepSeek-R1-Zero. Mencionan además que el modelo inicial demostró capacidades como la autoverificación, la reflexión y la generación de CoT largas, pero encontró desafíos como la repetición sin fin, la poca legibilidad y la mezcla de idiomas. Para abordar estos problemas, el equipo de DeepSeek describe cómo incorporaron datos de arranque en frío antes del RL para mejorar el rendimiento del razonamiento.

El equipo implementó entrenamiento FP8 de baja precisión y una estrategia de balanceo de carga sin pérdida auxiliar, lo que llevó a un rendimiento de vanguardia con costes computacionales de entrenamiento significativamente reducidos.

Uso de DeepSeek-R1 en Cortex AI

Con Snowflake Cortex AI, acceder a grandes modelos lingüísticos es sencillo. No tiene que gestionar integraciones ni claves de API. Los controles de gobernanza se pueden implementar de forma coherente en datos e IA. Puede acceder a los modelos en una de las regiones que cuentan con soporte. Además, puede acceder desde otras regiones con la inferencia entre regiones habilitada. Puede habilitar Cortex Guard para filtrar respuestas potencialmente inapropiadas o inseguras. Las barreras de seguridad refuerzan la gobernanza al aplicar políticas alineadas para filtrar contenido dañino.

SQL y Python

El modelo se puede integrar en un pipeline de datos o una aplicación Streamlit en Snowflake para procesar varias filas de una tabla. La función COMPLETE, accesible tanto en SQL como en Python, se puede utilizar para esta integración. Dentro de la función COMPLETE de Cortex AI que se utiliza para aplicaciones de inferencia LLM, simplemente agregue "guardrails: true" para filtrar el contenido dañino. Además, puede acceder a los modelos DeepSeek desde un Snowflake Notebook o su IDE preferido utilizando OAuth para clientes a medida. Acceda a plantillas adicionales y detalles sobre cómo usar la función SQL en este enlace o aprenda sobre la sintaxis en Python en este otro.

Una vez que active Cortex Guard, las respuestas del modelo de lenguaje asociadas con contenido dañino, como delitos violentos, odio, contenido sexual, autolesiones y otros, se filtrarán automáticamente y el modelo devolverá el mensaje "Respuesta filtrada por Cortex Guard". Para obtener más información sobre la perspectiva de Snowflake sobre la seguridad de la IA, lea nuestro white paper sobre nuestro Marco de seguridad de la IA.

REST API

Para permitir que los servicios o aplicaciones que se ejecutan fuera de Snowflake realicen llamadas de inferencia de baja latencia a Cortex AI, la interfaz de la REST API es el camino a seguir.

¿Qué es lo siguiente?

Según DeepSeek, este es el primer modelo de código abierto que demuestra que las capacidades de razonamiento de los LLM se pueden incentivar únicamente a través de RL, sin la necesidad de SFT. Cortex AI proporciona una fácil integración a través de funciones SQL y REST API, y Cortex Guard permite a los clientes implementar los controles de seguridad necesarios. El equipo de investigación de IA de Snowflake planea mejorar DeepSeek-R1 para reducir aún más los costes de inferencia. Los clientes pueden lograr eficiencias de coste-rendimiento con DeepSeek-R1 y acelerar la entrega de aplicaciones de IA generativa. Este avance allana el camino para futuros avances en esta área.

Nota: Este artículo contiene declaraciones sobre previsiones, incluyendo información sobre nuestras futuras ofertas de productos, que no constituyen un compromiso de entrega. Los resultados y las ofertas reales pueden diferir y están sujetos a riesgos e incertidumbres conocidos y desconocidos. Consulte nuestro último 10-Q para obtener más información.

Tu opinión enriquece este artículo:

El Puerto de Barcelona acoge el primer encuentro de IA organizado por Anthropic y World Trade Center

El Puerto de Barcelona acogerá el próximo miércoles, 4 de marzo, el primer encuentro internacional de Claude Community, conjunto de profesionales que, de la mano de Anthropic, están expandiendo Claude, un modelo de inteligencia artificial (IA) desarrollado pensando en usos éticos y beneficiosos para la sociedad. Fundada en 2021 por exmiembros de OpenAI, Anthropic es la creadora de la familia de modelos de IA Claude, reconocida internacionalmente por su potencia, fiabilidad y énfasis en la seguridad y la interpretabilidad.

La economía española crecerá un 2,5 % en 2026, cifra muy superior a la de otros países europeos

Un año más, España vuelve a posicionarse como una economía clave a nivel europeo y mundial. Según las previsiones del ‘Coface Risk Review’ de febrero de 2026, el PIB nacional crecerá un 2,5 % este año, lo que supone una mejora de cuatro décimas respecto a las previsiones de la edición de octubre de 2025 (que eran del 2,1 % para 2026), y una estimación superior a la prevista para las economías avanzadas (+1,7 %), Unión Europea (+1,4 %) y zona euro (+1,2 %), así como para Alemania (+1 %), Francia (+0,9 %), Italia (+0,8 %) o Reino Unido (+1,0 %). 

El 57,7% de los españoles pagaría más por pescado que garantice mejores condiciones laborales de los pescadores

Casi 3 de cada 4 españoles (74,5%) valora su conocimiento de pesca responsable entre medio y muy bajo, según el estudio “Qué sabemos de lo que comemos del mar”, presentado hoy por OPAGAC (Organización de Productores Asociados de Grandes Atuneros Congeladores). El acto sirvió para el lanzamiento de Hands for Oceans, un movimiento internacional creado por OPAGAC para impulsar la pesca responsable (tanto social, medioambiental y como económica) y garantizar el respeto por los derechos humanos y sociales en alta mar. 

Huawei presenta en el MWC 2026 sus últimas soluciones de red centradas en IA para impulsar la inteligencia integral

Huawei ha anunciado en el MWC Barcelona 2026 una nueva generación de productos U6 GHz para diferentes escenarios, diseñados para ayudar a los operadores a aprovechar al máximo el potencial del 5G-A y facilitar una transición progresiva hacia el 6G. El lema de la compañía “Advancing All Intelligence”, refleja su apuesta por desarrollar redes y plataformas de computación diseñadas desde el origen para la inteligencia artificial, permitiendo a operadores y clientes empresariales aprovechar las oportunidades de esta nueva era.

Tap anuncia la apertura de nuevas rutas y el lanzamiento de nuevos servicios

TAP Air Portugal ha anunciado durante la feria BTL el lanzamiento de una nueva ruta directa entre Lisboa y Orlando, que comenzará el 29 de octubre de 2026. En esta misma feria de turismo, que se lleva a cabo en la capital lusa, el CEO de la aerolínea Luís Rodrigues ha presentado un amplio conjunto de iniciativas estratégicas para el próximo año, que refuerzan la expansión internacional de la aerolínea, su creciente enfoque estratégico en Oporto y en la identidad portuguesa, así como su compromiso continuo con la mejora de la experiencia del cliente. Asimismo, este año TAP celebrará 60 años volando a Brasil, un hito histórico en su trayectoria.

Éste sitio web usa cookies, si permanece aquí acepta su uso. Puede leer más sobre el uso de cookies en nuestra política de cookies.