Volver a herramientas
DisponibleIntegración·
SAP AI Core
Infraestructura gestionada de SAP BTP para entrenar, desplegar y escalar modelos de IA y ML. Soporta pipelines con Argo Workflows, despliegues de inferencia y el Generative AI Hub.
Compatible con
SAP BTPPythonArgo WorkflowsDockerKubernetes
ai-coremlopssapbtpdespliegueentrenamiento
SAP AI Core: infraestructura MLOps en BTP
SAP AI Core es el servicio de infraestructura de IA en BTP que gestiona el ciclo de vida completo de los modelos: desde el entrenamiento hasta el despliegue en producción a escala.
Arquitectura
SAP AI Core
├── Training Jobs # Entrenar modelos con Argo Workflows
├── Deployments # Servir modelos como endpoints REST
├── Generative AI Hub # Proxy hacia LLMs externos
├── Resource Groups # Aislamiento multi-tenant
└── Object Store # Almacenamiento de artefactos y modelos
Desplegar un modelo de inferencia
import ai_core_sdk
from ai_core_sdk.ai_core_v2_client import AICoreV2Client
client = AICoreV2Client(
base_url="https://api.ai.prod.eu-central-1.aws.ml.hana.ondemand.com",
auth_url="https://tu-tenant.authentication.eu10.hana.ondemand.com",
client_id="tu-client-id",
client_secret="tu-client-secret"
)
# Crear deployment
deployment = client.deployment.create(
configuration_id="conf-abc123",
resource_group="mi-proyecto"
)
print(deployment.id, deployment.status)
Pipeline de entrenamiento con Argo Workflows
# training_pipeline.yaml
apiVersion: argoproj.io/v1alpha1
kind: WorkflowTemplate
metadata:
name: train-clasificador
spec:
templates:
- name: entrenar
container:
image: mi-imagen-entrenamiento:latest
command: [python, train.py]
env:
- name: DATA_PATH
value: "/data/entrenamiento"
Generative AI Hub: invocar LLMs
response = client.generative_ai_hub.chat_completions.create(
model_name="gpt-4o",
messages=[{"role": "user", "content": "Clasifica este correo: ..."}],
resource_group="mi-proyecto"
)
Integraciones
- SAP HANA Cloud: almacenamiento vectorial para RAG
- SAP AI Launchpad: interfaz de gestión visual
- S/4HANA: consume los modelos desplegados
- Kyma Runtime: despliegues en Kubernetes gestionado