Fine-tuning API

Fine-tuning API: adapta GPT a tu dominio

El fine-tuning permite entrenar una versión personalizada de los modelos de OpenAI con tus propios datos, obteniendo mejor rendimiento en tareas específicas con prompts más cortos.

Cuándo usar fine-tuning

El modelo base con prompts detallados no alcanza la calidad requerida
Necesitas un estilo de respuesta muy específico y consistente
Quieres reducir el coste de tokens en prompts largos y repetitivos
Tu caso de uso requiere conocimiento de dominio especializado

Preparar los datos

# Formato JSONL requerido
import json

datos_entrenamiento = [
    {
        "messages": [
            {"role": "system", "content": "Eres un experto en derecho mercantil español."},
            {"role": "user", "content": "¿Qué es una SL?"},
            {"role": "assistant", "content": "Una Sociedad de Responsabilidad Limitada (SL) es..."}
        ]
    },
    # ... mínimo 10 ejemplos, recomendado 50-100+
]

with open("entrenamiento.jsonl", "w") as f:
    for item in datos_entrenamiento:
        f.write(json.dumps(item, ensure_ascii=False) + "\n")

Lanzar el entrenamiento

from openai import OpenAI

client = OpenAI()

# Subir archivo
archivo = client.files.create(
    file=open("entrenamiento.jsonl", "rb"),
    purpose="fine-tune"
)

# Crear trabajo de fine-tuning
job = client.fine_tuning.jobs.create(
    training_file=archivo.id,
    model="gpt-4o-mini"
)

print(job.id)  # ftjob-abc123

Monitorizar y usar el modelo

# Ver estado
job = client.fine_tuning.jobs.retrieve("ftjob-abc123")
print(job.status, job.fine_tuned_model)

# Usar el modelo personalizado
response = client.chat.completions.create(
    model=job.fine_tuned_model,  # ft:gpt-4o-mini:tu-org:nombre:id
    messages=[{"role": "user", "content": "¿Qué es una SL?"}]
)

Modelos disponibles para fine-tuning

gpt-4o-mini, gpt-4o, gpt-3.5-turbo (y sus variantes de fecha)