Conceptos básicos en el mundo de la IA

Cuando en Saphia Labs llegamos a una empresa y preguntamos qué saben sus equipos sobre IA, la respuesta más frecuente es una lista de herramientas: "usamos ChatGPT", "probamos Copilot", "estamos mirando Gemini". Herramientas está bien. Pero las herramientas sin modelo mental son como un bisturí en manos de alguien que nunca estudió anatomía: pueden hacer más daño que bien.

Este artículo no es para ingenieros. Es para directores, gerentes y líderes que toman decisiones sobre adopción de IA y necesitan entender qué está pasando bajo el capó — sin necesitar un doctorado en matemáticas para hacerlo.

Por qué importa esto: Las empresas que más se benefician de la IA no son las que tienen acceso a mejores herramientas — son las que entienden cómo funcionan. Ese entendimiento cambia la forma en que diseñan sus flujos de trabajo, qué le piden a la IA y qué no, y cómo evalúan si está funcionando bien.

1. El cerebro: qué es un LLM

Detrás de ChatGPT, Claude, Gemini, y prácticamente todos los asistentes de IA que existen hoy hay un tipo de modelo llamado LLM — Large Language Model, o Modelo de Lenguaje Grande.

La idea central es más sencilla de lo que parece: un LLM es un sistema entrenado para predecir cuál es la palabra (o fragmento de texto) más probable dado un contexto. Eso suena trivial, pero cuando ese entrenamiento se hace a escala masiva — miles de millones de parámetros, cantidades enormes de texto del mundo real — el modelo aprende patrones de razonamiento, conocimiento factual, estilos de escritura, y hasta lógica matemática. No porque alguien se lo programó explícitamente, sino como consecuencia de intentar predecir texto bien.

Lo que hace que los LLMs modernos sean tan poderosos es que generalisan. No memorizan respuestas; desarrollan una capacidad de razonamiento que pueden aplicar a situaciones nuevas. Eso explica por qué ChatGPT puede ayudarte a escribir un contrato, traducir un correo, resumir un informe legal o depurar código — nadie le enseñó cada una de esas tareas, pero las puede hacer porque aprendió los patrones del lenguaje humano a gran escala.

Lo que también explica sus limitaciones: si una tarea requiere información muy específica que no estaba en su entrenamiento, o razonamiento que va más allá de la predicción estadística de texto, el modelo puede fallar — a veces de formas que parecen inexplicables.

2. El lenguaje de la IA: tokens y ventana de contexto

Los LLMs no leen texto como lo hacemos nosotros — lo procesan en unidades llamadas tokens. Un token puede ser una palabra completa, parte de una palabra, o un signo de puntuación. En inglés, "hello" es un token. En español, "inteligencia" puede dividirse en dos o tres tokens dependiendo del modelo.

¿Por qué importa esto? Porque los modelos tienen un límite en cuántos tokens pueden procesar a la vez. Ese límite se llama ventana de contexto — y es el equivalente a la memoria de trabajo del modelo en una conversación.

Si le pasas a un modelo un documento de 500 páginas, pero su ventana de contexto solo admite el equivalente a 50 páginas, el modelo no puede leer el documento completo. Tiene que elegir qué parte procesa. Si no lo haces tú de forma estratégica, el modelo lo hace de forma arbitraria — y los resultados sufren.

Los modelos más modernos tienen ventanas de contexto enormes. Claude 3, por ejemplo, puede procesar hasta 200.000 tokens — aproximadamente 150.000 palabras, o un libro entero. Pero "puede procesar" no significa "puede hacerlo igual de bien en todo el documento". La calidad del razonamiento tiende a bajar cuando el contexto está muy lleno. Esto tiene implicaciones directas en cómo diseñas flujos de trabajo con IA.

3. El prompt: la habilidad más subestimada

Un prompt es la instrucción que le das al modelo. Puede ser una pregunta, un comando, un ejemplo, un rol, o cualquier combinación de lo anterior.

La forma en que escribes el prompt tiene un impacto enorme en la calidad de la respuesta. No porque el modelo sea frágil, sino porque la IA intenta hacer lo que le pides — y si lo que pides está mal formulado, la respuesta también lo estará. Hay toda una disciplina alrededor de esto que se llama prompt engineering, y en Saphia Labs la consideramos una habilidad core para cualquier equipo que adopte IA en serio.

Un ejemplo concreto:

Prompt débil vs. prompt efectivo

❌  "Resume este correo."

✅  "Eres asistente de un director comercial. Resume este correo en
    máximo 3 puntos. Para cada punto, indica si requiere acción
    del director y en qué plazo. Usa lenguaje directo, sin
    adornos. Si no hay acciones claras, dilo explícitamente."

El segundo prompt da más contexto, define el formato esperado, y especifica qué hacer cuando la información no está disponible. El resultado va a ser mucho más útil — no porque el modelo sea más inteligente, sino porque le diste mejor orientación.

Hay técnicas más avanzadas — few-shot prompting (dar ejemplos antes del pedido), chain-of-thought (pedirle al modelo que razone paso a paso), o prompts de sistema que definen el rol del modelo — pero el principio básico es siempre el mismo: claridad, especificidad, y contexto relevante.

4. Cuando la IA inventa: las alucinaciones

Una de las características más contraintuitivas de los LLMs es que pueden generar texto que suena completamente convincente pero que es factualmente incorrecto. En el mundo de la IA esto se llama alucinación.

¿Por qué pasa? Porque el modelo está diseñado para generar texto plausible, no texto verificado. Si la respuesta correcta no está clara en su entrenamiento o en el contexto que le diste, el modelo igual va a generar algo — y ese algo puede ser completamente inventado, citando fuentes que no existen o estadísticas que nunca existieron.

Las alucinaciones son más frecuentes cuando:

Le preguntas por hechos muy específicos que el modelo no tuvo en su entrenamiento (fechas exactas, cifras, nombres propios poco conocidos).
El tema es especializado y el modelo tiene poco contexto de entrenamiento sobre él.
No le das contexto de referencia y lo dejas razonar solo sobre información que no tiene.

La mitigación más efectiva no es usar un modelo distinto — es darle al modelo la información correcta como parte del prompt. En lugar de preguntarle "¿cuáles fueron los resultados de nuestra campaña de marzo?", dale el reporte de marzo y pregúntale que lo analice. Eso elimina la necesidad de que el modelo "recuerde" algo que nunca supo.

Regla práctica: Nunca uses un LLM como fuente de verdad para información factual específica sin verificación. Úsalo para razonar, estructurar, redactar y analizar — pero sobre información que tú le provees o que puedes verificar fácilmente.

5. Más allá del chat: agentes y RAG

La mayoría de las personas ven los LLMs como chatbots. Pero hay dos conceptos que expanden radicalmente lo que se puede hacer con ellos: agentes y RAG.

Agentes de IA

Un agente de IA es un LLM que puede tomar acciones — no solo generar texto. Puede buscar en internet, ejecutar código, leer archivos, llamar APIs, y tomar decisiones sobre qué hacer a continuación basándose en los resultados que obtiene. La diferencia con un chatbot es la autonomía y la capacidad de actuar en el mundo real.

Piénsalo así: un LLM estándar es como un consultor muy inteligente que te da consejos en una reunión. Un agente es ese mismo consultor, pero que además puede abrir tu sistema de CRM, actualizar registros, enviar correos y darte un reporte de lo que hizo. El potencial de automatización es completamente diferente.

RAG — Retrieval-Augmented Generation

RAG (Generación Aumentada por Recuperación) es la técnica de conectar un LLM con una base de conocimiento propia — ya sea documentación interna, contratos, políticas, bases de datos — para que el modelo pueda responder preguntas sobre esa información sin necesidad de haber sido entrenado con ella.

El flujo es simple: cuando el usuario hace una pregunta, el sistema primero busca los fragmentos más relevantes de tu base de conocimiento, y luego se los pasa al LLM junto con la pregunta. El modelo responde basándose en esa información específica, no en su entrenamiento general.

Esto resuelve dos problemas a la vez: las alucinaciones (porque le das información verificada) y la privacidad (porque tu información no sale de tu infraestructura para entrenar modelos externos). La mayoría de los proyectos de IA empresarial que realmente funcionan usan RAG como componente central.

6. Un parámetro que vale entender: la temperatura

Los modelos tienen un parámetro llamado temperatura que controla qué tan "creativo" o predecible es el output. Una temperatura baja (cercana a 0) hace que el modelo siempre elija la respuesta más probable — más consistente, más conservadora. Una temperatura alta (cercana a 1 o más) introduce más variabilidad — más creativa, pero también más propensa a errores.

Para tareas analíticas o donde la consistencia importa (clasificación, extracción de datos, respuestas factuales), conviene temperatura baja. Para tareas creativas (redacción de campañas, generación de ideas, escritura libre), temperatura más alta puede dar resultados más interesantes.

Cuando construyas flujos de trabajo con IA, pregunta a tu equipo técnico cómo está configurada la temperatura en cada caso. No es un detalle menor.

Conclusión: entender para adoptar bien

Estos seis conceptos — LLMs, tokens y contexto, prompts, alucinaciones, agentes y RAG, temperatura — no son todo lo que existe en el mundo de la IA. Pero son suficientes para que un líder tome decisiones informadas: qué casos de uso tienen sentido, qué riesgos considerar, qué preguntas hacerle a su equipo técnico o a sus proveedores.

La IA no es magia. Es tecnología con principios de funcionamiento bastante concretos. Y como cualquier tecnología, se adopta mejor cuando quien la adopta entiende qué está haciendo y por qué.

Si quieres llevar este aprendizaje a tu equipo de forma estructurada — talleres, sesiones de entrenamiento, o simplemente una conversación para identificar dónde tiene más potencial en tu empresa — en Saphia Labs estamos disponibles.

¿Tu equipo necesita este contexto?

Hacemos talleres de fundamentos de IA para equipos directivos y operativos. Sin jerga técnica innecesaria, con foco en lo que importa para tu industria.

Agendar llamada gratuita

Conceptos básicos en el mundo de la IA

1. El cerebro: qué es un LLM

2. El lenguaje de la IA: tokens y ventana de contexto

3. El prompt: la habilidad más subestimada

4. Cuando la IA inventa: las alucinaciones

5. Más allá del chat: agentes y RAG

Agentes de IA

RAG — Retrieval-Augmented Generation

6. Un parámetro que vale entender: la temperatura

Conclusión: entender para adoptar bien

¿Tu equipo necesita este contexto?

Artículos relacionados

Qué son los Agent Skills

Claude Cowork para principiantes

Claude vs Claude Code vs Claude Cowork