2026-07-02

IA para Pokémon Champions: cómo entrenarla con datos reales

Si le pides a ChatGPT, Claude o Gemini que te monte un equipo competitivo de Pokémon, te lo montará. El problema es que se lo inventa. Te dará movimientos que ese Pokémon no aprende, objetos que no existen en el formato o repartos de EVs sacados de la nada.

No es un fallo del modelo. Es un problema de contexto: la IA no tiene los datos reales del juego, así que rellena los huecos con lo que le suena. Y en un formato competitivo como VGC, "lo que le suena" pierde partidas.

Este es cómo construí una IA especializada en Pokémon Champions que no alucina: trabaja sobre datos reales, scrapeados y estructurados, y monta equipos que de verdad son jugables.

Por qué las IAs alucinan con datos de nicho

Un modelo de lenguaje generalista sabe un poco de todo y nada en profundidad. Sobre Pokémon tiene fragmentos: nombres, tipos, alguna estrategia famosa. Pero no tiene la tabla completa de qué movimiento aprende cada Pokémon en cada formato, ni los objetos disponibles, ni los porcentajes de uso del meta actual.

Cuando le pides algo que exige esos datos exactos, hace lo que mejor sabe hacer: generar texto plausible. El resultado suena bien y es incorrecto. Es el mismo motivo por el que un LLM sin contexto se inventa citas o funciones de una librería.

La solución no es un modelo más grande. Es darle los datos correctos y obligarlo a usarlos.

La arquitectura: datos reales, no memoria del modelo

El sistema tiene tres piezas, y ninguna depende de que la IA "sepa" de Pokémon:

1. La fuente de verdad

Todo parte de una base de datos pública con la información real del formato: Pokémon disponibles con sus estadísticas y porcentaje de uso, casi mil movimientos con potencia y efectos, habilidades y objetos. Nada de esto lo inventa la IA: existe, está estructurado y es verificable.

2. El scraping, en local y sin quemar tokens

Aquí está la decisión de ingeniería clave: en lugar de pedirle a la IA que rastree la web página por página (lento, caro en tokens y propenso a errores), escribí un script de Python que recorre toda la base de datos y vuelca todo a un único JSON.

El script tiene el listado de nombres, sabe formular los enlaces de cada Pokémon, movimiento, habilidad y objeto, y los recorre uno a uno. La IA no toca la web: solo recibe un JSON limpio y ordenado. Trabajo pesado en local, criterio en la IA.

Base de datos pública (web)
    ↓  script de Python (scraping local)
JSON estructurado (Pokémon, movimientos, habilidades, objetos)
    ↓  Claude orquesta
Vault de Obsidian (Markdown interconectado)

3. El Vault: un segundo cerebro específico

Con el JSON, Claude genera un Vault de Obsidian: un archivo Markdown por cada Pokémon, movimiento, habilidad y objeto, todos enlazados entre sí con dobles corchetes. Es el mismo principio de un segundo cerebro estilo Zettelkasten, pero especializado en un único dominio.

A partir de ahí, la IA ya no responde de memoria. Responde leyendo sus propios archivos. Le pides un equipo con Mega Sceptile aprovechando su habilidad y counters al Trick Room, y te da el reparto de EVs correcto, los movimientos que ese Pokémon realmente aprende y sinergias que tienen sentido en el meta.

Lo mismo funciona para un GPT o un Gem

El Vault es la versión para Claude, pero el patrón es idéntico en otras herramientas. Los mismos Markdown que genera el proceso se cargan en la sección de Conocimientos de un GPT personalizado o de una Gem de Gemini, con un System Prompt que le ordena responder solo desde esos archivos.

El resultado es el mismo en las tres plataformas, porque lo que cambia el juego no es el modelo: son los datos.

Lo que esto enseña más allá de Pokémon

El caso es Pokémon, pero el problema es universal. Cualquier empresa que quiera usar IA sobre su propio dominio (su catálogo, su normativa interna, sus procesos) se topa con lo mismo: el modelo generalista alucina en cuanto le preguntas algo específico.

La receta que funciona es siempre la misma:

Estructura tus datos primero. Un modelo brillante sobre datos caóticos sigue dando resultados caóticos. El valor está en tener una fuente de verdad limpia y bien organizada.

Automatiza la extracción, no la improvises. Un script que vuelca datos una vez es más barato, más fiable y más rápido que hacer que la IA lo haga en cada consulta.

Obliga al modelo a citar sus fuentes. El System Prompt correcto convierte al modelo de "el que se inventa cosas" a "el que consulta y responde".

¿Quieres una IA que trabaje sobre tus datos, no que los invente?

Este es exactamente el tipo de sistema que construyo para empresas: IA especializada en tu dominio, alimentada con tus datos reales, que responde con precisión en lugar de improvisar.

Si tienes información valiosa que a tu equipo le cuesta encontrar, o quieres una IA que de verdad conozca tu producto, puedo ayudarte a construir la arquitectura que lo hace posible.

Escríbeme →