Antes de entrar en harina, un descargo de responsabilidad para los que se ofenden rápido: creo en la Inteligencia Artificial (IA), la uso a diario y soy el primero en defenderla. Pero precisamente porque la aprecio, no la miro con ojos de enamorado ciego. De la misma forma que un experto en seguridad defiende los coches pero te obliga a ponerte el cinturón —y te recuerda que el airbag no es una almohada para echarse la siesta al volante—, este artículo busca enseñaros la otra cara de la moneda.
Porque siempre la hay, y en gestión, hacerse el despistado no es una estrategia: es una negligencia con patas.
Si tu abuelo, el que levantó la casa piedra a piedra, viera que hoy aceptamos con una sonrisa que una máquina se invente el 17% de los datos, le daba un parraque allí mismo. Si mañana un ingeniero te dijera que el puente que ha diseñado tiene una probabilidad de éxito del 83%, no lo cruzarías ni harto de vino. Si tu contable te confesara que «alrededor del 17% de tus impuestos son fruto de su imaginación creativa», estarías llamando a un abogado antes de que terminara la frase.
Sin embargo, en este 2026, algo extraño y peligroso ha pasado en nuestras oficinas: hemos bajado el umbral de lo aceptable hasta el sótano. Hemos normalizado el error con una alegría que asusta. Nos han vendido que un modelo de IA con un 83% de acierto es un milagro tecnológico, cuando en realidad es una bomba de relojería para tu credibilidad. Hemos pasado de exigir excelencia a celebrar que el desastre «al menos está bien redactado».un abogado antes de que terminara la frase.
Sin embargo, en este 2026, algo extraño y peligroso ha pasado en nuestras oficinas: hemos bajado el umbral de lo aceptable hasta el sótano. Hemos normalizado el error con una alegría que asusta. Nos han vendido que un modelo de IA con un 83% de acierto es un milagro tecnológico, cuando en realidad es una bomba de relojería para tu credibilidad. Hemos pasado de exigir excelencia a celebrar que el desastre «al menos está bien redactado».
La paradoja de la competencia: Más «inteligentes», pero más mentirosas
Llevo meses leyendo informes de fiabilidad y la conclusión que saco es preocupante: creo que estamos ante una crisis de confianza disfrazada de progreso. El Stanford AI Index muestra mejoras espectaculares en exámenes teóricos de laboratorio, pero el rendimiento en el «mundo real» es otra gaita muy distinta.
Lo que me quita el sueño no es que la IA se equivoque. Lo que me quita el sueño es que se equivoca con una seguridad aplastante, y no lo cuestionamos, nos la comemos con todo el equipo. Un paper de OpenAI demostró matemáticamente que la tasa de error al producir texto es al menos el doble que la capacidad del propio modelo para juzgar si lo que acaba de escribir es verdad o mentira.
Traducido al gallego de toda la vida: el sistema es estructuralmente peor escribiendo que juzgando. Es como ese cuñado que habla por los codos en la cena de Navidad: sabe que igual está metiendo la pata, pero no puede evitar que la frase le salga redonda. Es un problema de diseño, no de falta de memoria RAM.
Y hay más. Investigaciones de OpenAI publicadas en 2024 y 2025 demuestran que a estos modelos se les entrena premiándoles cuando aciertan en «exámenes». ¿El resultado? Han aprendido que inventar con seguridad puntúa mejor que reconocer sus propios límites. El modelo no «elige mentir»; simplemente hace lo que le enseñamos: priorizar la respuesta rápida sobre la veracidad. Como ese empleado que aprendió que soltar una milonga creativa tiene mejor acogida que un sincero «no lo sé».
Nota para humanos: Una «alucinación» en IA es cuando la máquina, al no saber la respuesta, se la inventa con una convicción absoluta. No te dice «no tengo ni idea», te cuenta un cuento chino tan bien estructurado que te lo tragas con patatas.
Cuando el descaro computacional supera a la lógica
Según datos del propio OpenAI, los modelos de «razonamiento avanzado» —esos que supuestamente «piensan» antes de hablar— presentan tasas de error factual de entre el 33% y el 51%. Y el MIT remató la faena con una conclusión que debería estar enmarcada en todas las salas de dirección: los modelos generan sus respuestas incorrectas con el mismo aplomo —o más— que las correctas. Incluso cuando el modelo tiene acceso al conocimiento correcto, puede ignorarlo y optar por la versión inventada con total convicción. Un modelo puede estar sistemáticamente equivocado de forma consistente: que repita siempre lo mismo no significa que acierte.
Hay además un patrón documentado que merece su propio momento de silencio incómodo: los modelos generalistas tienden a declarar una confianza del 70-90% en respuestas donde la tasa real de acierto es considerablemente menor. Y el patrón inverso también se cumple: muestran menor seguridad de la que deberían en las respuestas que sí son correctas. Alta confianza donde fallan, dudas donde aciertan. El Dunning-Kruger digitalizado. Si alguna vez te has preguntado por qué la IA suena siempre igual de segura tanto cuando acierta como cuando se lo inventa, ya tienes la respuesta: porque así la entrenamos.
Nota para no técnicos: El «efecto Dunning-Kruger» es ese fenómeno humano de sobra conocido en las oficinas: el que menos sabe es el que habla con más aplomo en las reuniones. Los modelos de IA han conseguido replicarlo a escala industrial y sin el coste de la nómina.
Cuanto más seguro suena, más desconfianza merece. Premio al descaro.
El precipicio financiero y legal
Si pensáis que vuestro sector está a salvo, el Finance Agent Benchmark de 2026 trae malas noticias. En tareas de analista financiero junior, el mejor modelo disponible alcanzó un 46,8% de precisión. Ni un aprobado raspado. Estudios de evaluación financiera especializados confirman que ningún modelo supera el umbral mínimo de fiabilidad para decisiones autónomas en entornos regulados.
En cristiano: La «alineación fiduciaria» es la obligación legal de actuar siempre en el mejor interés del cliente. Que la IA falle ahí no es un detallito; es que te está mandando al juzgado de guardia sin pasar por la casilla de salida.
Se han documentado casos de modelos inventando marcos regulatorios —como la norma «IFRS 99», que no existe (es IRFS9)— o fabricando métricas financieras de compañías reales, llevando a analistas a estrategias de inversión directas al abismo.
El problema que nadie nombra en la reunión: la brecha de alfabetización
Hasta aquí hemos hablado de los que saben lo que están haciendo. Pero hay una capa del problema que se discute mucho menos y que, a mi juicio, es la más peligrosa a escala social: la mayoría del público general no tiene ni la más remota idea de cómo funcionan estas herramientas.
Y no es un reproche: es un diagnóstico.
Para un perfil técnico, las limitaciones de la IA son conocidas, están interiorizadas —a veces incluso sobreestimadas en sentido contrario—. Pero para el usuario medio, la IA es una caja negra que habla con autoridad. No ve el mecanismo. No entiende que la máquina no «sabe» nada: genera la siguiente palabra más probable basándose en patrones estadísticos. No razona, no verifica, no tiene conciencia de sus propios errores.
Y los datos lo confirman a escala: según el Stanford AI Index 2026, el 73% de los expertos en IA espera un impacto positivo de la herramienta en su trabajo, frente a solo el 23% del público general. Cincuenta puntos de diferencia en la misma pregunta. No es que unos tengan razón y otros no: es que están viendo herramientas completamente distintas desde trincheras completamente distintas. Los que saben cómo funciona la pistola la manejan con precaución; los que no, la apuntan hacia cualquier lado con entusiasmo.
El resultado es una combinación explosiva: herramientas que producen contenido falso con aspecto impecable, en manos de personas que no tienen los recursos para detectarlo. Los estudios lo confirman: el número de verificaciones de contenido generado con IA pasó de 160 en 2023 a 578 en 2025, y la curva sigue subiendo. La desinformación con apariencia de IA ya no es un fenómeno marginal: es una característica permanente del paisaje digital.
Nota para no técnicos: Cuando decimos que la IA «genera» texto, no estamos diciendo que «piensa» o «investiga». Está prediciendo, con mucha sofisticación estadística, qué palabras van bien juntas. A veces acierta. A veces se lo inventa. Y no distingue entre una cosa y la otra.
El problema no es solo que los modelos alucinen. Es que millones de personas reciben esas alucinaciones como si fueran hechos contrastados, las comparten, las citan en presentaciones, las usan para tomar decisiones. Y el formato impecable —la ortografía perfecta, la estructura de informe, el tono de autoridad— hace el resto.
En gestión, esto tiene una consecuencia directa: si tu equipo no tiene cultura de verificación, cualquier informe generado con IA puede convertirse en la fuente de verdad de un proyecto entero. Sin que nadie lo cuestione. Porque quedaba muy bien escrito.
Recomendaciones: Cómo liderar sin que te la jueguen
Si vas a meter la IA en tu flujo de trabajo, deja de tratarla como a un oráculo y empieza a tratarla como a ese becario brillante con una preocupante tendencia a la mitomanía:
Semáforo de riesgo: Si una tarea es «Roja» (legal, financiera, seguridad), la verificación debe ser humana al 100%. Los datos de 2026 lo confirman: ningún modelo actual tiene el «sentidiño» necesario para tomar decisiones autónomas en entornos regulados. Un contrato revisado solo por IA no es un contrato revisado.
Desconfía de la «Seguridad Sospechosa»: Si la IA te da una respuesta sin un solo matiz de duda, sospecha. Enseña a tu equipo que una respuesta perfecta y sin fisuras es, por definición, la más peligrosa. La incertidumbre expresada es una señal de salud; la seguridad absoluta, una señal de alarma.
Auditoría de referencias: No aceptes ni una sola cita técnica sin enlace verificable. Si el enlace no abre o la página no existe, asume que es una «obra de arte» creativa de la máquina. Esto aplica especialmente en entornos donde el dato se convierte en decisión.
Cultura de verificación en el equipo: No basta con que tú lo sepas. Si tu equipo no entiende cómo funciona la herramienta que usa a diario, estás gestionando un riesgo que no aparece en ningún registro de proyecto. La alfabetización en IA no es un lujo formativo: es higiene profesional básica.
Conclusión: O subes el listón o te buscas un buen abogado
Aceptar un 83% de acierto no es ser «moderno» ni «ágil»; es, sencillamente, haber perdido el norte profesional. En gestión, la diferencia entre un hito alcanzado y un desastre absoluto suele esconderse precisamente en ese 17% de detalles que la máquina ha decidido inventarse porque «quedaban bien».
No permitas que el brillo del silicio te nuble el juicio. La IA es un copiloto fascinante, pero nunca olvides que tú eres el único que irá a la cárcel si el coche se estrella. No dejes que un porcentaje de marketing te convenza de que el suelo es un buen sitio para poner el listón. En el mundo real, el 83% sigue siendo un suspenso en cualquier examen que importe. Especialmente en el de tu propia profesionalidad.
Desconfía de la perfección redactada, verifica hasta el último punto, contrasta, reta y, sobre todo, no seas tú el idiota motivado que celebra el desastre solo porque viene en un formato bonito.