Santander publica proyectos de IA bajo licencia Open Source para acelerar la innovación compartida

25/06/2026 12:10 CEST

Santander abre su tecnología para ayudar a construir Inteligencia Artificial (IA) más confiable y competitiva en banca, a la altura de los mejores actores de la industria. El banco ha compartido más de una decena de proyectos propios de IA bajo licencia Open Source, lo que permitirá que desarrolladores, investigadores y profesionales de todo el mundo puedan utilizar esta tecnología sin coste y contribuir a su evolución. Esta publicación se puede consultar en el nuevo canal del banco en GitHub, el repositorio global para iniciativas de formato colaborativo.

Banco Santander se mantiene a la vanguardia del desarrollo y evolución de la IA ofreciendo repositorios públicos en código abierto, orientados a facilitar la colaboración técnica y el aprendizaje compartido. Los once proyectos seleccionados tienen aplicación directa en el sector bancario y en otros, con lo que podrán beneficiar a distintas industrias y sectores. El objetivo es trabajar con la comunidad en el desarrollo de la IA del futuro.

A partir de ahora, otros desarrolladores podrán lanzar propuestas para mejorar las herramientas de Santander AI Lab, optimizando un modelo de aprendizaje continuo y un desarrollo constante basado en la inteligencia compartida. En esta línea, José Manuel de la Chica, Head de Santander AI Lab, destaca que “no abrimos esto porque el Open Source esté de moda. Lo hacemos porque los retos reales de la IA avanzada —seguridad, equidad, robustez, privacidad, gobernanza y trazabilidad— son demasiado importantes y transversales como para resolverlos en silos”.

En Santander creemos que la próxima etapa de la Inteligencia Artificial no se jugará solo en quién tiene acceso a los modelos más avanzados, sino en quién es capaz de usarlos con rigor, confianza y responsabilidad. En banca, eso significa poder demostrar que los sistemas son seguros, justos, robustos y auditables. Por eso hemos decidido abrir parte del trabajo de Santander AI Lab: herramientas concretas, sin datos reales de clientes, que pueden ayudar a la comunidad a avanzar en algunos de los retos más importantes de la IA aplicada. Queremos contribuir, aprender y colaborar desde una posición muy clara: ambición tecnológica, pero siempre con responsabilidad y con los pies en el suelo.

José Manuel de la Chica, Head de Santander AI Lab

Esta iniciativa permite compartir herramientas, ejemplos y recursos desarrollados por equipos del banco en ámbitos como Artificial Intelligence, Machine Learning, Large Language Models, Generative AI, Responsible AI y AI Governance. La publicación de estos proyectos forma parte del compromiso de Santander con la innovación responsable, la colaboración con el ecosistema tecnológico y el intercambio de conocimiento técnico, siempre bajo procesos internos de revisión de propiedad intelectual, protección de datos, ciberseguridad, licencias y marca. Así, cada repositorio incluye documentación técnica, licencia Open Source Apache 2.0, guías de contribución, código de conducta, información de seguridad y procesos de revisión de contribuciones.

Datos sintéticos para detección de fraude

Santander AI Lab ha publicado en GitHub el proyecto gen-fraud-graph, una herramienta que permite crear redes sintéticas de operaciones y comportamientos asociados al fraude. Así, se da respuesta a uno de los grandes retos de la IA en banca: aprender a detectar patrones complejos sin comprometer nunca la privacidad de las personas. La idea es sencilla: si se quiere mejorar la detección de fraude, necesitamos entornos donde probar hipótesis, comparar modelos y entender cómo se comportan distintas señales. Este proyecto genera datos artificiales, diseñados para parecerse a ciertos patrones de riesgo, pero sin contener información real de clientes ya que “la innovación en IA debe avanzar junto con la privacidad, no a costa de ella”.

Reglas transparentes

En paralelo, también se ha compartido mech-gov-framework, un desarrollo que explora cómo construir mecanismos de gobernanza basados en modelos de lenguaje, especialmente cuando pueden influir en decisiones sensibles o de alto impacto. Una iniciativa relevante ya que “trata de ayudar a que el funcionamiento de la IA pueda ser evaluado, trazado y gobernado con rigor”. El objetivo, convertir principios como seguridad, consistencia, auditabilidad y control en elementos más concretos y medibles. Por ello, en lugar de confiar ciegamente en una respuesta de un sistema, el proyecto propone trabajar con reglas, umbrales y comprobaciones que ayuden a decidir cuándo está preparado para operar, bajo qué condiciones y con qué límites.

Sistemas justos

Otro de los proyectos que Santander AI Lab ha abierto es mutatis-mutandis, que aborda el reto de lograr que los sistemas de IA se comporten de forma justa, tratando de manera comparable a personas en situaciones comparables. Esta iniciativa investiga sobre la discriminación algorítmica que ayuda a analizar decisiones mediante comparaciones contrafactuales. La idea fundamental es pasar de declaraciones generales sobre equidad a herramientas que permiten estudiar, probar y discutir el comportamiento de los modelos con más precisión, ya que “la confianza en la IA se construye no solo mirando sus resultados, sino entendiendo cómo llega a ellos y a quién pueden afectar”.

Gen-Fraud-Graph
Proyecto Open Source bajo licencia Apache-2.0 orientado a la generación sintética de grafos de fraude para investigación, experimentación y desarrollo de capacidades avanzadas de detección de fraude.

Mutatis-mutandis
Proyecto Open Source bajo licencia Apache-2.0 orientado al situation testing para el análisis de discriminación mediante comparadores contrafactuales, publicado como código de investigación del paper "Mutatis Mutandis: Revisiting the Comparator in Discrimination Testing" para el avance de la equidad algorítmica y la IA responsable.

Ralph
Proyecto Open Source bajo licencia Apache-2.0 que proporciona un bucle configurable en Bash/PowerShell para ejecutar una CLI de codificación con IA iniciando una sesión limpia en cada iteración, orientado a la automatización y experimentación con agentes de desarrollo.

Autoguardrails
Proyecto Open Source bajo licencia Apache-2.0 orientado a la investigación de alineamiento y seguridad de LLMs, que ofrece un scaffold (estilo autoresearch) para el desarrollo y evaluación de guardrails sobre una única superficie de política (policy.md).

Ralph-vault-skill
Proyecto Open Source bajo licencia Apache-2.0 que aporta una skill para generar la base de conocimiento (knowledge vault) de proyectos mediante el bucle Ralph, orientada a la documentación automática y los flujos RAG.

Genetic-algorithm
Proyecto Open Source bajo licencia Apache-2.0 que implementa un motor de algoritmos genéticos en Python sin dependencias, con criterios de fitness conectables (pluggable), concebido como núcleo de búsqueda reutilizable para un autoinvestigador (autoresearcher) basado en LLM/IA.

Mech-gov-framework
Proyecto Open Source bajo licencia Apache-2.0 orientado a la gobernanza mecánica de decisiones de LLMs, con regímenes de gobernanza agnósticos al modelo (R1/R2/R3), hard gates, commit-reveal de entropía y métricas de gobernanza para sistemas de decisión de alto impacto.

Auto-bayesian
Proyecto Open Source bajo licencia Apache-2.0 orientado al entrenamiento interpretable de redes bayesianas para datos tabulares relacionales, dirigido por configuración y con foco en la explicabilidad y la IA responsable.

Linear-adapter-trainer
Proyecto Open Source bajo licencia Apache-2.0 para entrenar adaptadores lineales de embeddings mediante triplet loss, alineando los embeddings de recuperación con las consultas del usuario para mejorar los sistemas RAG.

LLM_bridge
Proyecto Open Source bajo licencia Apache-2.0 que ofrece una librería cliente de LLMs ligera y neutral respecto al proveedor, con una única interfaz (LLMClient) y adaptadores conectables para OpenAI, AWS Bedrock y Google Gemini, o backends propios.

Sota-stressed-datasets
Proyecto Open Source (código bajo licencia Apache-2.0; los datasets conservan sus propias licencias de datos) que republica datasets de benchmark abiertos en forma "estresada" para evaluar la robustez de modelos de ML/LLM, curado por Santander AI Lab.