Auf der KubeCon und CloudNativeCon Europe 2026 in Amsterdam stand die Infrastruktur für Künstliche Intelligenz im Fokus. Nvidia stellt seinen Dynamic-Resource-Allocation-Treiber (DRA) für GPUs der CNCF zur Verfügung, der eine flexible Ressourcenzuweisung in Kubernetes ermöglicht. Ergänzend dazu wurde das Open-Source-Werkzeug AI Cluster Runtime (AICR) vorgestellt, das die reproduzierbare Erstellung von GPU-beschleunigten Kubernetes-Clustern vereinfacht. Das neue CNCF-Projekt llm-d, das von mehreren großen Technologieunternehmen initiiert wurde, optimiert die verteilte Inferenz von KI-Modellen, indem es die Verarbeitung von Prompts und Token-Generierung auf skalierbare Pods verteilt und den Zustand verwaltet, um die Time to First Token (TTFT) zu reduzieren und den Token-Durchsatz zu steigern. Die Konferenz, die mit rund 13.000 Teilnehmenden die bisher größte war, betonte die globale Verfügbarkeit von Open-Source-Code, während Fragen der digitalen Souveränität weitgehend ausgelagert wurden.