KI-Agenten, die komplexe Aufgaben autonom erledigen sollen, sind deutlich teurer als gedacht. Sie verbrauchen bis zu 1000-mal mehr Tokens als einfache Code-Reasoning- oder Chat-Anwendungen. Zu diesem Ergebnis kommt eine neue Studie des Stanford Digital Economy Lab.
Die hohe Token-Nutzung entsteht vor allem durch den kontinuierlichen Aufbau des Kontextfensters: Jeder neue Schritt führt dazu, dass der Agent den gesamten bisherigen Verlauf erneut verarbeiten muss. Dadurch wächst der Kontext lawinenartig an. Besonders problematisch ist, dass der Token-Verbrauch kaum vorhersehbar ist – selbst bei identischen Aufgaben schwankten die Kosten um das bis zu 30-Fache.
„Agenten sind nicht in der Lage, ihre eigenen Token-Kosten vorherzusagen. Das ist ein grundlegendes Hindernis für ergebnisbasierte Preismodelle“, erklärte Jiaxin Pei, einer der beteiligten Forscher. Modelle unterschätzen den Verbrauch systematisch, und auch für Menschen sei die Einschätzung schwierig.
Die Studie „How Do AI Agents Spend Your Money? Analyzing and Predicting Token Consumption in Agentic Coding Tasks“ wurde von Forschern um Erik Brynjolfsson und Sandy Pentland durchgeführt. Sie unterstreicht, dass Agenten zwar leistungsfähig sind, aber derzeit noch erhebliche Effizienzprobleme aufweisen. Die Autoren sehen dringenden Optimierungsbedarf sowohl auf Modellebene als auch in der Architektur der Agentensysteme.
