Mul­ti-Agent Re­in­for­ce­ment Lear­ning - Steu­e­rung von La­ger­be­stän­den in in­dus­tri­el­len Lie­fer­ket­ten

Mit KI-gestütztem Multi-Agent Reinforcement Learning sollen Lagerbestände in industriellen Lieferketten flexibler, robuster und wirtschaftlicher gesteuert werden.

Herausforderung für klassische Verfahren

„In komplexen Distributionsnetzwerken, wie wir sie täglich im Unternehmen erleben, setzen wir bereits leistungsstarke Algorithmen ein, die verlässlich optimale Lösungen liefern. Reinforcement Learning (RL) bietet dabei spannende Chancen: Es könnte unsere bewährten Verfahren ergänzen, die Effizienz weiter steigern und besonders herausfordernde Probleme adressieren, bei denen klassische Algorithmen an ihre Grenzen stoßen. In dem Transferprojekt wollen wir herausfinden, inwieweit RL diese Potenziale tatsächlich realisieren kann“, beschreibt Katharina Klerx von OPTANO die aktuelle Situation. Gerade wenn Unsicherheiten und die Vernetzung im System zunehmen, stoßen klassische Methoden an ihre Grenzen. Für besonders komplexe Lager- und Lieferstrukturen fehlen oft effiziente mathematische Lösungen.

Multi-Agent Reinforcement Learning als Lösungsansatz

Das Projekt ML4SAFETYSTOCK, das im SICP – Software Innovation Campus Paderborn gemeinsam von dem Mitgliedsunternehmen OPTANO und der Wirtschaftsinformatik- Forschungsgruppe Data Analytics der Universität Paderborn unter Leitung von Prof. Dr. Oliver Müller, Direktor des Kompetenzbereichs Artificial Inteligence im SICP, durchgeführt wird, testet daher einen neuen Ansatz: Beim sogenannten Multi-Agent Reinforcement Learning steuern virtuelle Agenten die Sicherheitsbestände an den einzelnen Lagerorten und reagieren eigenständig auf Veränderungen wie Lieferverzögerungen, Nachfrageschwankungen oder kurzfristige Engpässe. Mithilfe einer eigens entwickelten Simulationsumgebung „lernen“ die Agenten in zahlreichen Versuchen, wie sich das Gleichgewicht aus niedrigen Lagerkosten und hoher Versorgungssicherheit herstellen lässt – und passen die Bestände dynamisch an aktuelle Risiken im gesamten Netzwerk an. Marcel Meyer von der Universität Paderborn ordnet die Ergebnisse ein: „Der RL-Ansatz eröffnet vielversprechende Möglichkeiten, Sicherheitsbestände in komplexen Netzwerken gezielt und dynamisch anzupassen. Für optimale Ergebnisse sind weitere Entwicklungen nötig, aber schon jetzt zeigt sich das Potenzial dieser Methode im Vergleich zu herkömmlichen Verfahren.“ 

Erfahrung bleibt zentral 

Entscheidend für die Leistungsfähigkeit der KI ist die Erfahrung und fachliche Einschätzung der Unsicherheiten durch die beteiligten Expert*innen. Erst auf dieser Basis finden die lernenden Agenten tragfähige Lösungen – reine Datenmodelle reichen nicht aus. Die Simulationen zeigen: RL öffnet so neue Wege, industrielle Lieferketten auch unter Unsicherheiten wirtschaftlich und stabil zu steuern.

Kontakt

business-card image

Marcel Meyer

Wirtschaftsinformatik, insb. Data Analytics

E-Mail schreiben