Der CrowdStrike-Ausfall am Freitag, dem 16. Juli 2024, wird weithin als der größte IT-Ausfall in der Geschichte angesehen, der weltweit Schlagzeilen machte, Millionen von Menschen auf der ganzen Welt betraf und den Wert von CrowdStrike um mehr als 20 Milliarden US-Dollar schmälerte.
Wenn ich an meine Zeit bei Procter & Gamble (P&G) zurückdenke, ist es nicht schwer sich vorzustellen, was den internen Teams durch den Kopf ging, als sie diesen Zwischenfall miterlebten. Obwohl der Fehler nicht in den SAP-Systemen auftrat, weiß die SAP-Gemeinschaft nur zu gut, was passieren kann, wenn selbst die kleinsten Änderungen nicht korrekt implementiert werden. Diese Panne ist eine deutliche Erinnerung an die Notwendigkeit eines umfassenden Änderungsmanagementprozesses.
Was war passiert?
Ein Fehler im Sensorkonfigurations-Update 7.11 der CrowdStrike Falcon-Plattform hatte über den Windows-Kernel-Prozess einen direkten Kanal zum Microsoft Windows-Betriebssystem. Dadurch stürzte das Update ab, und die Benutzer erhielten einen BSOD (Blue Screen of Death).
Es ist ungewöhnlich, dass Unternehmen Zugriff auf den Kernel erhalten, aber Microsoft war aufgrund von EU-Vorschriften gezwungen, diesen offenen Zugang zu gewähren – was letztlich dazu führte, dass Microsoft Defender wettbewerbswidrig war.
Der Vorfall fand auf der Betriebssystemebene statt. Obwohl die Regeln innerhalb des Systems wie erwartet funktionierten, hatte die Änderung unvorhergesehene Auswirkungen. Ja, Änderungen und daraus resultierende Ausfälle können Folgen haben, aber es ist selten, dass ein kompletter Ausfall an allen Betriebsschnittstellen, in allen Regionen, bei allen Kunden usw. auftritt.
Das wirft die Frage auf: Wie sicher sind Sie in Bezug auf SAP-Änderungen und deren Auswirkungen auf den Betrieb?
3 gewonnene Erkenntnisse
Auch wenn dieser spezielle Vorfall nichts mit SAP zu tun hat, tut die Branche gut daran, wachsam zu sein und aus den gemachten Fehlern zu lernen.
Hier sind drei Beispiele, die ich ausgewählt habe.
- Seien Sie nicht zu zuversichtlich – die Auswirkungen eines korrekten Workflows und eines ordnungsgemäß funktionierenden SAP-Systems können immer noch unbeabsichtigte betriebliche Folgen haben.
- Nicht jede Änderung ist gleich – überlegen Sie, welches Maß an Prüfung, Genehmigung und Validierung in Abhängigkeit vom Risikoniveau und den Auswirkungen der Änderung angemessen ist.
- Mehr Tests sind keine Lösung – blind mehr Tests durchzuführen ist keine Lösung. Es kann zwar das Risiko verringern, aber selbst bei einer Testabdeckung von 100% können Risiken in Bezug auf Leistung, Sicherheit, Bereitstellung usw. auftreten.
Schritte zur Sicherstellung sicherer und effektiver SAP-Änderungen
Bei jeder Änderung ist es wichtig, von Anfang an so viel Transparenz wie möglich zu haben, um das Fehlerrisiko zu minimieren und die Geschäftkontinuität zu gewährleisten. Die beiden Lösungen von Basis Technologies, ActiveDiscover und ActiveControl, unterstützen SAP-Teams in jeder Phase.
Planung und Entwicklung
- Stellen Sie sicher, dass Änderungen mit vollem Bewusstsein genehmigt werden – Änderungsplanung, Auswirkungen, Scoping, Design
- Arbeiten Sie nur an genehmigten Änderungen – Integration mit Jira/ServiceNow, um sicherzustellen, dass die Arbeit nur für genehmigte Änderungen ausgelöst wird
- Stellen Sie die Qualität von Änderungen sicher – Automatisieren und setzen Sie die Analyse der Codequalität durch und Blockieren Sie die Freigabe von Änderungen, die nicht den Anforderungen entsprechen
- Automatisieren Sie die Änderungsanalyse – Verstehen Sie den Inhalt der Änderung und markieren Sie kritische Objekte, Tabellenindizes, fehlende abhängige Objekte, …
- Setzen Sie Peer-Review und Aufgabentrennung durch – Stellen Sie sicher, dass mehr als eine Person an der Genehmigung/Einführung von Änderungen beteiligt ist
Testen und Bereitstellung
- Bestimmen Sie die richtige Testebene – Verstehen Sie, was getestet werden soll, wer beteiligt werden muss, Sicherheit, Schnittstellen, vorhergesagte Unterschiede
- Automatisieren Sie Regressionstests – Auslösen von Tests in externen Automatisierungstools
- Bewerten Sie die Eignung der Regressionsumgebung – Führen Sie einen Systemvergleich durch, um zu verstehen, wie sehr sich das Testsystem von der Produktion unterscheidet – sind die Regressionstests repräsentativ?
- Nutzen Sie einen adaptiven Arbeitsablauf – Behandeln Sie Änderungen entsprechend ihrer Risikostufe, um zusätzliche Genehmigungen, zusätzliche Testbereitstellungen usw. zur Verfügung zu stellen
- Verstehen und Steuern Sie Beziehungen – Identifizieren Sie fehlende abhängige Objekte, Überholer, Software Downgrade und Orchestrierung von Änderungen über Landschaften hinweg, Transportabläufe, Integrationen mit anderen Pipelines, z. B. ADO (Azure DevOps)
- Automatisieren Sie die Bereitstellung – Vermeiden Sie menschliche Fehler, stellen Sie sicher, dass Änderungen in der richtigen Reihenfolge umgesetzt werden, identifizieren Sie das beste Bereitstellungsfenster
- Heben Sie Ausreißer hervor – Identifizieren Sie ruhende Änderungen, fehlende Bereitstellungen
(z. B. in globalen Vorlagen)
- Schnelles Rollback ermöglichen – Aktivieren Sie das automatische Backout als Versicherungspolice
Möchten Sie die Kontrolle über SAP-Änderungen in Ihrem Unternehmen übernehmen, um das Risiko größerer Unterbrechungen zu minimieren? Kontaktieren Sie unser SAP-Expertenteam oder buchen Sie noch heute eine Demo von ActiveDiscover oder ActiveControl.