In der verarbeitenden Industrie gehören industrielle Mess- und Regeltechnik, hochvernetzte Systeme und Automatisierung seit Jahrzehnten zur Standardausrüstung, mit der Unternehmen die verfügbaren Daten verwerten können. Durch kontinuierliche Prozessoptimierung entstanden völlig neue Fachrichtungen und Anwendungen. Grenzen wurden vor allem durch den Stand der Technik definiert, während die potentiellen Kosten nur eine nachrangige Rolle spielten.
Mittlerweile sind die meisten Industrieunternehmen aber an die Grenzen des Machbaren gestoßen: Sie müssen nicht nur immer mehr, sondern auch zunehmend heterogene und unstrukturierte Daten von innerhalb und außerhalb des Produktionsprozesses verarbeiten. Zusätzlich bringt das industrielle Internet der Dinge (Industrial Internet of Things, IIoT) eine Unzahl an Maschinen und Sensoren ins Spiel, die mit ihren gewaltigen Datenströmen die Fertigungsbranche zu überfluten drohen.
Mit neuen Tools allein ist es nicht getan
Mit den bisher eingesetzten Werkzeugen sind diese Informationsflüsse nicht in den Griff zu bekommen. Zudem suchen die Unternehmen auch nach Wegen, die ausufernden Kosten wieder unter Kontrolle zu bekommen. Die Hersteller wollen ihre Innovationsfähigkeit stärken, im Wettbewerb mithalten und sich gleichzeitig differenzieren. Um verwertbare Erkenntnisse über Produkte, Kunden und Lieferketten zu erhalten, müssen sie ihre Strategie im Umgang mit Daten grundlegend ändern.
Einsatzgebiete in der Produktion
Die möglichen Anwendungsgebiete sind vielfältig und sehr heterogen. Es lassen sich aber drei Bereiche herausfiltern, die das größte Potential bieten:
- Vernetzung in der Produktion: Durch das Internet der Dinge können Hersteller zu jedem Zeitpunkt eine umfassende Übersicht darüber erhalten, was gerade im Fertigungsprozess passiert. Anpassungen können in Echtzeit erfolgen, um die störungsfreie Fertigstellung von Produkten zu gewährleisten und Mängel zu vermeiden. Eine Datenmanagementplattform ermöglicht es Unternehmen, Daten aus Produktionsprozessen und IoT-Sensoren zu sammeln, zu speichern, zu analysieren und daraus verwertbare Erkenntnisse zu gewinnen.
- Optimierung von Lieferkette und Beständen: Mittels eines ausgeklügelten Systems an Voraussage- und Logistikmodellen lässt sich ein Hub für Unternehmensdaten als Echtzeit-Liefernetzwerk (Supply Network) nutzen, um Vorlaufzeiten mit Nachfragesignalen, ERP- und MES-Daten, Warenbeständen, Lagerkapazitäten und Lieferantendurchsatz für einen reibungslosen Betrieb abzugleichen.
- Proaktive Qualitätssicherung: Ein Problem nach der Produktion zu beheben, kostet hundertmal mehr, als es bereits vor der Produktion aus der Welt zu schaffen. Durch eine einzige Datenplattform lassen sich Entwicklungszeiten um bis zu 50 Prozent verkürzen, während auf Leistungsprobleme in Echtzeit reagiert und Mängel vor der Herstellung beseitigt werden können.
Hadoop – Datenmanagement für die Fertigungsbranche
Produktions- und IoT-Daten sind allerdings derart komplex, dass Unternehmen ihre Strategie zur Datenverwaltung anpassen müssen. Benötigt wird eine Plattform, die optimal auf die genannten Herausforderungen getrimmt ist und mit der Hersteller die Vorteile der Cloud wahrnehmen und gleichzeitig ihre bestehende Infrastruktur weiter nutzen können.
Führende Unternehmen aus der Fertigungsbranche setzen zunehmend auf das Apache Hadoop-Ökosystem als Basis für Datenmanagement- und -analyse. Mit Hadoop lassen sich Daten praktisch ohne Limits speichern, verwalten, verarbeiten und vor allem analysieren. Daten aus Sensorablesungen, Anlagenproduktivität, Transaktionsdaten, Lieferantendaten und mehr lassen sich leicht und kostengünstig aus verschiedenen Quellen in einer einzigen, vereinheitlichten Plattform zusammenführen.
Da Hadoop darüber hinaus auf einem höchst skalierbaren und flexiblen Datensystem beruht, kann jede Art von Daten – sowohl strukturiert als auch unstrukturiert – ohne Änderung des Formats geladen werden, so dass sowohl die Integrität der Daten als auch die Flexibilität der Analyse gewährleistet sind. Daten, die von Maschinen und Sensoren generiert werden, darunter Zeitreihendaten sowie Anwendungs- und Weblog-Dateien, können in Echtzeit gesammelt und direkt in Hadoop eingespeist werden, anstatt in temporären Dateisystemen oder Data Marts bereitgestellt zu werden. Hadoop läuft auf branchenüblicher Standard-Hardware oder in der Cloud, wodurch die Kosten für Speicher und Rechenleistung pro Terabyte durchschnittlich ein Zehntel von denen eines herkömmlichen relationalen Data-Warehouse-Systems betragen.
Lösungen auf Basis von Apache Hadoop haben in der Verwaltung und Analyse von Produktionsdaten zu einem Paradigmenwechsel geführt. Organisationen können damit problemlos nahezu unbegrenzte Mengen und Arten von Sensor-, Prozess- und IoT-Daten sammeln und speichern, leistungsfähige Verarbeitungs- und Analysewerkzeuge für Data in Motion und Data at Rest nutzen sowie sofortige Such-, Abfrage- und Visualisierungsoptionen von Daten im Petabytebereich zur Verfügung stellen, um mehr verwertbare Erkenntnisse zu gewinnen. Mit einer professionellen Hadoop-Distribution wie Cloudera Enterprise erhalten Unternehmen außerdem zahlreiche weitere Enterprise-Funktionen, Support, Training und vieles mehr.