Iot by SAP

Vor allem Routineprozesse bieten großes Potenzial für eine Automatisierung mit intelligenten SAP Cloud-Services. - Bild: fotolia/phonlamaiphoto

Personen und Gesichter sowie Schrift in Bildern erkennen, maschinell erfassen, worum es in einem Text geht und Schlüsselworte bestimmen: Das sind einige der konkreten Fähigkeiten von neuen Web-Services für maschinelles Lernen.

„Selbst Entwickler, die sich noch nicht besonders mit maschinellem Lernen auseinandergesetzt haben, können unsere Cloud-basierten Services nutzen und als Bausteine für ihre eigenen Anwendungen nutzen“, erläutert Philipp Zaltenbach, Spezialist für Geschäftsentwicklung im Bereich des maschinellen Lernens bei SAP.

„Unsere Lösung ermöglicht unseren Kunden einen einfachen Zugang zu Machine-Learning-Technologien, verarbeitet unstrukturierte Daten wie Bilder und Texte, bietet skalierbare und schnell einsetzbare Cloud-basierte Web-Services und eine nahtlose Integration in SAP-Systeme“, so Zaltenbach, der besonders in der Automatisierung von Routineprozessen großes Potenzial sieht.

Dazu gehört etwa, dass Mitarbeiter keine Formulare mehr abtippen, Kundentickets analysieren und Rechnungen mit Zahlungen abgleichen müssen.

Die 8 wichtigsten aktuellen Cloud-Services im Überblick:

1. Systematische Bildzuordnung (Image Classification)

Während ein vortrainierter Service bereits etwa für die Autobranche Lkws von Pkws unterscheiden kann und einen Geländewagen vom Cabrio, ist es möglich, diesen bestehenden Service um eigene Bild- bzw. Trainingsdaten zu erweitern. „Er ist in der Lage, das Bild als Ganzes zu erfassen und ihm Kategorien zuzuweisen“, erläutert Zaltenbach.

Automobilkonzern Daimler macht sich diese Fähigkeit in einer App für autobegeisterte Kunden zunutze, die als Prototyp bereits entwickelt wurde. Ein Schnappschuss mit dem Smartphone an der Kreuzung identifiziert ein Fahrzeug aus dem Portfolio, unabhängig davon, aus welcher Perspektive das Fahrzeug zu sehen ist. Die automatische Identifizierung innerhalb der App bietet zudem weitere Vorteile. Dazu gehört der Aufruf des Online-Konfigurators, der bereits auf das erkannte Automodell eingestellt wurde.

2. Objekte auf Bildern erkennen (Object Detection)

Dieser Web-Service wird häufig zur Vorverarbeitung genutzt, indem er Objekte innerhalb eines Bildes lokalisiert und damit die Möglichkeit bietet, auf relevante Bildinhalte zu fokussieren. Im Hinblick auf die Daimler-App werden so zunächst die Fahrzeuge als relevante Objekte markiert. Anschließend kann sich der Bildklassifikationsservice auf diese Objekte konzentrieren und damit deutlich leichter einen Modelltyp aus dem Produktportfolio zuordnen. Der Webservice ist auf Basis eigener Daten trainierbar und lässt sich so auf unterschiedliche Szenarien zuschneiden.

Zudem werden zwei vortrainierte Modelle für die Erkennung von Personen und Gesichtern angeboten. Damit lassen sich Anwendungsfälle realisieren, um die Identität von Personen zu prüfen. Beispielsweise lassen sich Fotos von Personen, die für die Beantragung einer Krankenkassenversichertenkarte eingereicht wurden, gegen eine Bilddatenbank abgleichen. Dieser Abgleich gegen eine Blacklist ermöglich so den Ausschluss von Betrugsfällen.

3. Ähnlichkeiten auf Bildern erkennen (Image Feature Extraction)

Dieser Service extrahiert charakteristische Merkmale und Eigenschaften aus Bildern. Dabei orientiert er sich an den zugrundeliegenden Formen und Konturen. Bei einem Auto wären das etwa die vier Reifen, die Motorhaube oder Seitenspiegel. Die Bedeutung der Bilder wird in Vektoren codiert.

Der Vorteil: Bilder mit ähnlichen Inhalten – und dem zufolge ähnlichen Vektoren – können leicht über einen weiteren Service (Similarity Scoring) identifiziert werden. Wenn Schmuckhersteller Swarovski etwa von einem Kunden das Foto einer kaputten Kristallfigur zugeschickt bekommt, suchen die Services nach visuellen Ähnlichkeiten mit Figuren im Produktsortiment. Anschließend werden dem Service-Mitarbeiter jene Produkte vorgeschlagen, die mit hoher Wahrscheinlichkeit auf dem Foto zu sehen sind. Der Vorteil liegt auf der Hand: Unbekannte oder schwierig zu erkennende Teile lassen sich schneller und zuverlässiger identifizieren als per manueller Suche im Produktkatalog.

4. Texte in beliebigen Bildern erkennen (Object Character Recognition und Scene Text Recognition)

Die Besonderheit dieser Services besteht darin, dass nicht „nur“ gescannte Textseiten von Dokumenten, sondern auch Texte in beliebigen Bildern erkannt werden können. Dabei ist es egal, ob einzelne Buchstaben unterschiedlich groß sind, verzerrt dargestellt werden, die Schilder verkratzt sind, auf denen der Text steht oder unterschiedliche Schriftfarben verwendet werden.

„Je mehr Trainingsdaten zur Verfügung stehen, umso besser ist das Ergebnis“, so Zaltenbach. Ein Kunde aus der Öl- und Gasbranche beabsichtigt etwa diese Services einzusetzen, um die Etiketten von Ölfässern inklusive der Produktions-, Produkt- und Materialnummern zu erfassen. „Diese Informationen werden dann mit den Daten im ERP abgeglichen und es wird ein Alarm ausgelöst, sollte ein Fass falsch etikettiert worden sein“, erläutert der Machine-Learning-Experte.

5. Bilder segmentieren (Image Segmentation):

Anders als der Web-Service, der Objekte in Bildern erkennt, ist dieser Service fähig, die genaue Form eines Objektes zu erfassen und Objekte sogar dann zu erkennen, wenn sie teilweise verdeckt und nur Ausschnitte zu sehen sind. Einen bereits vortrainierten Service gibt es beispielsweise für die Konsumgüterindustrie. Ein Supermarkt steht etwa vor der Herausforderung, den Kühlschrank mit Flaschen und Dosen rechtzeitig nachzufüllen. Der Segmentierungs-Service ist darauf trainiert, darüber Auskunft zu geben, wie viele Flaschen und Dosen noch vorhanden sind. „So wird sichergestellt, dass das Angebot rechtzeitig aufgestockt wird“, sagt Zaltenbach.

6. Texte richtig zuordnen (Text Classification)

Auf Basis geeigneter Trainingsdaten lässt sich mithilfe dieses Machine-Learning-Services beispielsweise der Kundendienst oder die Stammdatenpflege unterstützen. Per Sentiment-Analyse wäre auf dieser Basis etwa die Auswertung von Produktbewertungen möglich, die aus Social-Media-Texten die positive oder kritische Stimmung gegenüber Produkten herausfiltert. Des Weiteren kann der Service zur Ergänzung von Stammdaten genutzt werden. So lässt sich im Handel die Auszeichnung der Produkte automatisieren, indem auf Basis der Produktbeschreibung abgeleitet wird, welche Maßeinheit auf Preisschildern ausgegeben werden muss.

7. Merkmale aus Text extrahieren (Text Feature Extraction)

Wie der Bildservice (unter 3.) extrahiert dieser Service relevante Merkmale – allerdings von Texten. Darauf aufbauend lassen sich dann inhaltlich ähnliche Texte finden. Das ist etwa für Lokalisierungsteams in Unternehmen interessant, die aktualisierte Rechtsprechungen in den einzelnen Ländern in Verträgen oder Produktfunktionalitäten berücksichtigen müssen. Der Machine-Learning-Service ermöglicht es, Dokumente miteinander zu vergleichen und neue, relevante Dokument auf Basis ähnlicher, historischer Dokumente aufzuspüren.

8. Landessprache erkennen und Texte übersetzen (Language Detection und Machine Translation)

Der maschinelle Übersetzungs-Service wurde auf Textbeständen der SAP trainiert und berücksichtigt dabei insbesondere SAP-spezifische Begriffe und Terminologien. Er ist damit speziell für Inhalte wie beispielsweise Softwaredokumentationen, Anleitungen und Produktbroschüren geeignet und ermöglicht auch eine automatische Übersetzung für Anwendungsoberflächen.

SAP kooperiert NVIDIA bei Machine-Learning-Trainings

„Viele Prozesse lassen sich aufgrund dieser neuen Möglichkeiten mittels Machine Learning weiter automatisieren“, betont Zaltenbach – „und zwar ohne dass spezielle Machine-Learning-Kenntnisse dafür erforderlich sind“. Hinzu kommt, dass durch die Kooperation mit NVIDIA die Machine-Learning-Services auf Basis besonders leistungsfähiger Graphikprozessoren (GPUs) trainiert werden können.

Der kalifornische Spezialist für Graphikprozessoren hat unter anderem den ersten „AI-Supercomputer“ vom Typ DGX1 entwickelt, den SAP an mehreren Standorten bereits im Einsatz hat und der so leistungsfähig ist wie 140 herkömmliche einzelne GPU-Server. „Wir nutzen heute bereits State-of-the-art-GPUs, um Machine-Learning-Trainings zu beschleunigen“, erläutert Zaltenbach – „zudem sind unserer Service dank der Cloud beliebig skalierbar.“

Weitere Informationen:

Erfahren Sie mehr über SAP Learning Machine Learning Foundation auf der Landingpage und in der folgenden Präsentation.

On-Demand-Webinar "SAP Leonardo Machine Learning – wie Anwendungen, Software und Services selbstständig lernen"