Daten sind der wertvollste Schatz bei der Entwicklung von Funktionen für das autonome Fahren. Patrik Moravek ist Spezialist für die datengetriebene Entwicklung und erklärt, wie dieser Schatz möglichst effizient gehoben werden kann.
Patrik Moravek ist ein Spezialist für daten­getriebene Entwicklung.

Daten sind der wertvollste Schatz bei der Entwicklung von Funktionen für das autonome Fahren. Patrik Moravek ist Spezialist für die datengetriebene Entwicklung und erklärt, wie dieser Schatz möglichst effizient gehoben werden kann.

 

 

Patrik, was verbirgt sich hinter datengetriebener Entwicklung?

Im Allgemeinen ist die datengetriebene Entwicklung ein Ansatz für die Software-Entwicklung. Sie ist eine Antwort auf eine neue Ära in der Software-Entwicklung, die auf künstlicher Intelligenz (KI) basierende Algorithmen umfasst, genauer gesagt eine Teilmenge der KI, die als maschinelles Lernen bezeichnet wird. Dieser neue Entwicklungsansatz macht die Entwicklung einfacher, schneller und effizienter, da er die neuen Aspekte und Herausforderungen bei der Entwicklung von KI-basierten Funktionen berücksichtigt. 

Im Automobilsektor stützt sich die Entwicklung von ADAS- und AD-Funktio-nen auf Modelle des maschinellen Lernens, welche die komplexe Situation rund um das Fahrzeug analysieren. Um diese Modelle zu entwickeln und zu konfigurieren, sind Beispielsensordaten aus der realen Welt erforderlich – eine Menge Beispieldaten. Die Menge der Beispieldaten ist so groß, dass die Aufbereitung dieser Daten den größten Teil der Zeit (und Ressourcen) in der Entwicklung in Anspruch nimmt. Wenn sich also die Ressourcenzuweisung innerhalb des Entwicklungsprozesses verschoben hat, muss sich auch der Schwerpunkt der Entwicklungsoptimierung verschieben. Wenn mehr Geld für die Aufbereitung der Daten als für das Schreiben eines Codes ausgegeben wird, soll die Aufbereitung der Daten ein Schwerpunkt der Kostenoptimierung werden. Diese Schwerpunktverlagerung wird durch den datengetriebenen Entwicklungsansatz aufgegriffen. 

Bis zu einem gewissen Grad ist dies mit der modellbasierten Entwicklung vergleichbar. Die Einführung von Modellen und Simulationen in die Software-Entwicklung führte zu einer erheblichen Beschleunigung der Entwicklung, insbesondere im Bereich der Steuerung. Es reduzierte die Komplexität und zerlegte die Entwicklung in leichter zu handhabende Schritte, wodurch Ressourcen eingespart und Projekte besser verwaltet werden konnten. In ähnlicher Weise umfasst die datengetriebene Entwicklung spezifische Prozesse, Methoden und Tools, die die Entwicklung von KI-basierten Funktionen effizienter und schneller machen.

 

Wofür ist die datengetriebene Entwicklung gut?

Die Entwicklung neuer Funktionen in modernen Fahrzeugen wie Spurhalteassistenten (Lane Keeping Assistant, LKA), Stauassistenten (Traffic Jam Assistant, TJA) und eine höhere Stufe des autonomen Fahrens basiert auf Perzeptionsfähigkeiten, die mit Machine-Learning-Modellen umgesetzt werden. Um diese Perzeptionsfähigkeit auszureifen und in der realen Welt zuverlässig zu machen, müssen im Vorfeld viele Beispiele aus der realen Welt gesammelt und bei der Entwicklung und Validierung verwendet werden. Man kann sagen, je mehr eindeutige Beispiele für die Entwicklung zur Verfügung stehen, desto zuverlässiger arbeitet die Software im Betrieb (auf der Straße). Zu bestimmten Zeitpunkten in der Entwicklung wird keine Programmierung mehr vorgenommen; nur die Daten selbst verbessern die Zuverlässigkeit und Leistung. 

Daher besteht eines der Ziele der Entwicklung darin, so viele relevante (und eindeutige) Beispiele von Verkehrs-situationen wie möglich zu sammeln, um einen robusten Trainings- und Validierungsdatensatz zu erstellen, der Software-Fehler auf der Straße verhindert. Daten bestimmen die KI-Leistung und KI ermöglicht autonomes Fahren. 

Was sind die Herausforderungen bei der datengetriebenen Entwicklung?

Die größte Herausforderung ist die Menge der Daten, die in diesem Prozess anfällt. Die Datenerfassung und die Fahrversuche erstrecken sich über Hunderttausende oder sogar Millionen von Kilometern auf der Straße. Im Hinblick auf die gesammelten Daten sprechen wir von Petabytes oder Hunderten von Petabytes an Daten. 

Der große Speicherplatz und die damit verbundenen Kosten sind nicht die einzigen Folgen, die sich aus der Erfassung so großer Datenmengen ergeben. Es entsteht auch Bedarf an geeigneten Verfahren und Instrumenten für die Arbeit mit diesen Daten. 


Stellen Sie sich vor, Sie brauchen ein Schneidewerkzeug. Ein Messer eignet sich gut, um einen Zweig abzuschneiden, aber es ist nicht geeignet, um einen Baum zu fällen. Ebenso eignen sich Tools, die gut mit Megabyte- und Gigabyte-Daten arbeiten, nicht gut für größere Datenmengen wie Terabyte und Petabyte. 

Tatsache ist, dass nicht alle Daten, die auf der Straße gesammelt werden, den gleichen Wert für die Entwicklung und Validierung haben. Tatsächlich behaupten verschiedene Quellen, dass etwa 90-95 % der gesammelten Daten nutzlos sind. Die Herausforderung besteht darin, zwischen brauchbaren und unbrauchbaren Daten zu unterscheiden. Daher liegt ein Schwerpunkt der datengetriebenen Entwicklung auf der Erfassung, Speicherung und Nutzung von Straßendaten, die für die Entwicklung und Validierung wirklich von Nutzen sind, und auf der Beseitigung wertloser Daten.

dSPACE sammelt mit einem Sensorfahrzeug Daten aus dem Verkehr, um KI-Modelle in eigenen Produkten wie AUTERA, IVS oder AURELION zu trainieren.

Wie sieht die Lösung von dSPACE aus?

dSPACE als Partner für Simulation und Validierung hat die Herausforderungen in der frühen Phase erkannt und entsprechende Werkzeuge entwickelt, die unseren Kunden helfen, die Prozesse in der datengetriebenen Entwicklung zu verbessern. Unser Angebot deckt den gesamten Weg der Daten von der Datenerfassung bis zur Datenwiedergabe (auch Reprocessing genannt) ab. Darüber hinaus lässt sich das System nahtlos in die Closed-Loop-Simulation zur Validierung von ADAS/AD-Funktionen in einer vollständig virtuellen Welt einbinden.

  • Beginnend mit der Datenerfassung bietet dSPACE intelligente Lösungen, um alle Daten aufzuzeichnen oder eine Onboard-Analyse durchzuführen und die Datenaufzeichnung zu optimieren. Manuelles Tagging mit RTag oder KI-basierten Filtern erweitern die Möglichkeiten des AUTERA-Datenloggers und der RTMaps-Logging-Software, um nur die relevanten Situationen zu erfassen und die Datenmenge zu reduzieren. 
  • Die Hochgeschwindigkeitsdatenaufnahme mit unserer Upload-Station stellt sicher, dass die Daten ohne unnö-tige Verzögerungen zu den Entwicklern und Testingenieuren gelangen. 
  • Für eine effektive Nutzung der gesammelten Daten bietet IVS, die Sensordaten-Management-Plattform für automatisiertes Fahren von Intempora (einem dSPACE Unternehmen), Zugang, Visualisierung, Annotation und Datenauswahl.  
  • Die Validierung von Funktionen und Systemen ist nur anhand von gemessenen Referenzinformationen (auch Ground Truth genannt) möglich. Im Zusammenhang mit der Entwicklung von Funktionen für das autonome Fahren stützt sich die Referenz auf die Annotation von Sensordaten, welche die wahren Informationen darstellen. Hier spielt understand.ai, ein dSPACE Unternehmen, das sich auf groß angelegte und automatisierte Annotationen konzentriert, eine entscheidende Rolle. 
  • Die Validierung mit aufgezeichneten und annotierten Daten wird mit unseren Datenwiedergabesystemen durchgeführt. Hier bieten wir sowohl Werkzeuge und Lösungen für die Validierung von Algorithmen als auch komplette Systeme an, die sowohl Hardware als auch Software umfassen. Datenwiedergabesysteme bestehen aus unseren etablierten Produkten wie RTMaps, VEOS, SCALEXIO und ESI Unit, je nach dem vom Kunden gewünschten Anwendungsfall. 

Darüber hinaus sehen wir spezifische Kundenanwendungsfälle: Die Validierung mit aufgezeichneten Daten, der so genannte Open-Loop-Test, ist nicht die einzige Möglichkeit, die Daten zu nutzen. Hochwertige Daten werden auch zur Verbesserung des Trainingsdatensatzes verwendet. Darüber hinaus spielen die aufgezeichneten Daten eine wichtige Rolle beim Übergang zur Closed-Loop-Validierung. Erstens ermöglicht IVS mit seinen Plug-ins eine automatisierte Analyse von Verkehrssituationen und damit ein besseres Verständnis der entsprechenden Verkehrsparameter. Zweitens bietet dSPACE die Generierung synthetischer Szenarien aus gesammelten Daten, die in Closed-Loop-Simulationen anwendbar sind, was die Planung und Durchführung der gesamten Validierungsstrategie auf dem Weg zur Homologation verbessert.

Advantages of dSPACE Solutions for Data-Driven Development
  • AI algorithms on AUTERA allow data to be reduced as it is logged, and before cloud storage costs are incurred.
  • IVS enables the analysis and preview of data brought in from different regions of the world and stored in globally distributed data centers without the need to copy the actual sensor data to a central location.
  • Jobs in IVS are based on a highly optimized runtime engine that saves computing time.
  • Automated and AI-based scenario detectors and annotation options contribute significantly to time and cost savings in data analysis.
  • The data replay solutions are performance-optimized for e.g., hybrid architectures like at Microsoft Azure and Equinix.
Bei der datengetriebenen Entwicklung autonomer Fahrzeuge wird ein Datenkreislauf genutzt. Dazu gehört die Datenerfassung auf der Straße, die Datenaufnahme mit hoher Bandbreite in einem Datenzentrum, die Analyse der Daten auf relevante Verkehrssituationen und die Kennzeichnung für das KI-Training und die Generierung von Ground Truth in Datenwiedergabetests.

Wer ist als Partner mit an Bord?

Ein breites Partner-Ökosystem für die Entwicklung von ADAS/AD-Funktionen ist ein Muss. Das ist ein entscheidender Aspekt, um die Aufgaben unserer Kunden zu erleichtern. Die ganze Geschichte samt Lösung für eine datengetriebene End-to-End-Entwicklung ist komplex und umfasst mehrere Fachbereiche. Ein einziges Unternehmen kann das alleine nicht meistern. Um die Pro-bleme unserer Kunden in ihrer ganzen Komplexität zu lösen, arbeiten wir eng mit vielen Partnern aus unterschiedlichen Bereichen zusammen. So hilft beispielsweise bei der Datenerfassung und -wiedergabe die enge Zusammenarbeit mit Sensoranbietern wie Velodyne, LeddarTech, Robosense, LeopardImaging und Sensing World, mit Bildchip-Anbietern wie OnSemi und NXP und mit Steuergeräteanbietern wie Nvidia und Renesas, das System in kurzer Zeit in Betrieb zu nehmen. Dies erhöht natürlich die Kundenzufriedenheit, da der Abstimmungsaufwand zwischen den Lieferanten reduziert wird. Computing-Infrastruktur ist ein weiterer Bereich, in dem Partnerschaften mit Unternehmen wie AWS, DELL, IBM, Microsoft, SVA und anderen dafür sorgen, dass unsere Systeme problemlos in verschiedenen Umgebungen eingesetzt werden können und mit maximaler Effizienz auf den genutzten Ressourcen laufen. Die Verbindung von Software, Hardware und Daten an verschiedenen Standorten ist oft nur mit Unterstützung von Kollokationszentren, die erstklassige Netzwerkverbindungen anbieten, effizient möglich. Hier arbeiten wir zum Beispiel mit Equinix zusammen. Darüber hinaus arbeiten wir viel mit Ingenieurbüros, die unsere Kapazitäten bei Engineering-Aufgaben wie Fahrzeugintegration oder Managed Services, einschließlich Systemintegration und Betrieb, flexibel erweitern. Das Partner-Ökosystem ist vielseitig und eng verzahnt und ich freue mich, dass alle Partner so motiviert sind, mit dSPACE zusammenzuarbeiten, um verschiedene Kundenanforderungen zu erfüllen.

Was ist der Nutzen für die Kunden?

Unsere Tools und Lösungen verbessern den datengetriebenen Entwicklungsprozess für unsere Kunden, so dass sie effizienter arbeiten und ihre Ziele schneller und letztlich auch zu geringeren Gesamtkosten erreichen. Das ist das Feedback, das wir von unseren Kunden erhalten, und darauf bauen wir weiter auf.

Der Umfang und die Durchgängigkeit unserer Lösungen ersparen dem Kunden erheblichen Zeit- und Kostenaufwand für die Integration, die zum großen Teil bereits mit unserer Lösung geliefert wird. Das Partner-Ökosystem vervielfacht diesen Aspekt noch weiter. Je mehr aus einer Hand oder von einem Ökosystem von Partnern geliefert wird, desto weniger Integrationsaufwand und Risiken bleiben für die Kunden.

We always think about modularity and scalability. We offer our customers gradual growth of the data-driven development tooling with the growing scale of the projects. Customers can start small and later build on previous investments.

Wir denken immer an Modularität und Skalierbarkeit. Wir bieten unseren Kunden eine schrittweise Erweiterung des Werkzeugportfolios für die datengetriebene Entwicklung mit wachsendem Projektumfang. Die Kunden können klein anfangen und später auf früheren Investitionen aufbauen. Unsere Werkzeuge sind wiederverwendbar. Das ist bei verschiedenen Projekten der Fall, aber ein großer Vorteil für unsere Kunden ist auch die Wiederverwendbarkeit unserer Produkte in verschiedenen Anwendungen. Betrachten wir die Hardware-in-the-Loop (HIL)-Produkte. Sie sind fester Bestandteil der Datenwiedergabe im Hardware-Setup, so dass Kunden, die dSPACE HIL-Systeme einsetzen, erhebliche Kosten sparen können, wenn sie diese zu Datenwiedergabe-Teststationen umrüsten.

Wie sieht die Zukunft aus und wie wird dSPACE sein Angebot weiterentwickeln?

Unser Ziel ist klar, die Effizienz des datengetriebenen Entwicklungsprozesses für unsere Kunden zu maximieren. Wenn unsere Kunden mit unseren Werkzeugen auf dem Weg zum sicheren autonomen Fahren Geld und Zeit sparen, ist das eine Win-Win-Situation. Das ist unser Verständnis von Partnerschaft. Die Optimierung und Verbesserung entlang der Datenpipeline erfolgt durch einen besseren Einblick in die Daten – das Verständnis für den Inhalt der Daten und ihren Wert in den aufeinander folgenden Schritten. Wenn man schon bei der Datenerfassung entscheiden kann, welche Daten wertlos sind, ist das eine direkte Kostenersparnis. Auf der anderen Seite ist die Fähigkeit, den Wert der Daten zu verstehen, nicht umsonst, und es ist letztendlich ein Kompromiss zwischen Investitionen in Dateneinblick und Kosteneinsparungen entlang der Datenpipeline. Und das ist es, was wir ansprechen.

KI spielt eine zentrale Rolle beim Verstehen von Daten, zum Beispiel bei der Erkennung von Szenarien in aufgezeichneten Daten, und deshalb investieren wir viel in dieses Thema. Wir setzen bereits KI-Algorithmen in unseren Tools ein und arbeiten an weiteren Verbesserungen. KI verbessert unser Produkt zum Beispiel bei der Datenerfassung, der Annotation und der Datenverwaltung. Wir haben unsere eigene Datenerfassungsstrategie, die auf der dSPACE Erfassungsplattform, auch bekannt als Sensorfahrzeug, basiert. Damit adressieren wir genau die Anwendungsfälle, die der Werkzeugverbesserung dienen.

Vielen Dank für das Gespräch.

dSPACE MAGAZINE, PUBLISHED JUNE 2022

This sounds interesting. Let's get in touch:

Treiben Sie Innovationen voran. Immer am Puls der Technologieentwicklung.

Abonnieren Sie unser Expertenwissen. Lernen Sie von erfolgreichen Projektbeispielen. Bleiben Sie auf dem neuesten Stand der Simulation und Validierung. Jetzt dSPACE direct und dSPACE direct aeropace & defense abonnieren.

Formularaufruf freigeben

An dieser Stelle ist ein Eingabeformular von Click Dimensions eingebunden. Dieses ermöglicht es uns Ihr Newsletter-Abonnement zu verarbeiten. Aktuell ist das Formular ausgeblendet aufgrund Ihrer Privatsphäre-Einstellung für unsere Website.

Externes Eingabeformular

Mit dem Aktivieren des Eingabeformulars erklären Sie sich damit einverstanden, dass personenbezogene Daten an Click Dimensions innerhalb der EU, in den USA, Kanada oder Australien übermittelt werden. Mehr dazu in unserer Datenschutzbestimmung.