
在开发自动驾驶功能时,数据是最宝贵的资源。Patrik Moravek是dSPACE基于数据驱动开发的负责人,他解释了如何尽可能高效地利用这一资源。
Patrik,基于数据驱动的开发是什么?
基于数据驱动的开发通常是一种软件开发方法。它可以解决新的软件开发时代的各种问题,包括基于人工智能(AI)的算法,更具体地说是人工智能的一个子类别,即机器学习。这种新的开发方法可以让开发更快速、更容易、更高效,因为它解决了基于人工智能开发功能的新问题和新挑战。
在汽车领域,ADAS和自动驾驶功能的开发中需要机器学习模型来分析车辆周围复杂情况。为了开发和配置这些模型,我们需要从真实世界中采集传感器数据样本,即大量的样本数据。由于样本数据量很庞大,准备这些数据会耗费开发中的大部分时间和资源。因此,如果开发过程中的资源分配已经发生改变,那么开发优化的重点也随之改变。如果在数据准备上花费的资金多于编写代码,则数据准备应成为成本优化的重点。对此,我们通过基于数据驱动的开发方法来解决这一问题。
在一定程度上,可以把它比作基于模型的开发。在软件开发中引入模型和仿真,显著加快了开发速度,特别是在控制领域。它降低了复杂性,将开发分为更容易处理的步骤,从而节省了资源、便于管理项目。同样,基于数据驱动的开发包括特定的流程、方法和工具,可以让基于人工智能的功能开发更高效、更快速。
基于数据的开发有哪些好处?
现代车辆的新功能开发,比如车道保持辅助(LKA)、交通堵塞辅助(TJA)和更高水平的自动驾驶,都是基于利用机器学习模型实现的感知能力。为了让这一感知能力走向成熟、在现实世界中可靠运行,需要事先收集很多现实世界的例子,用于开发和验证。可以说,用于开发的示例越多,软件在操作中(在路上)就越可靠。在某些开发环节,不会再进行编程;只有靠数据本身来提高可靠性和性能。
因此,开发的一个目标是收集尽可能多的相关的、不同的交通状况示例,建立一个稳健的训练和验证数据集,避免在路上出现软件故障。数据决定了AI的性能,AI则可以实现自动驾驶。
基于数据驱动的开发面临哪些挑战?
主要挑战是开发过程的数据量。数据收集和道路测试涉及数十万甚至数百万公里的道路。收集到的数据有千万亿字节甚至数百千万亿字节。
大存储容量和相关成本并不是收集如此庞大的数据带来的唯一影响。另一个影响是需要适当的流程和工具来处理这些数据,在这一需求出现之前,市面上并没有这些流程和工具。
假设,您需要一个切割工具。用刀砍树枝很好用,但砍树就不太合适了。同样地,有些工具可以很好地处理兆字节和千兆字节数据,但不适用于处理太字节和千万亿字节等更庞大的数据量。
事实上,在开发和验证中,并非在道路上收集的所有数据都具有相同的价值。各种消息来源声称,所收集的90-95%的数据毫无用处。挑战在于区分数据是否有用。因此,基于数据驱动的开发的一个重点是收集、存储和使用在开发和验证中真正有价值的道路数据,去除毫无价值的数据。
dSPACE的解决方案是什么?
作为仿真和验证领域的合作伙伴,dSPACE确定了早期阶段的挑战,并构建了适当的工具,帮助我们的客户改进基于数据驱动的开发流程。我们的产品涵盖从数据记录到数据回放(又称“再处理”)的整个数据路径。此外,还顺利拓展到了全虚拟世界ADAS/AD功能的闭环仿真验证。
- dSPACE从数据记录开始提供智能解决方案,记录所有数据或运行车载分析及优化数据记录。手动标记使用RTag或基于人工智能的滤波器,扩展了AUTERA数据记录器和RTMaps记录软件的功能,只捕获相关情况,减少了数据量。
- 上行注入站进行高速 数据摄取 ,确保数据及时送达开发人员和测试工程师手中。
- dSPACE旗下公司Intempora的自动驾驶传感器数据管理平台IVS提供访问、可视化、标注和数据选择,可以 有效利用收集到的数据 。
- 功能和系统的验证只能根据测得的参考信息(又称“地面实况”)进行。在自动驾驶功能的开发中,参考信息基于传感器数据的 标注, 它代表了真实的信息。understand.ai在其中发挥着至关重要的作用。understand.ai是dSPACE旗下公司,专注于大规模和自动化标注。
- 使用我们的 数据回放 系统对所记录和标注的数据进行验证。我们提供算法验证的工具和解决方案,以及包括硬件和软件在内的完整系统。数据回放系统由我们现有的产品组成,如RTMaps、VEOS、SCALEXIO和ESI Unit,具体取决于客户要解决的用例。
除此之外,还有特定的客户用例:使用记录数据进行验证(即开环测试)并不是利用数据的唯一方法。高质量数据也可以用来改进训练数据集。记录数据在向闭环验证的过渡中也起着重要作用。首先,IVS及其插件支持自动分析交通状况,从而更好地了解相关的交通参数。其次,收集到的数据适用于闭环仿真,dSPACE利用这些数据生成合成场景,在认真过程中改善整体验证策略的规划和执行。
dSPACE数据驱动开发解决方案的优势
- AUTERA上的人工智能算法可以在记录数据时且产生云存储成本之前减少数据。
- IVS可以分析和预览来自世界不同地区的数据,这些数据存储在全球各地的数据中心,不需要将实际的传感器数据复制到一个中心位置。
- IVS中的作业以高度优化的运行时引擎为基础,可以节省计算时间。
- 基于人工智能的自动化场景检测器和标注选项大幅节省了数据分析的时间和成本。
- 数据回放解决方案的性能经过优化,适用于于Microsoft Azure和Equinix等混合结构。
车载合作伙伴有哪些?
在ADAS/AD功能的开发中,广泛的合作伙伴生态系统必不可少。它是帮助客户完成任务的一个关键方面。端到端数据驱动开发的整个过程和解决方案非常复杂,跨越多个专家领域,并不是一家公司就可以解决的。为解决客户遇到的各种复杂问题,我们与不同领域的诸多合作伙伴密切合作。例如,在数据记录和回放方面,与传感器供应商(如Velodyne、LeddarTech、Robosense、leopardiimaging和Sensing World)、图像芯片供应商(如OnSemi、NXP)或ECU供应商(如Nvidia、Renesas)紧密合作,助力在短时间内调试系统。由于供应商之间的协调要求降低,这明显提高了客户满意度。我们还在计算基础设施领域与AWS、DELL、IBM、微软、SVA等公司合作,这方便在各种环境中部署我们的系统,充分利用各种资源允许来运行。有了配置中心的优质网络连接支持,才能有效连接不同位置的软件、硬件和数据,比如,我们与Equinix合作。
此外,我们与工程公司通力合作,灵活拓展我们执行工程任务的能力,如车载集成或管理服务,包括系统集成和操作。
合作伙伴的生态系统丰富多样,我很高兴所有的合作伙伴积极与dSPACE合作,满足客户的各种需求。
对客户有哪些好处?
我们的工具和解决方案改善了客户基于数据驱动的开发过程,他们可以更高效地实现目标,最终,总成本也降低了。这是客户对我们的反馈,我们将再接再厉。
解决方案的全面性和一致性为客户节省了大量的集成时间和成本,我们的解决方案已经很大程度上实现了集成。合作伙伴生态系统进一步扩大了这方面的优势。一个来源或一个合作伙伴的生态系统交付的解决方案越多,客户的集成工作和风险就越少。
我们始终会考虑模块化和可扩展性。随着项目规模不断扩大,我们会为客户逐步壮大基于数据驱动的开发工具。客户可以从小做起,在之前的投资基础上逐步发展。
我们的工具可以重复使用,在各种项目中都是如此。但对我们的客户来说有一个很大的好处,那就是也可以在不同的应用中重复使用我们的产品。以硬件在环(HIL)产品为例。它们是硬件设置数据回放不可分割的一部分,这意味着拥有dSPACE HIL系统的客户可以将这些系统用于数据回放测试站,节省大量成本。
未来会是什么样子,dSPACE将如何进一步开发产品?
我们的目标很明确——尽量为客户提高基于数据驱动的开发过程效率。如果客户在提供安全自动驾驶的过程中,利用我们的工具节省了金钱和时间,这将是一个双赢局面。这就是我们对合作关系的理解。
优化和改进整个数据管道可以更好地了解数据——了解数据的内容及其在后续步骤中的价值。如果在数据记录过程中确定哪些数据没有价值,直接就可以节省成本。另一方面,了解数据的价值并不是免费的,说到底,这是数据洞察投资和节约数据管道成本之间的平衡。这就是我们要解决的问题。
人工智能对于了解数据(如记录数据中的场景检测)起着关键作用,因此,我们在这方面投入了很多。我们已经在各种工具中采用了人工智能算法,而且正努力增强。人工智能在数据记录、标注和数据管理等方面提升了我们的产品。我们有自己的数据收集策略,该测量基于dSPACE收集平台(又称传感器车辆),精确解决改进工具的用例。
感谢您接受采访。
《dSPACE杂志》,2022年6月出版