Andreas Geiger博士は、Max Planck Institute for Intelligent Systems(MPI-IS)の自動ビジョン研究グループの責任者であり、テュービンゲン大学で学習型コンピュータビジョンおよび自動ビジョン部門の教授を務めています。このインタビューでは、博士が自動運転車両の開発における課題や、ドイツの大学が国際的に見ても魅力的である理由、さらには若い才能をドイツ国内に維持するための取り組みについて説明します。
受賞に際し、正確には何が高く評価されたのでしょうか。
自動運転車両の研究が評価されました。私はまず、カールスルーエ工科大学において、シーン理解を実現するアルゴリズムと手法を開発し、自分の論文で発表しました。ここでは実際のデータを用いるべきだと考え、複数のカメラやLiDAR、GPSなどの総合的なセンサテクノロジを搭載したテスト車両を使用しました。そして、私はある時点で、このように手間をかけて収集したデータを一般公開しようと決め、自分の論文の副産物とも言えるKITTI Benchmarkを発表しました。私が2012年に作成したこのツールは、今では自動運転の分野で最も影響力のあるデータセットの1つになっており、アルゴリズム評価用のコンピュータビジョンの分野では現在最先端のものです。
制御エンジニアリングと機械学習の違いをご自分の言葉で説明するとしたら、どうなりますか。
機械学習と制御エンジニアリングの間の線引きは曖昧であり、それは視点の問題とも言えます。制御エンジニアにとっては周辺認識の問題は主な研究対象ではなく、コンピュータ技術者にとっては制御エンジニアリングがそうなります。自動運転において手ごわい課題とは、周辺環境をどう認識するかや、AIでどう意思決定をサポートするかであると個人的には考えています。自動車を制御するのは、基本的にステアリング、アクセル、そしてブレーキのみであり、50個のアクチュエータと触覚センサを備えたヒト型ロボットの制御テクノロジに比べれば、車両の制御システムは意外とシンプルだと言えます。また、自動車業界は長期にわたって車両の制御に取り組むことで膨大なノウハウを積み上げてもきました。
では、サービス担当員のいない自動運転車両はいつ実用化されるとお考えですか。
これは、自動車業界を代表する多くの企業が2021年中の実現を約束していました。しかし、その多くは撤回されており、業界はより現実を直視しなければならなくなっています。私は今後10年間はレベル5の自動運転車両は実現しないと考えています。なぜなら、人工知能分野における根本的な問題が解決されていないためです。レベル4の運転が成功するかどうかは、フレームワークの条件をどう定義するかによります。つまり、特定の地域や天候を条件にすれば、今後数年で実現される可能性があります。これはWaymoが既に示しています。私は、自動運転はオペレータがリモートで介入し、速度も制限した状態から開始されると予想しています。Tesla社はこの分野のパイオニアですが、今後5年以内にTesla社がレベル5の自動運転車両を実用化できたなら驚きに値するでしょう。
最大の障害は何ですか。
現在、私たちは1億マイルごとに1件の交通死亡事故が発生すると計算しています。これは、私たち人間が相当に運転に習熟していることを示しています。自動運転車両の目的は人間のドライバーよりもミスを減らすことですが、最高でも10倍または100倍程度の精度向上に留まるでしょう。つまり、自動運転車両はあらゆる状況において安全でなければなりません。たとえば、夜間や降雨時、降雪の際にも周辺環境を適切に感知する必要があります。そのために使用するカメラは依然として人間の目にはまったく及びませんが、近年ではセンサテクノロジの大きな進歩が見られています。また、自動運転車両は、交通量の多い道路や封鎖された道路にも適切に対応したり、特定の歩行者の挙動、光の反射、および予測不能な稀なイベントにも対処したりしなければなりません。ただし、これらの稀なイベントに対応するようアルゴリズムをトレーニングするには、膨大な量のデータが必要になります。さらに、現状のアルゴリズムでは因果推論を実行できない、つまり結論を引き出すことができないということも大きな課題です。そのため、手作業によってシステムの高度な再プログラミングを行う必要があります。倫理的な問題や法的な問題も解消しなければなりません。もうお分かりのように、課題は山積しているのです。
博士はどの分野に注力されていますか。
私たちの研究グループは、これまでのコンピュータビジョンの課題に注力しており、たとえば、奥行きの認識性能を改善して安定化する方法や、より少ないデータでもアルゴリズムが効果的に学習できるようにする方法を研究中です。また、シミュレーションの効率化にも取り組んでいます。なぜなら、妥当性確認やトレーニングにおいて可能な限り現実に即してシミュレーションを行うことは今後ますます重要になると確信しているためです。さらに、自動運転向けアルゴリズムのトレーニングにも重点を置いています。私たちは現在、従来のモジュール型のアプローチに沿って研究を行う自動車業界とは対照的に、総合的なトレーニングを行えるシステムの実現を追求しています。
エンドトゥエンドのトレーニングの仕組みとその利点を教えていただけますか。
エンドトゥエンドのトレーニングでは、システム全体を周辺環境の認識から制御までの1つのプロセスと捉え、それを単一のニューラルネットワークで再現することを試みます。このシステムでは、車両から認識データと制御データ、つまりステアリング、アクセル、およびブレーキのデータを収集します。この手法の利点は、物体認識などのサブタスクに向けて個々のモジュールをトレーニングするのではなく、目標に向けてシステムを直接トレーニングすることが可能な点です。私たちは、この総合的なモデルが自動運転をより適切に拡張するための解決策であると信じています。自動車業界では大勢のエンジニアがモジュールごとに作業するモジュール型コンセプトを採用しています。しかし、私たちのモデルには現在、そのような精度も安定性もありません。一方、このモデルでデータの複雑さに対処できれば、機械学習を行ってはるかにすばやく新しい都市や新しい環境に適応させることができます。
自動車業界とはどの程度緊密に連携していますか。
私たちは地域のサプライヤや自動車メーカーと多数のサブプロジェクトを通じて協力し合っています。私たちが注力するエンドトゥエンドのアプローチは、モジュール型のアプローチを採用している自動車業界にとっては直ちに容認できるものではないにせよ、大きな関心事ではあります。私たちは現在、自動運転に関連した環境センサデータの処理を自己学習を通じて自動化するための方法を分析するKI Delta Learning(AIデルタラーニング)プロジェクトに参加しています。このプロジェクトは、連邦経済エネルギー省から委託されたものであり、自動車業界の大手メーカーやテュービンゲン大学を含む複数の大学が参加しています。

KI Delta Learning(AIデルタラーニング)
KI Delta Learning研究プロジェクトの目的は、さまざまな研究分野間の差異を評価して新しい手法を設計することにより、人工知能が既存の分野から知識を転用して追加要件(特定の「デルタ」)だけを学習すれば問題を解決できるようにすることです。これにより、新しい知識の追加が必要な場合でもより少ないテストデータで作業が済み、学習プロセスを加速することができます。ここには、自動ビジョン研究グループの責任者であるAndreas Geiger博士の知識が採り入れられています。
博士がテュービンゲン大学のCyber Valleyに参加し続ける理由と、ドイツの大学が国際的にも魅力的である理由を教えていただけますか。
欧州は学術研究における強力な地盤であり、自動車業界はAIに大きな関心を寄せています。また、テュービンゲン大学やMax Planck Instituteは巨大な研究者ネットワークの一部を成しており、研究者たちはコンピュータビジョンの課題に取り組むだけでなく、AIを応用して神経科学などの関連分野も研究しています。このようなネットワークでは、専門分野の枠を超えて互いに学び合える環境が形成されます。それが、ここに拠点を置く魅力です。また、ここではさまざまな活動における人脈作りも欧州レベルで継続できます。機械学習やAIに関する情報のやり取りを大学間や博士課程の学生間で行えるようにするELLIS(European Lab for Learning and Intelligent Systems)も、そのような場の1つです。つまり、シリコンバレーに住み、多くの大企業とやり取りする必要はないのです。Amazon社は現在Cyber Valley内で施設を拡大しており、Bosch社はこの近辺に新しい施設を建設中です。また、私たちはNVIDIA社からのサポートも受けており、Intel社とも緊密に協力しています。ただし、スタートアップ企業としての課題はいくつか残っています。
具体的にはどういうことでしょうか。
まず、私たちは世間一般の考え方を変革する必要があります。また、スタートアップ企業にはより多くのサポートが必要です。つまり、有能な若者たちが米国の技術系最大手の企業に引き抜かれずに、ここで自分のアイデアを実現できるよう、起業支援を拡充し官僚的な手続きを排除する必要があります。こうした点で、Cyber Valleyの設立者は思考スタンスを変えてきています。若者たちは一度去ってしまうと、二度と戻って来ないかもしれません。この地に才能を引き留めることが極めて重要なのです。
取材先について:

Professor Dr. Andreas Geiger
Professor Dr. Andreas Geiger is head of the Autonomous Vision research group at the Max Planck Institute for Intelligent Systems (MPI-IS) and is Professor for learningbased computer vision and autonomous vision at the University of Tübingen.