ウェイモ(Waymo)は、同社の自動運転技術を支えるAIシステムの詳細を公表しました。同社は完全自動運転による走行距離が1億マイルを超え、人間のドライバーと比較して重傷を伴う事故の発生率を10分の1以下に抑えていると発表しています。
同社のAIシステムの中核となるのが「ウェイモ・ファウンデーション・モデル」です。このモデルは「Think Fast」と「Think Slow」と呼ばれる2つの異なるコンポーネントで構成されています。Think Fastはセンサーフュージョンエンコーダーで、カメラ、ライダー、レーダーからの入力を時間経過とともに融合し、オブジェクト認識やセマンティック情報を生成して迅速な運転判断を可能にします。Think Slowは運転用VLMで、グーグルのジェミニを用いてトレーニングされており、道路上の稀で複雑な意味論的シナリオを理解します。例えば、前方で車両が火災を起こしている場合、物理的な空間は通行可能でも別ルートを選択するよう促す信号を提供できるとしています。
ウェイモのAIエコシステムは、ドライバー、シミュレーター、クリティックの3つの要素で構成されています。まず大規模な教師モデルをトレーニングし、その後、より小型で効率的な生徒モデルへと変換します。ドライバーモデルは安全で快適な運転行動を生成し、独立した検証レイヤーで生成された軌跡を検証します。シミュレーターは衝突の可能性、悪天候、複雑な交差点などの多様なシナリオでドライバーをテストします。クリティックはドライバーのパフォーマンスを評価し、問題のあるシナリオを特定して改善のフィードバックを提供します。
同社が重視しているのが継続的な改善サイクルです。内部学習ループではシミュレーター内で強化学習を用いてドライバーを訓練します。外部学習ループでは、クリティックが実世界の完全自動運転データから最適ではない運転行動を自動検出し、改善された代替行動を生成してドライバーのトレーニングデータとして活用します。これらの改善はシミュレーターで厳密にテストされ、安全フレームワークで検証された後に実世界に展開されるとのことです。
ウェイモは、現在の完全自動運転走行距離が手動運転データをはるかに上回っており、この豊富な実世界データを学習サイクルに直接統合することで、ドライバーが自身の経験から継続的に学習できる体制を構築したとしています。

