Optimierung von Regeln zur Fahrzeugführung
Sichere und komfortable Fahrzeugtrajektorien können implizit durch ein Trajektorien-Optimierungsproblem beschrieben werden. Leider kann der Rechenaufwand zur Lösung des Optimierungsproblems eine Echtzeit-Anwendung des Planungsalgorithmus verhindern. Um die Anforderungen an die Rechen-Hardware zu reduzieren, kann die optimale Trajektorie durch ein Neuronales Netz erlernt werden. Die Bedeutung der Parameter eines Neuronalen Netzes und ihre Interaktion sind für einen Menschen allerdings schwer nachvollziehbar. Deshalb ist es wünschenswert die optimale Trajektorie durch eine Menge von Regeln zu nähern, deren Bedeutung weiterhin zugänglich ist.
Die Parameter zur Definition der Regeln sollen so gewählt werden, dass sie eine gewünschte Trajektorie reproduzieren. Die optimalen Parameter können mithilfe eines überwachten Lernverfahrens ermittelt werden. Die Trainingsdaten bestehen aus einer Kombination von Szenarien und den dazugehörigen optimalen Trajektorien. Während der Optimierung wird zu jedem Szenario eine Trajektorie anhand der Regeln bestimmt und mittels einer Gütefunktion gegen die Beispieltrajektorie verglichen. Die Parameter werden in jeder Iteration verändert, bis das Gütemaß einen minimalen Wert erreicht.
Problematisch ist, dass die Beispieltrajektorien nicht in jedem Szenario mit einer geforderten Genauigkeit durch die Regeln nachgeahmt werden können. Um eine Menge von Szenarien zu finden, die die Einhaltung der geforderten Genauigkeit erlauben, könnte die Menge der Trainingsdaten schrittweise vergrößert werden. Können die Anforderungen in einer ausgewählten Menge von Szenarien nicht eingehalten werden, muss die Menge entsprechend verkleinert werden.