Konvink KI-Gesprächstraining
Im Rahmen eines Proof of Concepts (PoC) realisierten wir für die Lernplattform Konvink einen skalierbaren KI-Sprach-Coach. Die Pilot-Lösung demonstriert ein KI-gestütztes Trainingsmodul, das Lernenden ermöglicht, mündliche Gesprächssituationen realitätsnah zu simulieren und direktes Feedback zu erhalten.
- Interaktives Rollenspiel in Echtzeit dank Speech-to-Speech KI
- Automatisierte Transkription und Bewertung nach didaktischen Kriterien
- Einsatz modernster OpenAI Realtime API für geringste Latenz
Beschreibung
Business
Konvink unterstützt Lernende in der beruflichen Grundbildung. Um nicht nur theoretisches Wissen zu vermitteln, sondern auch Handlungskompetenzen zu trainieren, wurde ein KI-basiertes Rollenspiel entwickelt. Im Fokus steht das Training von Gesprächssituationen, wie etwa das Verkaufsgespräch "Wanderschuhe" im Bereich Detailhandel.
Lernende führen dabei einen mündlichen Dialog mit einem KI-Agenten, der die Rolle eines Kunden übernimmt. Dies ermöglicht eine Skalierung von Übungssituationen, die bisher nur aufwendig mit Lehrpersonen möglich waren. Nach dem Gespräch erhält der Lernende eine sofortige Evaluation inklusive Feedback zur Leistung, basierend auf vordefinierten Beurteilungskriterien. Dies fördert die Kundenkommunikation und bietet eine geschützte Umgebung zum Üben.
Tech
Das Herzstück der Lösung bildet die Integration der OpenAI Realtime API. Im Gegensatz zu klassischen Ansätzen (Speech-to-Text → LLM → Text-to-Speech) verarbeitet das eingesetzte Speech-to-Speech-Modell (gpt-4o-realtime-preview) Audioeingaben direkt. Dies sorgt für niedrigste Latenz, flüssigere Dialoge und eine natürlichere Betonung, die auch Emotionen transportieren kann.
Für die anschliessende Bewertung wird das Gespräch transkribiert (gpt-4o-transcribe) und durch ein separates Text-Modell (GPT-4o) anhand von Bewertungskriterien analysiert. Die Evaluation geht dabei über eine reine Sprachniveau-Einstufung hinaus: Die KI agiert als Coach und liefert wertvolle Ratschläge, wie in spezifischen Situationen noch besser, zielführender oder empathischer hätte reagiert werden können.
GUI & Frontend
Während des Rollenspiels wird das gesprochene Wort live transkribiert und angezeigt, sodass Lernende dem Dialogverlauf visuell folgen können
Unmittelbar nach Gesprächsabschluss wird die Bewertung generiert. Anstelle eines unübersichtlichen Fliesstextes werden die Ergebnisse strukturiert und visuell ansprechend aufbereitet. Das Feedback geht detailliert auf einzelne Situationen des Gesprächs ein und bietet konkrete Verbesserungsvorschläge an genau den Stellen, an denen sie relevant sind.