Konvink KI-Gesprächstraining

Im Rahmen eines Proof of Concepts (PoC) realisierten wir für die Lernplattform Konvink einen skalierbaren KI-Sprach-Coach. Die Pilot-Lösung demonstriert ein KI-gestütztes Trainingsmodul, das Lernenden ermöglicht, mündliche Gesprächssituationen realitätsnah zu simulieren und direktes Feedback zu erhalten.



Screenshot der Konvink Auswertung
Auftraggeber Konvink AG
Highlights
  • Interaktives Rollenspiel in Echtzeit dank Speech-to-Speech KI
  • Automatisierte Transkription und Bewertung nach didaktischen Kriterien
  • Einsatz modernster OpenAI Realtime API für geringste Latenz
Screenshot der Konvink Auswertung

Beschrei­bung

Business

Konvink unterstützt Lernende in der beruflichen Grundbildung. Um nicht nur theoretisches Wissen zu vermitteln, sondern auch Handlungskompetenzen zu trainieren, wurde ein KI-basiertes Rollenspiel entwickelt. Im Fokus steht das Training von Gesprächssituationen, wie etwa das Verkaufsgespräch "Wanderschuhe" im Bereich Detailhandel.

Lernende führen dabei einen mündlichen Dialog mit einem KI-Agenten, der die Rolle eines Kunden übernimmt. Dies ermöglicht eine Skalierung von Übungssituationen, die bisher nur aufwendig mit Lehrpersonen möglich waren. Nach dem Gespräch erhält der Lernende eine sofortige Evaluation inklusive Feedback zur Leistung, basierend auf vordefinierten Beurteilungskriterien. Dies fördert die Kundenkommunikation und bietet eine geschützte Umgebung zum Üben.


Tech

Das Herzstück der Lösung bildet die Integration der OpenAI Realtime API. Im Gegensatz zu klassischen Ansätzen (Speech-to-Text → LLM → Text-to-Speech) verarbeitet das eingesetzte Speech-to-Speech-Modell (gpt-4o-realtime-preview) Audioeingaben direkt. Dies sorgt für niedrigste Latenz, flüssigere Dialoge und eine natürlichere Betonung, die auch Emotionen transportieren kann.

Für die anschliessende Bewertung wird das Gespräch transkribiert (gpt-4o-transcribe) und durch ein separates Text-Modell (GPT-4o) anhand von Bewertungskriterien analysiert. Die Evaluation geht dabei über eine reine Sprachniveau-Einstufung hinaus: Die KI agiert als Coach und liefert wertvolle Ratschläge, wie in spezifischen Situationen noch besser, zielführender oder empathischer hätte reagiert werden können.


GUI & Frontend

Während des Rollenspiels wird das gesprochene Wort live transkribiert und angezeigt, sodass Lernende dem Dialogverlauf visuell folgen können

Unmittelbar nach Gesprächsabschluss wird die Bewertung generiert. Anstelle eines unübersichtlichen Fliesstextes werden die Ergebnisse strukturiert und visuell ansprechend aufbereitet. Das Feedback geht detailliert auf einzelne Situationen des Gesprächs ein und bietet konkrete Verbesserungsvorschläge an genau den Stellen, an denen sie relevant sind.

Einge­setztes Know‑how

Kern­kompe­tenzen