Expertentalk AI
KI im Unternehmen: Warum die Zukunft conversational ist
Vom Konzept zur Umsetzung: Erfolgsfaktoren für Conversational AI
In diesem Expertentalk diskutieren Atreus Direktor Bernhard Gruber und Sarah Rojewski über die Einsatzmöglichkeiten und Herausforderungen von KI-Technologien, insbesondere im Bereich Conversational AI. Rojewski betont, dass solche Projekte keine reinen IT-Vorhaben sind, sondern eine enge Zusammenarbeit zwischen IT und Business sowie eine cross-funktionale Herangehensweise erfordern. Wie sie die Entwicklung der Conversational AI einschätzt und wie man ein solches Projekt in Unternehmen angeht, erfahren Sie in diesem Expertentalk
„Wir wissen, dass die Zukunft conversational ist. Und nichtsdestotrotz sind wir erst ganz am Anfang dieser Reise, was das eigentlich bedeutet, wie wir mit Maschinen sprechen werden, personalisierte Gespräche führen werden, komplett auf mich zugeschnitten.“
Im Folgenden finden Sie eine gekürzte Abschrift des Expertentalks, die aus Gründen der Deutlichkeit bearbeitet wurde.
Bernhard Gruber: Sehr geehrte Damen und Herren, liebe Atreus Zuseher,
ich darf Sie heute recht herzlich zu einem Expertentalk im Atreus Office begrüßen. Das Thema heute: Die Maschine spricht mit mir. Zu diesem Zweck habe ich eine wirkliche Expertin zu uns eingeladen. Sarah Rojewski wird uns darüber berichten, wie weit die Technologie in der Conversational AI fortgeschritten ist. Du hast ja eine langjährige Erfahrung in diesem Gebiet, unter anderem warst du bei der Telefónica Managerin für die Einführung dieser Technologien.
Sarah Rojewski: Ja, vielen lieben Dank für die Einladung. Genau, letztendlich habe ich 2015/2016 das allererste Mal Berührung mit der Technologie gehabt und bei Telefónica den ersten Chatbot implementiert. Zu dem Zeitpunkt haben sehr viele das Thema noch belächelt. Ich weiß noch, als wir das erste Mal vorgestellt und präsentiert haben, hat man es eher als Experiment oder kleines Innovations-U-Boot gesehen und konnte sich noch gar nicht vorstellen, was in den darauffolgenden Jahren mit dieser Technologie passieren würde. Ich habe den Weg dann wirklich über das Doing gefunden und gemerkt, dass das eine komplett neue Art ist, wie wir in der Zukunft mit Kunden interagieren werden. Von diesem Innovations-Boot durfte ich über die Jahre hinweg – von 2016 bis Anfang 2024 – nicht nur diverse Technologien einführen, um eine Omnichannel-Experience mit virtueller Assistenz für alle O2- und Blau-Kunden zu schaffen, sondern auch parallel die Organisationen mit aufbauen.
Das war eines meiner Steckenpferde: Neue Berufsfelder zu entwickeln und Teams sowie Skillsets aufzubauen, die sich um KI drehen. Das ist neben der „KI-Magie“ definitiv eines meiner Lieblingsthemen, weil es zeigt, dass immer eine Organisation hinter einer Innovation steckt.
Bernhard Gruber: Das ist sehr spannend, besonders das Stichwort Organisation. Kommst du eher aus der IT oder aus einer anderen Richtung?
Sarah Rojewski: Spannende Frage, weil ich aus meinem Werdegang heraus eigentlich Geisteswissenschaftlerin bin. Ich komme weder aus der IT-Richtung noch aus der klassischen BWL-Ecke. In meiner Rolle als Managerin für KI und Prozessautomatisierung konnte ich jedoch verschiedene Bereiche miteinander verknüpfen. Denn bei jeder neuen Technologie stehen nicht nur die Performance und die Integration im Vordergrund, sondern auch Effizienzmaßnahmen oder Kostenersparnisse. Es geht immer um den Business Case dahinter.
Das, was ich aus meinem Werdegang mitbringe, ist das Thema Mensch. Wir haben uns stark damit beschäftigt, was emotional und psychologisch passiert, wenn wir plötzlich nicht mehr nur tippen, sondern sprechen und interagieren.
Eine menschliche Konversation führen wir sehr unbewusst, so wie wir es hier gerade tun. Da läuft kein Code im Hintergrund, der uns zuflüstert, was wir sagen sollen – das tun wir ganz automatisch. Wie bringen wir das einer Maschine bei? Und dabei geht es nicht nur um die Kommunikationsebene, sondern auch um eine empathische Ebene.
Bernhard Gruber: Sehr spannend! Ich bin schon ein paar Jahre im Geschäft, auch im Telco-Bereich, und erinnere mich an einfache Systeme mit If-Then-Schleifen. Wie weit ist die Technologie inzwischen fortgeschritten? Kann man wirklich von einem Gespräch reden, oder ist es mehr eine Antwortmaschine?
Sarah Rojewski: Die Wahrheit ist zweigeteilt, wenn man den aktuellen Stand betrachtet. Zum einen arbeiten wir noch mit „Natural Language Understanding“, das ist die Technologie, die heute am häufigsten im Kundenservice oder in Chatbots genutzt wird. Dort sind noch keine „Large Language Models“ im Einsatz. Jetzt bringe ich natürlich ein paar Wörter hier mit ins Spiel.
Das heißt eben noch kein ChatGPT für alle, die wahrscheinlich schon mit ChatGPT interagiert haben.
Und das ist natürlich eine komplett neuartige Technologieform, wie wir Sprache verstehen und wie wir Intentionen von Menschen verstehen, um eine Aktion auszuführen.
Die meisten Chatbots, die wir aber heute in unserem Alltag als normale Endverbraucherinnen und Kundinnen kennen, basieren noch nicht auf dieser Technologie. Das heißt, heute ist natürlich auch eine sehr große Kluft zwischen dem, was wir vielleicht schon erwarten, weil wir sehr hohe Erwartungshaltung an KI haben, weil wir ChatGPT täglich nutzen, und dann auf der anderen Seite rufen wir irgendwo an und stellen fest, dass da der Bot das einfachste Anliegen, die einfachste Formulierung nicht versteht.
Das liegt eben daran, dass die Technologie, wo wir herkommen, basierend auf dem Natural Language Understanding, wir noch gar nicht die Möglichkeit hatten, so differenziert in dieses Verständnis von Sprache reinzugehen, und man überlegt hat, wie im Telco-Bereich: Rechnung ist erstmal ein großer Überbegriff. Da muss man verstehen, ist das Rechnung herunterladen oder Rechnung einsehen. Also es war sehr viel schwieriger, diese Differenzierung reinzubekommen.
Da werden wir uns aber definitiv hinbewegen, weil ich bin natürlich Befürworterin dieser Technologie. Viele sind heute noch so mit dem Bot: „Möchte ich überhaupt gar nicht sprechen.“ Wir werden definitiv dahin kommen, dass wir mit Unternehmens-Konversations-AIs genauso gut uns unterhalten können wie vielleicht heute der eine oder andere das schon mit ChatGPT, Gemini oder Claude macht.
„Auch hier glaube ich, dass es eine Symbiose in irgendeiner Form sein kann. Der Bot ist niemals müde, niemals schlecht gelaunt und der hatte niemals eine schlechte Nacht im Vorfeld und hat dann irgendwie einen acht Stunden harten Arbeitstag vor sich. Das sind alles Faktoren, die natürlich durch Technologie abgefangen werden. Die Bots sind immer on-brand, da muss man sich keine Gedanken machen, wenn das abweicht.“
Bernhard Gruber: Wunderbar. In Vorbereitung für unseren Expertentalk habe ich auch gelesen, dass die Fast-Food-Kette Wendy’s in Amerika beim Drive-In keine Mitarbeiter mehr einsetzt, sondern dass schon Sprachroboter oder Conversational AI eingesetzt wird. Ist das der nächste Schritt, den wir erleben werden, dass an diesen Kundenschnittstellen, Kundenservice in der Regel eher die Maschine sitzen wird und nicht der Mensch?
Sarah Rojewski: Ich hoffe nicht – und warum nicht? Wenn es um komplexe Themen geht. Also wir kennen alle das Gefühl, wenn ich mich mit einem Unternehmen, mit einem Dienstleister eines Produktes auseinandersetzen muss, weil etwas nicht funktioniert, dann ist da Emotionalität dahinter. Dann habe ich mich vielleicht geärgert, weil etwas kaputtgegangen ist oder eine Serviceleistung einfach nicht erbracht worden ist. Dann ist es natürlich aktuell auch sehr schwierig, wenn ich dann nur die Roboter-Stimme habe, die dann auf diese Emotionen überhaupt nicht reagieren kann (Stand heute) und ich dann das Gefühl habe, ich als Kunde, Kundin werde mit meinen Problemen gar nicht wirklich ernst genommen, sondern ich bin nur eine bestimmte Nummer, die irgendwie durchs System geschleust wird.
Trotzdem, wenn wir jetzt an das Wendy’s-Beispiel denken, ist das natürlich ein sehr einfacher Prozess. Es gibt nur ein ausgewähltes Menü. Da kommt jetzt niemand, der über seine emotionalen Probleme spricht. Häufig bei Wendy’s im Drive-Thru sieht man ja noch nicht mal die Person. Also war ja auch in der Vergangenheit nicht so, dass man dann in das Mikrofon eine echte Person hatte. Da ist es nachvollziehbar, in diesem kleinen abgesteckten Rahmen zu sagen, wir haben nur diese 20 Produkte, die bestellt werden können. Warum kann dann diese Annahme nicht einfach verarbeitet werden und dann eine Bestellung ausgelöst werden?
Deswegen glaube ich, dass es eine Differenzierung geben wird: Da, wo wir einfache Dinge und auch für die KI begrenzte Dinge abarbeiten können, und da, wo es wirklich auch den menschlichen Zwischenkontakt braucht. Komplexere Themen, vielleicht wo auch im System etwas falsch gelaufen ist, wo niemals ein Bot das lösen könnte – da möchte ich doch bitte so schnell wie möglich auch die menschliche Hilfe bekommen.
Bernhard Gruber: Mein Erlebnis ist ja in der Regel: Man ruft beim Kundenservice an, es hebt jemand ab, der schlecht ausgebildet ist, der gar nicht helfen kann, vielleicht sprachliche Herausforderungen hat, mich zu verstehen – aus Österreich natürlich immer bisschen schwierig. Aber wo man einfach merkt, man kommt sprachlich nicht zurecht, plus vielleicht auch noch ein Ton Unfreundlichkeit. Also ich würde mich in manchen Situationen fast auf einen Chatbot freuen, der mich versteht, der kompetent ist und wahrscheinlich auch eine Grundfreundlichkeit einprogrammiert hat. Siehst du diesen Trend auch, dass viele Firmen nicht nur aus Effizienzgründen auf AI umsteigen, sondern auch, um den Kunden am Ende des Tages sogar besser zu beraten und besser zu servicieren, als das eine Standard-Customer-Service-Organisation machen könnte?
Sarah Rojewski: Auch hier glaube ich, dass es eine Symbiose in irgendeiner Form sein kann. Der Bot ist niemals müde, der ist auch niemals schlecht gelaunt und der hatte niemals eine schlechte Nacht im Vorfeld und hat dann irgendwie einen acht Stunden harten Arbeitstag vor sich. Das sind alles Faktoren, die natürlich durch Technologie irgendwie abgefangen werden. Die Bots sind immer on-brand, da muss man sich keine Gedanken machen, wenn das abweicht. Man kann relativ schnell auch Informationen mitgeben bezüglich neuer Produkte, neuen Aktionen, Rabattaktionen etc. Das ist natürlich sehr schnell skalierbar.
Auf der anderen Seite habe ich Customer-Service-Organisationen auch von innen gesehen, und ich habe auch gesehen – auch aus Business-Case-Sicht, aber wirklich auch an der Front –, dass das ein Arbeitsumfeld ist, was sehr stressig sein kann, in so einem Call-Center-Umfeld. Mit nicht nur der Lautstärke, sondern natürlich auch mit der Konfrontation mit den Kunden, mit der Geschwindigkeit, mit dem Leistungsdruck, mit dem Verkaufsdruck und mit dem Zeitdruck.
Das sind drei sehr stressige Faktoren, die auf menschliche Mitarbeitende jeden Tag einprasseln. Ich persönlich – und das denken vermutlich viele Unternehmerinnen, Geschäftsführerinnen und Call-Center-Leiter – würde vorschlagen, zunächst Testläufe zu starten. Ziel wäre es, den Zeitdruck bei den Mitarbeitenden zu reduzieren. Weniger Anrufe könnten von menschlichen Mitarbeitenden bearbeitet werden, da KI einen Teil übernimmt, wodurch eine entspanntere Arbeitsatmosphäre entsteht. Ein Gespräch darf dann auch mal eine Minute länger dauern, um sich besser auf individuelle Anliegen einzulassen.
Mit weniger Zeitdruck und einer besseren Arbeitsumgebung könnten Mitarbeitende womöglich freundlichere und effektivere Leistungen erbringen, was zu höherem Abverkauf führt. Es gibt jedoch Stimmen, die behaupten, dass menschliche Mitarbeitende im Kundenservice vollständig überflüssig werden. Ich sehe das anders: KI wird sicherlich ein wichtiger Bestandteil und unsere Begleiter im Alltag werden, aber ich denke nicht, dass sie Menschen komplett ersetzen kann. Vielmehr brauchen wir ein Umdenken in unserer Arbeitsweise im Kundenservice.
Auch bei der Sprachbarriere wird uns KI helfen können. Perspektivisch könnten wir internationalen Service in der jeweiligen Muttersprache der Kunden anbieten. Experten in Deutschland könnten komplexe Themen auf Deutsch bearbeiten, während KI in Echtzeit übersetzt, sodass der bestmögliche Informationsgehalt übermittelt wird. Sprache würde so keine Barriere mehr darstellen.
Auch das Konzept von KI-Assistenten für Mitarbeitende ist spannend. Customer-Service-Mitarbeitende könnten eine KI als Co-Piloten zur Seite gestellt bekommen. Diese KI würde beispielsweise fachlichen Content liefern, während der menschliche Mitarbeitende sich auf den zwischenmenschlichen Aspekt konzentriert. Solche „Whisper Agents“ arbeiten im Hintergrund, schlagen Produktempfehlungen oder Verkaufsstrategien vor und entlasten so die Mitarbeitenden.
Die Symbiose entsteht dann nicht zwischen Endkunden und KI, sondern zwischen Mitarbeitenden und KI. Diese Zusammenarbeit könnte viele Prozesse in der Kundenbetreuung verbessern und den Umsatz steigern. Dabei wird KI nicht nur im Kundenservice hilfreich sein, sondern auch in anderen Bereichen wie der Erstellung von Präsentationen.
Bei der Umsetzung eines solchen Projekts ist jedoch zu beachten, dass es kein reines IT-Projekt ist. Vielmehr müssen Technologie und menschliche Aspekte gleichwertig berücksichtigt werden. Wir haben in der Vergangenheit gesehen, dass es oft lange dauert, bis neue Technologien massentauglich werden oder einen klaren Business-Case erfüllen. Ein strukturierter und nutzerzentrierter Ansatz ist daher entscheidend, um solche Projekte erfolgreich umzusetzen.
Bernhard Gruber: Sarah, du hast uns jetzt sehr viel Spannendes über diese Technologie und über die Einsatzmöglichkeiten erzählt. Ich bin überzeugt davon, dass unsere Zuseher, Manager, Führungskräfte, Unternehmer jetzt auch eine Lust entwickelt haben, das Thema intensiver einzusteigen. Wie setzt man so ein Projekt auf? Was gehört dazu? Auf was muss man aufpassen? Was sind so Pitfalls, wie man so schön sagt, die man lieber nicht machen sollte?
„Ziel wäre es, den Zeitdruck bei den Mitarbeitenden zu reduzieren. Weniger Anrufe könnten von menschlichen Mitarbeitenden bearbeitet werden, da KI einen Teil übernimmt, wodurch eine entspanntere Arbeitsatmosphäre entsteht. Ein Gespräch darf dann auch mal eine Minute länger dauern, um sich besser auf individuelle Anliegen einzulassen. […] KI wird sicherlich ein wichtiger Bestandteil und unsere Begleiter im Alltag werden, aber ich denke nicht, dass sie Menschen komplett ersetzen kann. Vielmehr brauchen wir ein Umdenken in unserer Arbeitsweise im Kundenservice.“
Sarah Rojewski: Mein Lieblingsthema, weil das nämlich auch mit dem Menschen zusammenhängt, bei IT oder KI ist kein IT-Projekt. Also das ist glaube ich schon mal auch ein Learning natürlich aus der Vergangenheit, dass wir festgestellt haben, Technologie war schon sehr fortgeschritten und wir haben uns alle schon gewünscht, dass die Technologie massentauglich ist und haben dann Jahre gebraucht, bis sie entweder einen bestimmten Business-Zweck erfüllt haben oder auch einen Business-Case erreicht haben oder dann so state of the art geworden ist, wie heute unsere App-Nutzung, dass unsere Kundinnen und Kunden einfach mehr digital unterwegs sind, als jetzt zum Beispiel zum Hörer zu greifen. Das hat ja relativ lange gedauert und wir mussten aktiv dafür kämpfen.
Und ein Schlüsselfaktor und ein Learning aus dieser Vergangenheit ist definitiv, dass solche Projekte sehr viel effizienter und zielgerichteter aufgesetzt werden können, wenn wir von Anfang an cross-funktional denken. Und natürlich brauchen wir eine Plattform, wir brauchen einen Technologie-Provider, der wirklich auch eine Plattform bietet, mit der wir als Unternehmen umgehen können. Also da ist natürlich dann das ganze Thema Low-Code-Ansatz auch ein relevantes zu diskutieren, weil wir die Möglichkeit haben, mit einer Low-Code-Oberfläche Konversationen für Voice und Chatbots zu bauen, mit weniger IT-Hintergrund, weil nicht mehr alles hart gecoded ist, sondern ich auch aus der Business-Sicht heraus Konversationen erstellen kann und eben dann mit der IT zusammen in die Umsetzung bringen kann, den Use-Case.
Das heißt, habe ich erstmal das Fundament neben der Technologie-Auswahl, wo dann schon alle Stakeholder involviert sein sollten, ist dann das Thema der Zusammenarbeit zwischen Business und IT und nicht nur ein Dahinstellen der Technologie und hoffen, dass es gut wird und dass der Use-Case umgesetzt ist. Und im besten Fall eben auch nicht als nur einmalige Entwicklung anzusehen. Also das ist der große Unterschied zu vielleicht vorherigen gegangenen Digitalisierungsprojekten, dass wenn ich in einer Applikation einen Use-Case in App oder Web zur Verfügung gestellt habe, dann war der da und im besten Fall hat der einfach funktioniert. Wenn man mal einen Bug hatte, dann wurde der behoben, aber dann war der da.
In Conversational AI ist das ein bisschen volatiler bzw. habe ich viel mehr Faktoren und Risiken, die einfach auch im In-Life betrachtet werden müssen. Man muss konstant überprüfen, wie interagiert denn der Mensch mit der Maschine und wir entwickeln uns auch weiter, wie wir sprechen.
Sarah Rojewski: Und da ist eben diese konstante Weiterentwicklung und Optimierung im Blick zu haben und nicht zu sagen, einmal entwickelt und nie wieder angeguckt. Das ist, glaube ich, nur der zweite Aspekt: Organisation, cross-funktionale Zusammenarbeit, dann das Continuous Improvement, um auch auf gesellschaftliche Entwicklungen eingehen zu können. Das sehen wir heute schon. Wir sprechen allein nach zwei Jahren laut GPT schon ganz anders mit Bots als eben vor zwei Jahren.
Und das dritte ist natürlich auch ein ganz kleines bisschen den langen Atem für die Vision, weil künstliche Intelligenz nicht kostengünstig ist. Wir sehen häufig vielleicht das große Versprechen von Effizienzsteigerung oder Kosteneinsparung. Nichtsdestotrotz ist ein Invest notwendig, und der ist auch nicht klein, um die Technologie so zu feintunen, dass sie für mein Business gut funktioniert. Und dann eben zu sagen, das braucht vielleicht auch das eine oder andere Jahr, um dann die Früchte zu tragen.
Und wir wissen, dass die Zukunft conversational ist. Ich glaube, das ist eines meiner Lieblingssätze, die ich 2015 gesagt habe, die noch niemand richtig einordnen konnte. Ich glaube, mittlerweile kriegen wir so ein Gefühl dafür. Und nichtsdestotrotz sind wir erst ganz am Anfang dieser Reise, was das eigentlich bedeutet, wie wir mit Maschinen sprechen werden, personalisierte Gespräche führen werden, komplett auf mich zugeschnitten.
Und das ist, glaube ich, da das Visionsthema: nicht zu schnell aufzugeben, nicht zu sagen, wir probieren das mal und dann vielleicht doch schneller einzustampfen, sondern daran zu glauben, dass wir uns gesellschaftlich einfach in die Richtung entwickeln – in Richtung Personalisierung, in Richtung Konversation – und KI wirklich einsetzen zu können, über alle Geschäftsbereiche hinweg. Also, AI ist kein IT-Projekt.
„Das, was ich aus meinem Werdegang mitbringe, ist das Thema Mensch. Wir haben uns stark damit beschäftigt, was emotional und psychologisch passiert, wenn wir plötzlich nicht mehr nur tippen, sondern sprechen und interagieren.Eine menschliche Konversation führen wir sehr unbewusst, da läuft kein Code im Hintergrund, der uns zuflüstert, was wir sagen sollen – das tun wir ganz automatisch. Wie bringen wir das einer Maschine bei? Und dabei geht es nicht nur um die Kommunikationsebene, sondern auch um eine empathische Ebene.“