Wenn vertraute Stimmen täuschen – wie Voice Cloning Ihr Internes Kontrollsystem auf die Probe stellt

Gert Poglin 15. Juni 2026

Wenn Vertrauen zum Risiko wird

In der Buchhaltung, im Einkauf oder im IT-Helpdesk müssen täglich zahlreiche Anliegen bearbeitet werden. Mal geht es um eine dringende Zahlung, mal um die Änderung von Lieferanten-Stammdaten, mal um einen Passwort-Reset. Die meisten dieser Geschäftsfälle sind legitim. Doch eine einzige manipulierte Anfrage kann ausreichen, um erheblichen finanziellen Schaden zu verursachen.

Genau diese alltäglichen Situationen stehen zunehmend im Fokus von Angreifern. KI-gestütztes Voice Cloning ermöglicht es Betrügern, Stimmen realer Personen täuschend echt nachzubilden und ihnen beliebige Aussagen in den Mund zu legen. Dadurch können sie scheinbar authentische Anweisungen und Freigaben erteilen oder Personen zu Handlungen bewegen, die sie sonst nicht ausführen würden. Oft genügen bereits wenige Sekunden öffentlich verfügbaren Audiomaterials, um eine Stimme überzeugend zu reproduzieren.

Wie groß die Verunsicherung in Unternehmen bereits ist, zeigt eine von business.com veröffentlichte Studie aus dem Jahr 2024. Darin gaben 32 Prozent der befragten Führungskräfte an, kein Vertrauen darin zu haben, dass ihre Mitarbeitenden Deepfake-Betrugsversuche zuverlässig erkennen würden.¹

Die hohe Qualität der Fälschungen ist jedoch nur ein Teil des Problems. Viele Organisationen verlassen sich immer noch darauf, dass Mitarbeitende einen Betrugsversuch rechtzeitig aufdecken. Wird die Manipulation nicht bemerkt, fehlen oft Kontrollen, die den Schaden im Ernstfall dennoch verhindern.

Warum Voice Cloning mehr als ein IT-Problem ist

Im Kontext von Governance, Risk und Compliance (GRC) ist AI Voice Cloning Fraud vor allem deshalb relevant, weil die Angriffe unmittelbar in kritische Geschäftsprozesse eingreifen. Betroffen sind häufig Abläufe mit finanziellen, regulatorischen oder operativen Auswirkungen. Dazu gehören etwa Zahlungsfreigaben, Stammdatenänderungen oder die Vergabe von Zugriffsrechten.

Kritisch wird es vor allem, wenn eine vermeintlich legitime Anweisung unmittelbar zu einer Handlung mit schwerwiegenden Auswirkungen führt. Fehlen zusätzliche Freigaben, Rückrufverfahren oder andere unabhängige Kontrollen, kann aufgrund einer einzelnen Manipulation schnell ein erheblicher Schaden entstehen. Die entscheidende Frage ist deshalb nicht nur, ob ein Deepfake erkannt wird, sondern ob Prozesse auch dann schützen, wenn die Täuschung zunächst glaubwürdig erscheint.

Wie real dieses Risiko ist, zeigt ein 2024 bekannt gewordener Betrugsfall in Hongkong. Ein Mitarbeitender im Finanzbereich nahm dort an einer Videokonferenz mit vermeintlichen Führungskräften teil. Tatsächlich handelte es sich um KI-generierte Deepfakes mit täuschend echt geklonten Stimmen, die ihn dazu überredeten, Überweisungen von rund 25 Millionen US-Dollar zu veranlassen.² Der Fall verdeutlicht, dass Deepfake-Betrug längst keine theoretische Bedrohung mehr ist, sondern reale Geschäfts- und Zahlungsprozesse treffen kann.

Wo AI Voice Cloning Fraud besonders häufig ansetzt

Deepfake-Betrug erfolgt selten nach dem Gießkannenprinzip. In den meisten Fällen handelt es sich um gezielte Social-Engineering-Angriffe auf Prozesse, in denen Zeitdruck, Diskretion oder persönliche Kommunikation eine wichtige Rolle spielen. Besonders anfällig sind Abläufe, bei denen eine mündliche Anweisung als ausreichende Legitimation wahrgenommen wird.

Typische Risikoszenarien sind zum Beispiel:

Zahlungsfreigaben per Telefon, Voicemail oder Videocall
Änderungen von Stammdaten nach telefonischer Anweisung
Bestellanforderungen im Einkauf mit Hinweis auf besondere Dringlichkeit
Passwort-Resets oder Identitätsfreigaben im IT-Helpdesk
Freigaben außerhalb regulärer Prozesse durch vermeintliche Führungskräfte

Vor allem CEO Fraud Deepfakes erzeugen zusätzlichen Druck. Mitarbeitende glauben, mit einer Führungskraft zu sprechen, die Vertraulichkeit einfordert und eine schnelle Entscheidung erwartet. Solche Angriffe sind besonders erfolgreich, wenn betroffene Personen unter Zeitdruck stehen, wenig Erfahrung in ihrer Rolle haben oder die Anweisung nicht unabhängig verifizieren können.

Hinzu kommt, dass viele Unternehmen unterschätzen, wie überzeugend ein AI Voice Scam wirken kann. Deshalb reicht Voice Cloning Detection allein nicht aus. Wer sich ausschließlich darauf verlässt, einen Betrugsversuch zu erkennen, reagiert oft erst dann, wenn der Angriff bereits erfolgreich war.

Welche Kontrollen vor Voice Cloning Fraud schützen

Ein wirksames Internes Kontrollsystem muss nicht jeden Betrugsversuch gleich bei der ersten Kontaktaufnahme erkennen. Entscheidend ist, dass kritische Handlungen an verbindliche Kontrollschritte gebunden sind. In der Praxis lässt sich das vergleichsweise einfach umsetzen: Beispielsweise sollten Zahlungen oberhalb definierter Schwellenwerte stets eine zusätzliche Freigabe erfordern. Telefonische Zahlungsanweisungen dürfen nicht unmittelbar ausgeführt werden, sondern müssen über bereits verifizierte Kontaktdaten rückbestätigt werden. Änderungen von Lieferanten- oder Bankdaten sollten erst nach einer unabhängigen Bestätigung über einen zweiten Kommunikationskanal wirksam werden. Im IT-Helpdesk wiederum sollte ein Passwort-Reset grundsätzlich auf einer strukturierten Identitätsprüfung und nicht allein auf einer mündlichen Anfrage basieren.

Solche Kontrollen reduzieren das Risiko von AI Voice Cloning Fraud erheblich. Sie schaffen zusätzliche Prüfebenen, die auch dann greifen, wenn Anweisungen zunächst glaubwürdig erscheinen. Entsprechend empfehlen Sicherheitsbehörden, bei ungewöhnlichen oder dringenden Anfragen nicht sofort zu handeln, sondern Anweisungen vorher zu verifizieren.

Auch Deepfake Voice Detection kann beim Umgang mit solchen Betrugsfällen nützlich sein. Ungewöhnliche Gesprächsverläufe, ausweichende Antworten oder sprachliche Inkonsistenzen können auf eine Manipulation hindeuten. Verlässlichen Schutz bieten solche Anzeichen jedoch nicht. Ein wirksames IKS muss deshalb sicherstellen, dass kritische Prozesse auch dann abgesichert bleiben, wenn ein Voice Deepfake zunächst nicht erkannt wird.

Kontrollen sind nur wirksam, wenn sie auch umgesetzt werden

Viele Unternehmen verfügen bereits über geeignete Maßnahmen, um Betrugsrisiken zu reduzieren. Trotzdem ist es schwierig, den Überblick über deren tatsächliche Einhaltung und Wirksamkeit zu behalten. Risikomanager sollten sich deshalb folgende Fragen stellen:

Welche Risiken werden durch bestehende Kontrollen adressiert?
Welche Maßnahmen werden im Alltag konsequent durchgeführt?
Wo bestehen Lücken?

Gerade bei AI Voice Cloning Fraud reicht es nicht aus, Kontrollen bloß zu definieren. Unternehmen müssen klar nachvollziehen können, wer für ihre Durchführung verantwortlich ist, welche konkreten Risiken durch sie verringert werden und ob sie tatsächlich wie vorgesehen wirken. Fehlt diese Transparenz, bleiben Schwachstellen oft unentdeckt.

Genau hier setzt modernes Kontrollmanagement an. Mit BIC Internal Control lassen sich Risiken, Kontrollen und Verantwortlichkeiten strukturiert miteinander verknüpfen. So wird schnell erkennbar, wo Handlungsbedarf besteht und wie sich das Kontrollsystem gezielt stärken lässt. Das ist insbesondere im Umgang mit AI Voice Cloning Fraud und anderen Formen von Deepfake-Betrug von entscheidender Bedeutung.

Fazit

Die zunehmende Verbreitung von Voice Cloning macht deutlich, dass eine vertraute Stimme allein keine verlässliche Grundlage für Entscheidungen mehr ist. Es genügt nicht, auf die Erkennung von Deepfakes durch Mitarbeitende zu setzen. Entscheidend ist, dass kritische Prozesse auch dann geschützt bleiben, wenn manipulierte Anweisungen zunächst glaubwürdig erscheinen.

Die wirksamste Antwort auf AI Voice Cloning Fraud sind klare und verbindliche Kontrollen. Dazu gehören etwa Rückrufverfahren, zusätzliche Freigaben oder strukturierte Identitätschecks. Ebenso wichtig ist ihre konsequente Umsetzung und regelmäßige Überprüfung.

Unternehmen, die Risiken, Kontrollen und Verantwortlichkeiten systematisch miteinander verknüpfen, werden widerstandsfähiger gegenüber Voice Cloning, AI Voice Fraud und anderen Formen von Deepfake-Betrug.

Finden Sie mit unserem Self-Check heraus, wie gut Sie Cyberrisiken meistern!

¹Quelle: https://www.business.com/articles/deepfake-threats-study/

²Quelle: https://www.theguardian.com/technology/article/2024/may/17/uk-engineering-arup-deepfake-scam-hong-kong-ai-video

Frequently asked questions

Wie funktioniert Voice-Cloning-Betrug?

Angreifer erstellen mithilfe von künstlicher Intelligenz eine täuschend echte Kopie einer realen Stimme. Dafür genügen bereits kurze Audioaufnahmen aus öffentlichen Quellen wie Interviews, Podcasts oder Social-Media-Videos. Die nachgebildete Stimme wird anschließend genutzt, um Mitarbeitende zu Handlungen zu bewegen, die finanzielle, operative oder sicherheitsrelevante Folgen haben können.

Wie erkennt man Voice Cloning bzw. Voice-Cloning-Angriffe?

Voice Cloning lässt sich oft nur schwer erkennen. Ungewöhnlicher Zeitdruck, die Forderung nach Geheimhaltung, ausweichende Antworten oder der Versuch, bestehende Abläufe zu umgehen, sind typische Warnsignale. Unternehmen sollten sich jedoch nicht darauf verlassen, solche Signale rechtzeitig zu bemerken. Sicherer ist es, Kontrollprozesse zu etablieren und konsequent einzuhalten.

Welche Anzeichen deuten auf eine KI-generierte Stimme hin?

Es gibt keine durchweg zuverlässigen akustischen Merkmale. Manche AI Voice Scams wirken leicht unnatürlich in Betonung, Reaktionsgeschwindigkeit oder Gesprächsfluss. Moderne Systeme klingen jedoch oft so realistisch, dass diese Hinweise fehlen oder zu spät auffallen. Deshalb ist Deepfake Voice Detection als alleinige Schutzmaßnahme nicht ausreichend. Kritische Anweisungen sollten immer unabhängig überprüft werden.

Warum ist Voice Cloning gefährlicher als klassisches Vishing („Voice Phishing“)?

Voice-Cloning-Angriffe bauen gezielt auf Vertrauen und sozialen Druck. Betrüger imitieren dabei die Stimme einer Führungskraft, eines Mitarbeitenden oder eines Geschäftspartners. Dadurch wirken Anweisungen glaubwürdiger und werden eher befolgt.

Wie wird Voice Cloning für Zahlungsbetrug eingesetzt?

Voice Cloning wird oft genutzt, um dringende Zahlungsanweisungen vorzutäuschen, Änderungen von Bank- oder Lieferantendaten anzustoßen oder Freigaben außerhalb regulärer Prozesse zu erwirken. Besonders anfällig sind dabei Abläufe, in denen auf die Glaubwürdigkeit einer Stimme vertraut wird.

Welche Kontrollen schützen am wirksamsten vor Deepfake-Betrug?

Verpflichtende Vier-Augen-Freigaben bei Zahlungen, Rückrufverfahren über verifizierte Kontaktdaten, zusätzliche Prüfungen bei Änderungen von Lieferanten- oder Bankdaten sowie strukturierte Identitätschecks haben sich als wirksame Schutzmaßnahmen bewährt. Entscheidend ist, dass diese Kontrollen konsequent angewendet und nicht umgangen werden können.

Müssen bestehende Prozesse komplett überarbeitet werden?

Nein. In vielen Fällen genügt es, bestehende Prozesse gezielt um zusätzliche Kontrollschritte zu ergänzen. Meist geht es nicht darum, Abläufe grundlegend zu verändern, sondern kritische Stellen durch unabhängige Prüfungen, zusätzliche Freigaben oder klare Verifizierungsverfahren besser abzusichern.