音声クローン詐欺とは、生成 AI の音声合成技術を使って特定の人物の声を模倣し、電話で家族や知人になりすまして金銭を騙し取る詐欺手法です。従来のオレオレ詐欺の進化形ともいえる手口で、わずか 3〜10 秒の音声サンプルから高精度な音声クローンを生成できる技術が悪用されています。
音声クローン技術の急速な進歩が、この詐欺を可能にしました。2023 年時点で、一般に公開されている音声合成ツール (ElevenLabs、VALL-E など) を使えば、短い音声サンプルから本人と区別がつかないほど精巧な音声を生成できます。従来のオレオレ詐欺では声の違いで見破れるケースがありましたが、音声クローンはイントネーション、話し方の癖、声質まで再現するため、家族でも聞き分けが困難です。アメリカの FTC (連邦取引委員会) は 2023 年に音声クローン詐欺の急増を警告し、被害額は年間数億ドルに達すると推計しています。
音声サンプルの入手経路は多岐にわたります。SNS (Instagram、TikTok、YouTube) に投稿した動画、留守番電話のメッセージ、ポッドキャストや配信、さらには企業の代表電話に録音された応答メッセージからも音声を取得される可能性があります。攻撃者は音声サンプルを入手した後、ターゲットの家族構成や生活パターンを SNS から調査し、「事故に遭った」「逮捕された」「急にお金が必要」といったシナリオで電話をかけます。
防衛策の基本は、電話の内容だけで判断しないことです。家族間で合言葉 (ペットの名前、思い出の場所など) を事前に決めておき、金銭の要求があった場合は必ず合言葉で本人確認します。電話でお金の話が出たら一度切り、本人の携帯電話に直接かけ直して事実を確認します。SNS での音声公開を控える、留守番電話のメッセージを短くするなど、音声サンプルの流出を最小化する対策も有効です。発信者番号偽装と組み合わせて家族の番号を表示させるケースもあるため、表示番号だけで安心しないことが重要です。振り込め詐欺の防止策で具体的な対策を確認できます。