パスワードを忘れた? アカウント作成
21558883 story
アメリカ合衆国

米連邦取引委員会、AIによるボイスクローニングから消費者を守るアイディアを募集 24

ストーリー by nagazou
募集 部門より
headless 曰く、

間もなく締め切りとなってしまうが、米連邦取引委員会 (FTC) が AI によるボイスクローニングから消費者を守る手法のアイディアを募集するコンテスト Voice Cloning Challenge を実施し、12 日まで参加を受け付け中だ(プレスリリース公式ルール: PDFThe Register の記事Neowin の記事)。

AI を用いて特定の人物の声を再現するボイスクローニング技術は医療やアクセシビリティの分野で非常に有益な利用が可能だが、詐欺などの悪用も懸念される。コンテストではボイスクローニングの悪用を防ぐ以下のような 3 つのポイントのうち少なくとも 1 つを解決するアイディアが求められる。

  • 防止または認証: 認証されていないユーザーによるボイスクローニングソフトウェアの使用を制限する手法
  • リアルタイム検出または監視: クローンボイスまたはボイスクローニング技術の使用を検出する手法
  • 使用後の評価: オーディオクリップにクローンボイスが含まれているかどうかを確認する手法

コンテストは 18 歳以上米国市民および米国永住者の個人・グループまたは、米国で設立および主に活動している組織が対象となり、優勝賞金 25,000 ドル。準優勝者 1 組に 4,000 ドル、3 組に 2,000 ドルが授与される。ただし、10 人以上の組織は別枠の「FTC Voice Cloning Challenge Large Organization Prize」となり、優勝者は表彰のみ (賞金なし) となる。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by hinatan (24342) on 2024年01月11日 9時44分 (#4591665) 日記

    SPAM判定の理由が分からないから投稿あきらめる

    • by Anonymous Coward

      最近判明したのは『など』(竹冠に寺)を漢字表記するとスパム判定さる
      『等号』は通るようだが『などは』は通らない
      謎すぎる

  • by Anonymous Coward on 2024年01月11日 8時58分 (#4591646)

    画像の方は、撮影カメラがデジタル証明書を付けて、対応アプリで加工し続けている限りはその証明書が有効だけど、非対応アプリで触ったら証明書が無効になる、という技術ができているようななので音声でも同じことできるじゃん、って一瞬思ったけど、フェイク音声をスピーカーで流して、それを対応機材で録音すればいくらでもフェイク音声に証明書が付けられると気づいた。音声だとフェイク判定するのは難しいな。

    • by Anonymous Coward on 2024年01月11日 11時35分 (#4591715)

      典型的な馬鹿なエンジニア的解決法だな。
      コストや制度を無視する連中をどうするかって観点が抜けてる。

      親コメント
    • by Anonymous Coward

      証明書が正しく発行されているとは限らないというのもsymantecのやらかしで露呈してるはずなんだけど
      なんかよくわからんけどデジタル証明書があれば正しいという幻想に陥ってないか?

      いっそAI様にすべてを委ねて人類を浄化しよう

      • by Anonymous Coward

        嘘つきや同じ事を繰り返す奴ばかりになるのは嫌だー

    • by Anonymous Coward

      それは対応機材を減らすことで証明するしかないな。例えば、音声が録音された場所や時間、機体IDをモールス信号みたいなメタデータで混ぜ込んで、別の「対応機材」がそれを元に再録したら、少なくとも場所・時間・機体IDが変化するようにする、とか。

    • by Anonymous Coward

      画像もモニタに映したものを撮影すりゃいいのでその部分は音声と大差ないけどな。

      そんなことすると不自然になっちゃうだろ、という気がしてるのかもしれないけど、クオリティについても、きちんとセッティングすれば問題無い。
      ドラマや映画の撮影に背景のセットを用意する代わりに、でかいスクリーンに背景を写してその前で演技する役者を撮影する、仮想背景システムが既に使われまくってる。

      • by Anonymous Coward

        大体そんなものは白黒フィルムの時代から使われている技術ですよ。
        ちょっと出先でスマホのカメラ使って自撮りしました風の宣伝動画ならクオリティが低くても問題なし。

  • by Anonymous Coward on 2024年01月11日 9時09分 (#4591649)

    対策は無理じゃないかな。
    もう声(電話とか)だけでの契約は基本的に無効のするくらいしか思いつかないけど、現実味無いね。

    • by Anonymous Coward

      全てのコミュニケーションは認定された数種類の合成音声でのみ行う、というふうにすれば完全解決。

  • by Anonymous Coward on 2024年01月11日 10時30分 (#4591680)

    そのままAIに聞いてみなよ
    税金の無駄

    • by Anonymous Coward

      募集したアイディアをAIにラーニングさせるんだろ

    • by Anonymous Coward

      折角政府機関がやるんだから、海の物とも山の物とも付かないアイデアを募集するよりAI悪用者を罰しやすくする法改正案を作った方が抑止力になりそう

    • by Anonymous Coward

      税金は無駄にならないかもしれないけど、はてしなく時間の無駄にしかなりませんよねぇ、それ。

      /*/ って、「はてしなく」を漢字表記したらSPAM判定ですか……。

  • by Anonymous Coward on 2024年01月11日 10時55分 (#4591694)

    こういうテクニカルな解決手法になる可能性の高いアイディア募集だと
    もっと賞金あっても良さそうだけど、実装じゃなくアイディアだけだから?

  • by Anonymous Coward on 2024年01月11日 10時57分 (#4591695)

    もうクローンされることを前提に対処を考えた方がいい

    • by Anonymous Coward

      問題解決的に今はその段階だよなあと思う。

      音声は当該人物の発言であるある程度信頼のおける情報だった。
      → ソフトウェア処理でフェイクを作る事が容易になった
      → ソフトウェア解析でフェイクを見抜く技術が確立された。
      → AIを利用した高度なフェイクが作成できるようになった。
      → 音声情報はフェイクありきで思考することが前提となった。(今ここ)

      フェイクありきが詰められた後またプロセスがループして、それでも信頼できる音声情報の必要性的なものが再考される。
      でも今はそれよりもあらゆる方面のフェイクの品質が非常に高くなっている事を認識して、
      何かを判断する場合に現実に利用可能な情報は何でそれでできる事は何かといった思考を洗練させる段階が必要と思う。

      • by Anonymous Coward

        でもそれってさ、現時点ではヒトが主としてるはずだけど
        AIが主とした場合はどうするんだろ?
        AIが勝手にやったので放置?AIの人格を消去?

  • by Anonymous Coward on 2024年01月11日 11時28分 (#4591709)

    スタンドアロンで動くボイスAIには特定の波形を入れておいて解析すればAI音声だとわかるような仕組みにしたらどーかな
    波形の形でIDがバレる仕組みにしたらさらによい

    サーバーで動くボイスAIはログ残して悪用したのが誰かわかるようにしてさ

  • 「ぺろ……これはAIボイス!」

typodupeerror

開いた括弧は必ず閉じる -- あるプログラマー

読み込み中...