
CAPTCHAの進化とAIの進化とのいたちごっこ 67
人かどうかを見破るのは難しくなるいっぽう 部門より
あるAnonymous Coward 曰く、
Microsoft ResearchはAsirraという画像ベースのCAPTCHAを開発しているが、これを破るプログラムが既に開発されているそうだ(Technology Review・本家記事)。
Asirraは表示される犬や猫の画像から、すべての猫(or犬)の画像を選択するという認証方法であるが、 パロアルト研究所のPhillipe Golle氏は83%の確率で画像が犬か猫か識別できるプログラムを開発した。Asirraの画像はPetfinder.comというペットの里親募集サイトが提供している300万の画像が元になっているが、Goll氏はこのサイトから8,000点の画像集め、トライアル&エラーを通して犬と猫を見分けられるよう学習させた。識別は画像の色とテクスチャを統計分析して行われ、特に犬のピンク色の舌と猫の眼の緑色が識別の鍵となったそうだ。
(つづく...)
Golle氏曰く「機械学習は情報集約に非常に長けている」とのことだが、各画像の識別率は高くてもAsirraでは12点の画像を識別しないといけないため、実際の突破率は10.3%に落ちてしまうとのこと。
現在広く使われているテキストベースのCAPTCHAはBotの精度が上がるにつれ難読化しており、人間にも難しくなってきている。そこで次はユーザに問題を解かせる形式のCAPTCHAが開発されていたが、本格稼動する前に破られたかたちとなる。CAPTCHAはAI研究の格好の課題となり、スパマーによって進化させられるCAPTCHAがAI研究を推し進めている面があるようだ。
とはいえ、スパマーは低賃金労働者を雇いCAPCHAを破らせているという報告もされているように、実際のスパマーがこのようなプログラムを開発しているかというのはまた別問題である。
猫と犬じゃそもそも違いがありすぎる (スコア:3, おもしろおかしい)
例えば
・松本零士の女性キャラを12人並べて鉄郎の母親を当てさせる
みたいな……。
#あだち充の、でもいいかも知れない。
Re:猫と犬じゃそもそも違いがありすぎる (スコア:3, おもしろおかしい)
Re:猫と犬じゃそもそも違いがありすぎる (スコア:1, 興味深い)
Re:猫と犬じゃそもそも違いがありすぎる (スコア:1)
ヽ(・Д . )ノ
Re: (スコア:0)
覚えているだけで3人ぐらいに「犬ですか?」「犬ですよね?」と言われましたことを思い出しました。
というわけで、一部の個体は人間にとっても区別が難しいように思われます。
Re:猫と犬じゃそもそも違いがありすぎる (スコア:3, おもしろおかしい)
【米を選べ】
# 無茶を言うな
Re:猫と犬じゃそもそも違いがありすぎる (スコア:2, おもしろおかしい)
「おとこのこを選べ」認証
というのはどうでしょうか。
#いくらなんでもAC
Re:猫と犬じゃそもそも違いがありすぎる (スコア:1)
女装少年の絵って描いてる時は主として少女を描くルーチン(?)が走ってる気がするMy脳内。
少年を描いているんだという設定を思い浮かべながら、手は少女を描く感じ。
…というわけでそもそも描いてる方がそうだとする結果の画像は極めて少女的になるだろうから、
設定を聞かずに絵だけで見分けるのは難しかろうw
思うに、こういう状況にならない女装少年の描き手は相当の名手。
Re:猫と犬じゃそもそも違いがありすぎる (スコア:1)
ですかw
-- 「奇跡は起こしてこそ価値があるものよ」by ミサト
Re:猫と犬じゃそもそも違いがありすぎる (スコア:1)
the.ACount
Re:猫と犬じゃそもそも違いがありすぎる (スコア:1, おもしろおかしい)
Re:猫と犬じゃそもそも違いがありすぎる (スコア:1, おもしろおかしい)
Re:猫と犬じゃそもそも違いがありすぎる (スコア:1)
ここはむしろルールを秘匿してたぬきの化かしあい競争に持ち込むのも一興かと。
Re:猫と犬じゃそもそも違いがありすぎる (スコア:2, すばらしい洞察)
所詮認証なんて絶対ではなく費用対効果。
代わりに雇う低賃金労働者の賃金より計算機での実現が高くつくようなら上等かと。
将来的には人間の脳と計算機の計算論的差異を考慮して各々の計算量というコストを評価できるようにしないと効果が上がらなくなるということなんでしょう。
Re:猫と犬じゃそもそも違いがありすぎる (スコア:1)
Re:猫と犬じゃそもそも違いがありすぎる (スコア:1)
#昇順に並べさせたはずなのに降順になる不思議。
Re: (スコア:0)
Re:猫と犬じゃそもそも違いがありすぎる (スコア:1)
高い金かけてCAPTCHAシステム開発して結局はいたちごっこに陥る羽目になるより
低賃金労働者をクラスタ化して申し込み受け付けるようにしたほうがトータルで安かったりして。
# BOT側が高性能化してこれが破られるようになったら本気で人類の危機かも
# そもそもその前に申し込みDoSが容易ってのはだめか
バックエンドでは何を回しているんだろう (スコア:3, 興味深い)
SPAMのパターン学習に使われるようなベイジアンフィルタが
バックエンドに走っていて判定してたのかな。
Re:バックエンドでは何を回しているんだろう (スコア:2, 参考になる)
1. 学習サンプルを、人手で犬とネコに分ける
2. HSV カラー座標空間を分割して、色の種類を1000個とか決めておく(各色は、体積を持つ空間で表される)
3. 各画像を、縦横等間隔で小画像に分割する
4. 各色をについて、その色のピクセルを持つ小画像があるかどうかを調べる
(これがその画像の特徴ベクトルになる)
5. SVM で犬とネコの特徴ベクトルを学習
論文の前半だけ読んだら、こんな感じでした。
Re:バックエンドでは何を回しているんだろう (スコア:1)
対抗策 (スコア:2, すばらしい洞察)
> 特に犬のピンク色の舌と猫の眼の緑色が識別の鍵となったそうだ。
画像を白黒にすれば、とりあえず精度は下がりそうな。
Re:対抗策 (スコア:3, おもしろおかしい)
まぁ、白黒だと、人間でも見分けがあまりつかないですし。
http://www.gatch.jp/osugi.html [gatch.jp]
Re: (スコア:0)
犬の写真は舌を出していないものだけ、猫の写真は目が光ってないものだけ、それでいいんじゃない?
Re:対抗策 (スコア:1)
もしくはAIのためのダミー抽象画を用意するなど。
犬猫画検索エンジン+特徴交換エンジン+抽象画像生成エンジン
Re: (スコア:0)
逆手にとってやれ (スコア:2, おもしろおかしい)
では無料メールの登録時限定だがこれならどうだ。
/* 表示されるもののうち、迷惑メールはユーザーが手動で迷惑メール送りにしたもの、すなわちフィルタを通り抜けたものに限られる。迷惑メール以外は公開MLのログや、ビジネスメールテンプレート等から生成される他、社内で文面から誤判別されてしまうものを作成 */
そしてこうなる:
新方式 (スコア:1)
Re:新方式 (スコア:1)
#「うなぎと蛇」とかなら色が似通った個体だと人間は判別できるけどコンピューターには難しいかも。
神社でC#.NET
Re:新方式 (スコア:1)
Re:新方式 (スコア:1)
CAPTCHA considered harmful (スコア:1, すばらしい洞察)
視覚障害者にとってだけではなく、健常者にとっても判別が難しく、
非常に不便なソリューションになってきている。
おそらくボットによるアカウント取得が最も防御したい攻撃先だと思うが、
別の方法を考えたほうがよい時期に来ていると思う。
アカウント取得とかの重要なフォーム以外は
もっと簡単な方法で防御できることがほとんどだし。
Re:CAPTCHA considered harmful (スコア:1, 興味深い)
>別の方法を考えたほうがよい時期に来ていると思う。
いや、最初に破られた時点から、別の方法はいろいろ研究されている事でしょう。ただ実用的かつ効果的なアイデアが生まれて来ないだけ。
Re:CAPTCHA considered harmful (スコア:1)
IDゲット。
「婆ちゃん、オレオレ。携帯壊れちゃって、ちょっと貸して。バイク便が行くから渡してね。」
携帯ゲット。
そんなもんが個人識別に使えるとは思えない。
別アプローチができないかな (スコア:1)
サービス提供者側で、申込者が機械か人間かをパッシブに判別しようという考え方自体が。
いっそのことパッシブに判断するのはやめて、回線業者のユーザ認証を何らかの形で
外部からオープンに使えるような共通フレームワークってないものですかねぇ。
たとえば、IPアドレスを逆引きするとDNSレコードのどっかに
回線契約者ごとにユニークなハッシュ(例えば1日ごとに変わる)がかかれてて
それを参照することで1回線契約で何十人もの申し込みをしようとする奴を蹴れるようにするとか。
高木先生の恐れるインターネット終了の日がやってきそうですね。
でもネットイナゴ全滅で池田先生狂喜。
Re:別アプローチができないかな (スコア:1)
確実なのは申込時に住所を入力させて、認証キーを書いたハガキなり何なりを郵送することなんでしょうけど、かなりコストがかかりますしね。
むしろUSB接続か何かのトークンみたいなのを格安で一般販売して、「このWebサービスは1トークンで1回登録できます」とかやればいいんじゃないかしら。(特定のWebサービスを登録しても別のWebサービスは同じトークンで登録できるので、1つ購入すれば対応サービス全てを1回ずつ利用できる、という話です。)
そんなもの全世界で販売できる企業があるの?という問題はありますが、とりあえずそれ1個買っておけば普通に使う分にはあまり困らないから負担は少ないと思います。
神社でC#.NET
Re:別アプローチができないかな (スコア:1)
BOTネットワークのパージも楽になりそうだなぁと思ったり。
オフライン前提なら方法はいろいろありそうですね。
おっしゃられているUSBトークンなり、主流となりつつある携帯電話メールアドレス認証なり、
はがきでの住所認証なり、ふと思いついたIVRを使った電話番号認証なり、
役所の住民票ベースの電子証明書発行なり、免許書番号認証なり、
クレジットカード番号認証なり、パスポート番号認証なり・・・・。
結局はインターネット以外の、より信頼できるメディア上で
個人を認証するという仕組みが確実そうですが、なんとなく
インターネット=個人特定性に劣るもの
オフラインの手段=個人の特定が可能なもの
という前提で進めなければならないのが残念です。
# なんとかならんものか。
スタティック以外のIPアドレスを禁止すればいいんだ (スコア:1)
メイドロボが実現すれば (スコア:1)
でも、人間と同様の思考形態が本当に実現すれば、そうなっちゃう?
#シルファ派なのでID
Re:メイドロボが実現すれば (スコア:1)
そんな大層なもんじゃない。
エサがどっちにあるかを視覚で判断するのは昆虫でもやること。
フォークト=カンプフ検査 (スコア:1)
余計なもの (スコア:0)
なんて余計なプログラムを開発してくれたんだ・・・。
畜生! (スコア:1)
畜生!科学は未来すらも支配しようというのか!
Re:畜生! (スコア:3, おもしろおかしい)
データを自前で用意しないと (スコア:0)
Re:人力? (スコア:1)
処理時間がかかると思われるので、最終的な効率としては多少はずれがあったとしても
自動化した方がいい、ってな事になったりしませんかね。
Re:JT (スコア:1, すばらしい洞察)
Re:JT (スコア:1)
Re:JT (スコア:1)
「しかめっ面はともかく」と書いたわけですが。
難易度評価の指針として。
#いや、どっちかっつうと猫がしかめっ面すると犬になるかな?
Re:JT (スコア:1)
JTとしては、しかめっつらの高校生でも子供と識別できる自販機が怖い=欲しいってこと