アカウント名:
パスワード:
>CD-ROM2枚ふ~ん
>デンマーク国民約530万人分(ほぼ全国民)の個人情報は?!
CD-ROMはおおよそ600MBなので2枚の合計は1200MB。1MBを100万Bとし無圧縮として、ひとりあたり 1200MB/5.3M人=226B/人TWITTERより多いじゃないか* 名前と省略した住所くらいは入るか。
*Twitterの140文字制限は「文字数」なので多バイト文字のひとは丸儲けなのよね。ありがたやありがたや。
他の言語の文字(漢字など)のコードポイントを勝手に使って1文字でラテン2文字を表示するフォントとか出てきたりしないものかしらと常々思う。
出てきても表示できない…簡易の暗号でやり取りするのにTwitterを使うとかいうイミフな用途でなら行けるのかな
「アルファベット数文字の組み合わせに見えなくもない文字」を、「該当するアルファベット出現順の場合にだけ置換して使用する」とかならできるけど、視認性クソ悪そうだし圧縮率もあまり期待できない気がする。leetとかあるし今更か……
iso-8859-1 の Æ とか?
マップをみるとアクセント記号付きの字を入れてるから空間は埋まっているぽいですな。(言語によっては字が足りないみたい)https://ja.wikipedia.org/wiki/ISO/IEC_8859-1 [wikipedia.org]
㌔㍉?
㌥㌋?
> *Twitterの140文字制限は「文字数」なので多バイト文字のひとは丸儲けなのよね。ありがたやありがたや。
UTF-8の合成はサポートされていないけどね。まあ、「1文字」の定義はむずかしいってことで。
まぁでも「社会保障番号および健康に関する情報」と書いてあるし、番号(バイナリなら数バイト、番号で個人識別できるから名前不要)と病歴の有無とか病気の程度のラベルをのっけとくだけならかなり余裕じゃないでしょうか。
あと圧縮掛けてある可能性もある。似たようなデータも大量だろうしかなり圧縮効くんじゃね?
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
身近な人の偉大さは半減する -- あるアレゲ人
CD-ROM2枚 (スコア:0)
>CD-ROM2枚
ふ~ん
>デンマーク国民約530万人分(ほぼ全国民)の個人情報
は?!
Re:CD-ROM2枚 (スコア:2)
CD-ROMはおおよそ600MBなので2枚の合計は1200MB。
1MBを100万Bとし無圧縮として、ひとりあたり 1200MB/5.3M人=226B/人
TWITTERより多いじゃないか* 名前と省略した住所くらいは入るか。
*Twitterの140文字制限は「文字数」なので多バイト文字のひとは丸儲けなのよね。ありがたやありがたや。
Re:CD-ROM2枚 (スコア:1)
他の言語の文字(漢字など)のコードポイントを勝手に使って1文字でラテン2文字を表示するフォントとか出てきたりしないものかしらと常々思う。
Re: (スコア:0)
出てきても表示できない…
簡易の暗号でやり取りするのにTwitterを使うとかいうイミフな用途でなら行けるのかな
「アルファベット数文字の組み合わせに見えなくもない文字」を、
「該当するアルファベット出現順の場合にだけ置換して使用する」とかならできるけど、
視認性クソ悪そうだし圧縮率もあまり期待できない気がする。leetとかあるし今更か……
Re: (スコア:0)
iso-8859-1 の Æ とか?
マップをみるとアクセント記号付きの字を入れてるから空間は埋まっているぽいですな。
(言語によっては字が足りないみたい)
https://ja.wikipedia.org/wiki/ISO/IEC_8859-1 [wikipedia.org]
Re: (スコア:0)
㌔㍉?
㌥㌋?
Re:CD-ROM2枚 (スコア:1)
> *Twitterの140文字制限は「文字数」なので多バイト文字のひとは丸儲けなのよね。ありがたやありがたや。
UTF-8の合成はサポートされていないけどね。
まあ、「1文字」の定義はむずかしいってことで。
Re: (スコア:0)
まぁでも「社会保障番号および健康に関する情報」と書いてあるし、
番号(バイナリなら数バイト、番号で個人識別できるから名前不要)と
病歴の有無とか病気の程度のラベルをのっけとくだけならかなり余裕じゃないでしょうか。
あと圧縮掛けてある可能性もある。似たようなデータも大量だろうしかなり圧縮効くんじゃね?