
Bing や Cortana のものとされる約 37 GB のソースコードが流出 18
ストーリー by nagazou
流出 部門より
流出 部門より
headless 曰く、
ハッキンググループ Lapsus$ がおよそ 37 GB のソースコードを Microsoft 内部の Azure DevOps サーバーから盗み出したものだと主張し、Torrent ファイルを放流したそうだ (Bleeping Computer の記事、 Cyber Kendra の記事、 The Register の記事、 Neowin の記事)。
Lapsus$ は先週末、本件に関連するスクリーンショットを Telegram に投稿し、その後削除した。Microsoft はLapsus$の主張を認識しており、調査を進めていると述べていた。
ソースコードは 7-ZIP アーカイブに格納されており、圧縮状態で約 9 GB。250 以上のプロジェクトが含まれるという。Lapsus$ の Torrent ファイル放流時のコメントによれば、Bing のソースコードの 90 % 、Bing Maps と Cortana のソースコードの 45 % を含むとのことだ。
内訳 (スコア:1)
拡張子ごとにファイルを分類して
流出ファイル数でソート
count: 78,880 avr: 7KB sum: 559MB .cs
count: 24,250 avr: 82KB sum: 1,949MB .json
count: 19,909 avr: 7KB sum: 151MB .h
count: 15,986 avr: 11KB sum: 181MB .cpp
count: 12,449 avr: 538KB sum: 6,543MB .dll
count: 12,032 avr: 6KB sum: 77MB .pbf
count: 11,071 avr: 234KB sum: 2,534MB .xml
count: 10,704 avr: 3KB sum: 35MB .ll
count: 7,763 avr: 37KB sum: 284MB .png
count: 7,192 avr: KB sum: 5MB .bond
count: 7,044 avr: 344KB sum: 2,372MB .txt
count: 6,579 avr: 2KB sum: 16MB .config
count: 6,578 avr: 29KB sum: 189MB .js
count: 6,437 avr: 23KB sum: 145MB .script
count: 6,014 avr: 6KB sum: 40MB .csproj
count: 4,445 avr: 7KB sum: 33MB .c
count: 4,087 avr: 23KB sum: 93MB .sql
count: 3,931 avr: KB sum: 1MB .meta
count: 3,891 avr: 256KB sum: 974MB .cscfg
count: 3,222 avr: 4KB sum: 15MB .ts
count: 2,788 avr: 7KB sum: 19MB .py
count: 2,660 avr: 2KB sum: 6MB .md
count: 2,516 avr: 5KB sum: 13MB .svg
count: 2,313 avr: 8KB sum: 19MB .module
count: 2,252 avr: 4KB sum: 9MB .java
count: 2,208 avr: 32KB sum: 69MB
count: 2,205 avr: 5KB sum: 11MB .hpp
count: 2,094 avr: 1,646KB sum: 3,366MB .pdb
count: 2,004 avr: 4KB sum: 8MB .m
count: 1,966 avr: KB sum: MB .vspscc
count: 1,672 avr: 14KB sum: 24MB .css
count: 1,609 avr: 16KB sum: 26MB .xaml
count: 1,542 avr: 13KB sum: 20MB .sln
count: 1,493 avr: 3KB sum: 5MB .tsx
count: 1,464 avr: 929KB sum: 1,328MB .exe
count: 1,459 avr: 12KB sum: 17MB .resx
count: 1,422 avr: 6KB sum: 9MB .s
count: 1,135 avr: 4KB sum: 4MB .ps1
count: 1,128 avr: 7KB sum: 7MB .vim
count: 1,097 avr: 11KB sum: 11MB .inl
count: 1,089 avr: 3KB sum: 3MB .cshtml
count: 1,020 avr: 2,273KB sum: 2,264MB .tsv
count: 1,019 avr: 51KB sum: 50MB .ini
count: 984 avr: 33KB sum: 32MB .html
count: 958 avr: 16KB sum: 15MB .cxx
合計サイズでソート
count: 99 avr: 12,092KB sum: 1,169MB .pbix
count: 24,250 avr: 82KB sum: 1,949MB .json
count: 162 avr: 11,677KB sum: 1,847MB .zip
count: 1,464 avr: 929KB sum: 1,328MB .exe
count: 99 avr: 12,092KB sum: 1,169MB .pbix
count: 6 avr:171,157KB sum: 1,002MB .log_bucket0
count: 695 avr: 1,469KB sum: 997MB .csv
count: 3,891 avr: 256KB sum: 974MB .cscfg
count: 290 avr: 3,080KB sum: 872MB .dat
count: 596 avr: 1,064KB sum: 619MB .nupkg
count: 606 avr: 989KB sum: 585MB .bin
count: 78,880 avr: 7KB sum: 559MB .cs
count: 1 avr:355,584KB sum: 347MB .img
count: 7,763 avr: 37KB sum: 284MB .png
count: 38 avr: 7,071KB sum: 262MB .msi
count: 53 avr: 4,590KB sum: 237MB .ss
count: 16 avr: 12,888KB sum: 201MB .ipa
count: 6,578 avr: 29KB sum: 189MB .js
count: 15,986 avr: 11KB sum: 181MB .cpp
count: 191 avr: 957KB sum: 178MB .gz
count: 197 avr: 903KB sum: 173MB .so
count: 17 avr: 10,221KB sum: 169MB .sti
count: 119 avr: 1,364KB sum: 158MB
Re: (スコア:0)
> count: 7,044 avr: 344KB sum: 2,372MB .txt
ドキュメント? だとしたらたくさん書いててえらい。
でも今時txtでは書かないかな。
もう遅いのかな (スコア:0)
magnetまでは見つかるけどトレント情報取得(ダウンロードできるとこ)まではいけない。
WSL2のinit (スコア:0)
WSL2のPID=1のinitのソースコードなら改造したいから欲しい
Re: (スコア:0)
https://github.com/microsoft/WSL2-Linux-Kernel [github.com]
探せばどこかにあるんじゃね
Re: (スコア:0)
initはuserlandのコードだからカーネルには含まれていないしソース公開の義務もない
でかすぎでしょ (スコア:0)
いままでの人生のなかで1MBもコード書いてないと思うんだけど、37GBってどんだけ
Re: (スコア:0)
コピペか自動生成コードの山だろうな
Re: (スコア:0)
Windowsが500GBくらいあるんじゃなかったでしたっけ?それと比較したら小さいのかな?
Re: (スコア:0)
最近じゃアイコン画像1種で大きいのから小さいサイズ合わせて10MBとか使ってるソフトもあるし。
そういうの積み重ねたらコード書かなくてもすぐに1GB超える。
しかもそのアイコンを今まで一度も使用中に見かけたことないという。。。
高画質のアイコン画像が入ってるフォルダを削除しても動くので毎回バージョンアップのたびに捨ててるけど、無駄すぎ。
Re: (スコア:0)
その作業が無駄すぎ。馬鹿ぢゃん。
Re: (スコア:0)
合成音声の界隈だと全く驚きがない数字。Cortanaのソースコードっていっても合成前の音声データ込みで、ってことでしょ。それで地図が入ってるんだから、これも膨大なデータ。要するに、ほとんどは手書きしたものじゃなくて、写真や音声なんでしょ。
いや、地図アプリ自体のコードはシンプルだと思うよ。でも、これ、サーバー側のも入ってるんじゃないの?
Re: (スコア:0)
日本国内の測位点の位置情報を住所と紐づけた情報を国交省が公開してるんだけど
これがCSVで2GBくらい有る。
そこに地図サービスとして必要な情報を載せると日本国内だけで何十GBになるかわからないかから
流出ソースに関連データが丸ごと含まれる場合数十GBで収まるはずが無いと思う。
Re: (スコア:0)
拡縮等に対応した地図データとなると、例えばOpenmaptilesで100GBですね。
https://data.maptiler.com/downloads/dataset/osm/#0.22/0/0 [maptiler.com]
Re: (スコア:0)
1MB程度のコード量なら、10人月ぐらいのプロジェクトでも書く量だから、思ってるより書いてると思うよ。
1行40バイトぐらいの換算でも、3万行ぐらいの小規模プロジェクトでも1MB越える。
Javaみたいな冗長な書き方する言語だと、下手すると1人でも数ヶ月で書いちゃう量だよ。
あくまでフィクションです (スコア:0)
M$上司「Cortanaのソースコードが流失した、なんとかしろ」
M$部下「わかりました」
M$部下「しかしなんとかと言われても…」
M$部下「仕方ないな、Cortanaに『お前のソースコードを消す方法』とでも聞くか」
Cortana「(Bingでの検索結果を表示)」
M$部下「ちぇっ、使える情報がねえなあ。誰だよCortanaやBingのコード書いたの…」
Re: (スコア:0)
失われたのならもう消えているのでは
Re: (スコア:0)
衝撃的な寒さにドン引き…
しかも今時M$て