PyPI で公開されているパッケージの半数近くが何らかのセキュリティ上の問題を含むとの調査結果

PyPI で公開されているパッケージの半数近くが何らかのセキュリティ上の問題を含むとの調査結果 28

ストーリー by headless 2021年08月01日 19時24分
問題部門より

Python パッケージの公式リポジトリ PyPI で公開されているパッケージの半数近くに何らかのセキュリティ上の問題が含まれるとの調査結果が発表された(The Register の記事、論文)。

対象は PyPI に保存されている全パッケージ 19 万 7 千件以上のスナップショットで、静的コード解析ツール Bandit を用いて調査している。セキュリティ上の問題は exec 関数の使用やパスワードのハードコードといったものから、セキュアでない例外処理やハッシュ関数の使用、SQL インジェクションや XSS が可能といったものまで幅広い。調査の結果、約 75 万件の問題が見つかり、46 % のパッケージが少なくとも 1 つの問題を含んでいたとのこと。

ただし、見つかった問題の半数以上を占める約 44 万件は深刻度の低いものであり、約 23 万件が深刻度中、約 8 万件が深刻度高に分類される。深刻度低の問題を含むパッケージは全体の 35.8 %、深刻度中は 25.3 %、深刻度高は 11.4 % にとどまる。また、今回の調査では誤検出・検出漏れや実際の使用では実行されないコードが検出されている可能性のほか、調査時に展開されなかったファイルが含む問題や Python 以外の言語で書かれたコードに含まれる問題は検出できないといった制約もあるとのことだ。

この議論は賞味期限が切れたので、アーカイブ化されています。新たにコメントを付けることはできません。

記事ページを表示すべてのコメント取得

検索28コメント Log In/Create an Account

どれだけアクティブに開発されているの？ (スコア:0)

by Anonymous Coward on 2021年08月01日 22時24分 (#4082303)

実際に使われているパッケージなんてほんの一握りでしょ。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  アクティブに開発されてるかどうかと
  実際に使われてるかどうかは別の話。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    それはそうだが、それを区別するならより母集団や重みづけを変えるべきでは？
    実際に使われていてもメンテナンスされてなければ修正される見込みはほぼないのだから。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      これはあくまで機械的に調べたものだから重みづけなんて眼中にないのは当たり前。
      重みづけすれば修正されるわけでもないんだから、実際に重みづけで優先度の高いものから直そうとしている人でないと重みづけデータに意味があるとは思わないな。
      「どういう重みづけにするか」は目的によって違うもので、それによって客観性のあるデータではなくなるのだから。
ぴこーん！！ (スコア:0)

by Anonymous Coward on 2021年08月02日 5時24分 (#4082379)

その Bandit を PyPI に組み込んで、パッケージを登録したらチェックして表示してくれるようにすればいいじゃないの？
# CPAN 版もないのかしら
- Re: (スコア:0)
  
  by Anonymous Coward
  
  だったらPythonの標準ライブラリにすれば無問題。
  Apache-2.0だし。pytのようにGPLだとアレだけど。
  ちなみにPysaは使った事ないからよう知らん。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    大丈夫。俺も Python 使ったことないし。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      なら安心安全なPython最強という事で。
      # 買わなければ外れない宝くじ論法
記事としては (スコア:0)

by Anonymous Coward on 2021年08月02日 10時38分 (#4082441)

問題を大きく見せたいのだろうけど、
大半が個人が試しに登録してみた程度のまともに使われていないものであることは想像に難くない。
パッケージ管理システム全体の信頼性という意味では各パッケージのダウンロード数を掛けたものを分母にすべきだろう。
経験則以上の根拠は全くないが深刻度中以上は1%以下とかそういう数字になると思う。
元記事の
The situation is similar with package registries like Maven (for Java), NuGet (for .NET), RubyGems (for Ruby), CPAN (for Perl), and CRAN (for R).
についても同様。
- Re:記事としては (スコア:1)
  
  by Anonymous Coward on 2021年08月02日 13時07分 (#4082498)
  
  何を勘違いしているのかわかりませんが、この論文の目的は「パッケージ管理システム全体の信頼性」を求めることではありません。
  
  シェア
  
  親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  ダウンロード数≠使用数なので。長く改変の必要がないなら必然的にランクが上がる。。
  それにまともに使われてないという想定がひっくり返る、参考として使われている可能性だってある。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    あたりまえのこと言うなよ。
    今の単なる全パッケージが同じ重みであるという状態よりはよほど実態に近づくって話だろ。
- Re:調べたなら (スコア:1)
  
  by Anonymous Coward on 2021年08月02日 1時22分 (#4082349)
  
  ただのプログラムを作る⇒プログラミングシステム製品を作るコストの差は3×3＝9倍
  #最悪だったのは何故か2*2=4倍と記憶していた事(；´Д｀)
  #大昔、読んだ教科書的な本の内容を思い出した検索してみたけど「人月の神話」が元ネタだったみたいです。もちろん読んだことは。。。無い。
  #どこにコメントするか迷ったけど、ここで。
  
  シェア
  
  親コメント
- Re:調べたなら (スコア:1)
  
  by Anonymous Coward on 2021年08月02日 4時36分 (#4082376)
  
  見つけた人に責任を負わせるのは、ダメ職場の王道だわな
  ドヤ顔でこんな指摘できる奴に伝わる気がしないけど
  
  シェア
  
  親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    「我々があんたのコードを機械的に調べた結果こういう問題を見つけましたので報告します、修正・追加後のコードはわかりませんが」
    ここまでは報告出せるでしょ。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      いや迷惑にも程があるでしょ。悪意のある人が利用するかもしれないし
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        じゃ直すしかないね!
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        悪意のある人が既にこっそり利用しているかもしれないから、報告してもらえるほうがまだマシ。
- Re:調べたなら (スコア:1)
  
  by Anonymous Coward on 2021年08月02日 13時13分 (#4082502)
  
  お前が直したっていいんだぞ
  
  シェア
  
  親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  あたかも妖精がやったようにひっそり直して何事もなかったかのようにするほうがいいと？
  レポして警鐘を鳴らすやつも必要だろ。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    そしたらひっそり直してたパッケージの調査報告あげるやつが出てくるだけでは
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    その観点なら、レポジトリ全体のパーセンテージでなく、
    自分が使っているパッケージに脆弱性があるか否かでは？
    誰からも見向きもされないマイナーパッケージ(おそらく、
    メジャーなパッケージよりも数が多くセキュリティのチェックも十分でない)を含めて、
    脆弱性件数が云々と指摘されても、
    「使用するパッケージのコード含めて、テストとチェックは必要」という
    月並みな意見しか得られない。
    - Re:調べたなら (スコア:1)
      
      by Anonymous Coward on 2021年08月02日 8時26分 (#4082390)
      
      現状はその月並みな事もできてないんだから、こういうレポが必要だね。
      
      シェア
      
      親コメント
    - Re:調べたなら (スコア:1)
      
      by Anonymous Coward on 2021年08月02日 13時18分 (#4082509)
      
      この手の話題では何度も同じこと言わなきゃいけないわけだが、
      調べなくてもある程度予想できることに調べる価値がないと考えるのは大間違い
      実際に確認して裏付けを取れば説得力がまったく違うし、具体的な数字が出てくるからこそわかることもある。
      
      シェア
      
      親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  解析ツールで問題点見つけ出すのと、意図している動作に支障がないようにその問題を修正するのとでは、必要な労力に差がありすぎるだろ…
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    比較的すぐできる対応だと、運営と連携してコード解析の結果をタグ付けするぐらい、かなぁ。
    それでも既にダウンロードした人には無力だから悩ましい。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  直しちゃいけないバグとかあるだろ。。

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

PyPI で公開されているパッケージの半数近くが何らかのセキュリティ上の問題を含むとの調査結果 28

PyPI で公開されているパッケージの半数近くが何らかのセキュリティ上の問題を含むとの調査結果 More ログイン

どれだけアクティブに開発されているの？ (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

ぴこーん！！ (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

記事としては (スコア:0)

Re:記事としては (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re:調べたなら (スコア:1)

Re:調べたなら (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re:調べたなら (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re:調べたなら (スコア:1)

Re:調べたなら (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

スラド