機械学習の画像集めはiCrawlerがおすすめ!

機械学習 画像集 icrawler

こんばんは、エンジニアの眠れない夜です。

機械学習をしたくても素材がない…

そんな問題を解決してくれるのが icrawler です。

icrawler はGoogle、Bing、Baidu、Flickrなどの画像検索サービスから画像をダウンロードしてくれる便利なPythonのパッケージです。

30秒あればあなたのPCでも再現できるのでぜひ読みながらプログラムを動かしてみてくださいね^^

icrawler の使い方

まずはインストールします。

pip install icrawler

インストールできたらPythonを起動して、下記のコマンドを実行してみましょう。

Python


from icrawler.builtin import GoogleImageCrawler

crawler = GoogleImageCrawler(storage={"root_dir": "images"})
crawler.crawl(keyword="犬", max_num=100)

ターミナルで今いるディレクトリに images というフォルダが作成され、その中にどんどん画像がダウンロードされていきます。

icrawler機械学習画像

ダウンロードする画像のサイズやカラーなどいろいろフィルターもできるので詳しくはドキュメントを参照してください。

http://icrawler.readthedocs.io/en/latest/builtin.html#search-engine-crawlers

どれくらい簡単に始められるかはこちらの動画を見ていただければ分かるはずです。

すっごく便利なので機械学習の画像集めにぜひご活用ください。

追記(2019/02/26)

キーワードにもよるのですが、数10枚〜200枚程度で停止します。1つのキーワードについて集中的にキーワードを集めたい場合は複合キーワードにして集めると効果的です。

例:

  • 犬 走る
  • 犬 座る
  • 犬 (地名)
  • 犬 (犬種)
  • etc…

1 Comment

コメントを残す

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください