機械学習の画像集めはiCrawlerがおすすめ!

機械学習 画像集 icrawler

こんばんは、エンジニアの眠れない夜です。

機械学習をしたくても素材がない…

そんな問題を解決してくれるのが icrawler です。

icrawler はGoogle、Bing、Baidu、Flickrなどの画像検索サービスから画像をダウンロードしてくれる便利なPythonのパッケージです。

30秒あればあなたのPCでも再現できるのでぜひ読みながらプログラムを動かしてみてくださいね^^

icrawler の使い方

まずはインストールします。

pip install icrawler

インストールできたらPythonを起動して、下記のコマンドを実行してみましょう。

Python

from icrawler.builtin import GoogleImageCrawler

crawler = GoogleImageCrawler(storage={"root_dir": "images"})
crawler.crawl(keyword="犬", max_num=100)

ターミナルで今いるディレクトリに images というフォルダが作成され、その中にどんどん画像がダウンロードされていきます。

icrawler機械学習画像

ダウンロードする画像のサイズやカラーなどいろいろフィルターもできるので詳しくはドキュメントを参照してください。

http://icrawler.readthedocs.io/en/latest/builtin.html#search-engine-crawlers

どれくらい簡単に始められるかはこちらの動画を見ていただければ分かるはずです。

すっごく便利なので機械学習の画像集めにぜひご活用ください。

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.