상세 컨텐츠

본문 제목

[python]image-crawling

coding

by golduny_zoo 2021. 8. 23. 21:29

본문

728x90

구글 이미지 데이터 크롤링 

https://pypi.org/project/google_images_download/

 

google_images_download

Python Script to download hundreds of images from 'Google Images'. It is a ready-to-run code!

pypi.org


다운로드 

pip install google_images_download

python 코드 

from google_images_download import google_images_download   #importing the library

response = google_images_download.googleimagesdownload()   #class instantiation
keywords = "푸들" #검색 키워드
limit = 50 # 이미지 갯수
formating = "jpg" # 파일포멧
print_urls = True # url의 출력
arguments = {"keywords": keywords,"limit":limit,"print_urls":True, "format": formating}
paths = response.download(arguments)
print(paths)

실행을 하면 이렇게 에러가 몇개인지 무슨이름으로 저장을 했는지 확인할 수 있다. 

에러가 있어 확인해 보니

text/html로 되어있어 스킵을 했는데 

이 부분을 skip한 것을 확인할 수 있었다.

요렇게 다운로드폴더 안에 푸들 폴더를 생성하고, jpg로 가지런히 다운로드 된 것을 확인할 수 있었다. 

'coding' 카테고리의 다른 글

디자인 사이트  (0) 2021.07.26
ML 사이트  (0) 2021.07.15
Django 웹사이트 제작  (0) 2021.07.15
[Python]0이 아닌값을 가져올 땐 nonzero  (0) 2021.05.11
[Python]맨해튼 거리 공식(Manhattan distance)  (0) 2021.05.10

관련글 더보기