파이썬으로 쉽게 이미지 크롤링 및 파일 저장
2020. 3. 6. 17:46ㆍComputer Science/CS
이번 포스팅은 파이썬으로 쉽게 이미지를 크롤링하고 파일에 저장하는 방법입니다.
첫번째로 구글 검색창에 이미지 검색을 위한 단어를 검색합니다.
(저의 경우 식물이 필요하기 때문에 plant로 검색하였습니다.)
이미지란으로 이동한 이후 ctrl+shift+j 를 입력하면 콘솔창이 나타나게 되는데,
거기에 아래와 같은 코드를 입력하시면 됩니다.
urls=Array.from(document.querySelectorAll('.rg_i')).map(el=> el.hasAttribute('data-src')?el.getAttribute('data-src'):el.getAttribute('data-iurl'));
window.open('data:text/csv;charset=utf-8,' + escape(urls.join('\n')));
코드를 입력한 후 실행하게 되면 파일이 다운로드가 되는데, csv의 형태로 다운받으시면 됩니다.
csv를 확인하면 각 셀에 이미지 URL이 첨부되있는 걸 확인할 수 있습니다.
파이썬 코드를 통해 로컬 드라이브에 저장해보겠습니다.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
|
import csv
import urllib.request
import os
num=450
#make num for saving image
sun=open('sunburn_real.csv','r',encoding='utf-8')
#open the csv/rename csv file what you make
sunurl = csv.reader(sun)
#read csv var
for line in sunurl:
try:
outpath='C:/Users/lur06/Desktop/peoplespace/'
#write your own local location
out="sunburn"
file=".jpg"
outfile=out+str(num)+file
#set your img name
urllib.request.urlretrieve(line[0],outpath+outfile)
#save your img in local destination using urlib
num=num+1
except:
#out the code incase of error
print("error!")
sun.close()
break
|
다음 포스팅에서는 colab을 활용해 식물의 질병유무를 판단하는 머신러닝모델에 대해 알아보겠습니다.
반응형
'Computer Science > CS' 카테고리의 다른 글
문과도 한번에 이해하는 TCP/IP (0) | 2022.10.18 |
---|---|
넷플릭스로 보는 데이터 베이스 (2) | 2020.05.14 |
캡슐화(Encapsulation)이란 (0) | 2020.03.30 |
information hiding, modularity에 대하여 (0) | 2020.03.22 |
linear/binary classfication 와 sigmoid함수 정의 (0) | 2020.03.21 |