크롤링: 두 판 사이의 차이

큰숲백과, 나무를 보지 말고 큰 숲을 보라.
(문서 추가)
 
 
9번째 줄: 9번째 줄:
* [[나무위키]] - [[리그베다 위키]]를 크롤링해서 만든 위키이다.  
* [[나무위키]] - [[리그베다 위키]]를 크롤링해서 만든 위키이다.  
* [[바다위키]], [[알파위키]](이전), [[더위키]] - [[나무위키]]를 크롤링해서 만든 위키이다.
* [[바다위키]], [[알파위키]](이전), [[더위키]] - [[나무위키]]를 크롤링해서 만든 위키이다.
* [[큰숲백과]] - [[오사위키]]의 데이터를 크롤링해서 만들었다. 이후 위키 서술방식을 정보 서술 위키로  
* [[큰숲백과]] - [[오사위키]]의 데이터를 크롤링해서 만들었다. 이후 위키 서술방식을 정보 서술 위키로 전환하면서 현재는 일부 내용만 존재한다.


[[분류:인터넷]]
[[분류:인터넷]]

2023년 10월 21일 (토) 15:44 기준 최신판

크롤링(Crawling) 혹은 스크래핑(Scraping)은 웹 페이지의 정보를 그대로 가져와서 데이터를 가져오는 행동을 밀한다.

크롤링 기술[편집 | 원본 편집]

API 기반[편집 | 원본 편집]

별도 소프트웨어[편집 | 원본 편집]

  • 셀레늄(Selenium) - 브라우저용 웹드라이브 엔진을 실행시켜서 이 엔진 기반으로 정보를 크롤링할 수 있는 도구이다.

예시[편집 | 원본 편집]