코딩몽키졸업

코딩몽키졸업

  • 분류 전체보기 (76)
    • 백준 알고리즘 (42)
    • 운영체제 (1)
    • Database (1)
    • 클라우드 컴퓨팅 (1)
    • Docker (1)
    • 알고리즘 (2)
    • Java (8)
    • DDD (5)
    • JPA (4)
    • 개발환경 (1)
    • 형상관리 (1)
    • Jenkins (3)
    • Spring (3)
    • Design Pattern (1)
  • 홈
  • 태그
  • 방명록
  • Github URL
RSS 피드
로그인
로그아웃 글쓰기 관리

코딩몽키졸업

컨텐츠 검색

태그

Interceptor Implicit Wait selenium crawler 중복 제거 알고리즘 Explicit Wait

최근글

댓글

공지사항

아카이브

중복 제거 알고리즘(1)

  • Selenium 라이브러리로 웹 크롤러 제작하기

    이번 포스팅에선 Selenium 라이브러리를 이용해서 웹 크롤러를 제작한 과정을 공유해보려고 한다. Selenium이란? 서버에서 브라우저의 환경을 구현할 수 있는 오픈소스 라이브러리이다. 주로 브라우저 기반 End Test에 사용되지만 크롤링 같은 다양한 목적을 위해 사용할 수 있다. Selenium을 사용한 이유? 크롤러를 개발할 때 처음에는 jsoup 라이브러리를 사용했다. 하지만 jsoup는 치명적인 단점이 있다. jsoup 라이브러리는 uri 접속시 최초 로딩되는 페이지만 읽어 들일 수 있다. 요즘의 웹 페이지는 SPA 방식으로 최초에 index 페이지를 로딩하고나서 유저의 동적인 action에 의해 동적으로 페이지를 랜더링하는 방식을 사용한다. HTML, CSS, JavaScript를 사용하는..

    2023.03.14
이전
1
다음
티스토리
© 2018 TISTORY. All rights reserved.

티스토리툴바