[PersonaAI - 비공개 프로젝트b] node.js 크롤링

2024. 2. 23. 12:42프로젝트_트러블슈팅

1. 크롤링 라이브러리

<상황>

: node.js의 크롤링 용 라이브러리인 cheerio로 하려했지만 웹드라이버를 쓰지 않는 방법이라 사용이 제한적

 

<해결>

:  selenium-webdriver 를 사용하면서 해결

 


 

2. 크롬드라이버 설치

 

 1) 버전 : 그냥 가장 최신 버전을 다운로드 했지만 내 컴퓨터의 크롬과 버전이 일치해야함 ( 내 버전확인 : 크롬 오른쪽위 케밥 ?(...세로로 돌린 모양의 메뉴 아이콘) - 톱니(설정) - 왼쪽 목록 맨아래 Chrome 정보 )


 2) 크롬드라이버 경로 : 해당 크롤링 구동 파일과 같은 dir에 넣어야함 - 넣을 파일 : chrome.exe ( => 예전 블로그들 보면 chromedriver.ini? 이걸 넣으라 던데 바뀐거 같음(그런게 없음) )

 


 

3. 크롤링 파일 실행

 

terminal 창에 해당 파일이 있는 dir에 가서 
node 파일이름
하면 실행 된다. ( => 파일이름은 확장자를 붙일 필요가 없다 )

 

ex) node crawling