유틸리티

모든 웹 사이트에서 데이터 / HTML을 다운로드 할 수있는 무료 웹 사이트 스크레이퍼 JAWS

스눞히 2019. 12. 18. 17:23
반응형

웹페이지에는 다양한 정보가 담겨있습니다.

그리고 검색을 통해 쉽게 접근이 가능하죠.

하지만 그 정보들을 내 마음대로 조정하고 수정하기에는 많은 제약이 있습니다.

로우 데이터를 그대로 받는것도 어려울 뿐더러

데이터 양식도 다양하게 나눠져 있기때문에 쉽게 긁어오는 것도 어려운 현실이죠,.

 

한겨울 

유연하고 사용하기 쉬운 웹 사이트 스크레이퍼.

JAWS (Just Another Web Scraper)는 이미지를 텍스트로 변환하는 텍스트 변환 유틸리티 인 JATI, 비디오를 텍스트로 변환하는 JAVT를 만든 SVbook에서 개발했습니다.


웹 사이트 스크레이퍼 유틸리티는 데이터 스크랩을 위해 HTML을 다운로드 할 수있는 간단한 인터페이스를 제공합니다. 정규식, HTML 민첩성 팩 또는 텍스트 전처리 프로세스를 사용하여 데이터를 스크랩 할 수 있습니다. 그런 다음 데이터가 CSV 형식으로 변환됩니다.
프로그램을 다운로드하고 압축을 풀고 열어서 포괄적 인 인터페이스를 시작하십시오. 입력 표시 줄을 사용하면 스크랩 할 웹 사이트의 URL 주소를 입력 할 수 있습니다. 그런 다음 'Get HTML'버튼을 클릭하여 기본 창에서 코드를 얻을 수 있습니다. 코드를 붙여 넣을 수도 있습니다.

창의 오른쪽에는 스크랩 목적에 가장 적합한 웹 사이트 스크레이퍼 방법을 선택할 수있는 방법 드롭 다운 메뉴가 있습니다. 정규식 또는 HTML 민첩성 팩입니다. 선택기 및 출력 상자는 드롭 다운 아래에 있으며 그 아래에 필요한 경우 텍스트 만 확인란을 사용하여 CSV 열 요구 사항을 입력 할 수 있습니다.

필요한 특정 HTML 코드 컨텐츠를 변환하는 데 필요한 모든 정보를 입력 한 후 인터페이스 오른쪽 상단에있는 CSV 생성 버튼을 클릭하십시오. JAWA 또는 Just Another Web Scraper는 사용하기 쉽고 합법적 인 웹 스크래핑 목적입니다.

 

모든 웹 사이트에서 데이터 / HTML을 다운로드 할 수있는 무료 웹 사이트 스크레이퍼 JAWS  다운
https://sourceforge.net/projects/jaws2/

반응형