반응형 스크래핑2 PHP Simple HTML DOM 라이브러리 사용방법 안녕하세요 근근입니다. PHP로 웹 페이지를 크롤링하고 파싱할 때 매우 편리하게 사용할 수 있는 PHP Simple HTML DOM Parser의 사용방법을 소개합니다. 소개 먼저 라이브러리를 다운로드합니다. PHP Simple HTML DOM Parser - Browse Files at SourceForge.net 그리고 사용할 php파일에 로드해줍니다. require_once 'simple_html_dom.php'; 객체 생성 파싱할 html을 str_get_html() 또는 file_get_html()로 simple_html_dom 객체를 생성합니다. // 문자열로 직접 넣기 $html = str_get_html ( 'Hello!' ); // URL에서 가져오기 $html = file_get_htm.. 2023. 9. 27. BeautifulSoup 사용법 find, find_all find_all 및 find ① find_all 은 해당 조건에 맞는 모든 태그를 가져옵니다. 1 find_all('태그명', {'속성명' : '값' ...}) ② find 는 해당 조건에 맞는 첫 번째 태그를 가져옵니다. 1 find('태그명', {'속성명' : '값' ...}) ③ select() : css 선택자를 사용해 값을 가져옵니다. class 앞에는.(점)을 사용, id앞에는 #(샵)을 사용 select(.class_name) select(#id_name) 샘플 웹소스 1) 샘플 웹소스를 D:\Python\test.html 등으로 작성합니다. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 .. 2022. 3. 23. 이전 1 다음 728x90 반응형