티스토리 툴바










 

PHP 라이브러리 중에 오픈소스로 snoopy라는 것이 있습니다.
프락시세션유지 등 여러가지 유용한 기능이 있고파싱하기에 참 편리합니다.
php
에서 소켓을 쉽게 쓸수 있는 강력한 클래스로단순히 사이트를 긁어오는 기능과 더불어 html 태그를 쏙 빼고 텍스트만 긁어올수도 있으며, form 으로 바로 submit 해서 결과값을 받을수 있는 유용한 클래스입니다.

오픈소스로 공개하는 곳은 아래와 같습니다. 2006년이후로는 업데이트 안되고 있으니 파일 첨부해놓겠습니다.
http://sourceforge.net/projects/snoopy/


=======
아래는 외부 강좌 참고=======
http://toyoil.tistory.com/22


마지막 버전인 snoopy 1.2.3 는 구문 오류가 난다.

snoopy 1.2.3 버전 구문오류 해결법

722번째 줄에서 구문오류가 날것이다. 722번째 줄을 보면 아래와 같다

 

"?, 
"?, 
"?, 
"?,  
"?,   
"?,   
"?,


이걸 아래와 같이 바꿔주면 된다.  

"?", 
"?", 
"?", 
"?", 
"?", 
"?",  
"?",


아마도 어떤 특수 문자들 같은데 한글 윈도우에서는 보이지 않거나 깨져버린것같다
그래서 ? 로 바뀌어버리면서 구문오류가 난것같다. (이유는 정확하지 않음
일단 다운 받아서 원하는 디렉토리에 스누피를 넣어두시고 아래와 같이 사용하면 된다

include "Snoopy.class.php";

$snoopy = new Snoopy;

$snoopy->fetchtext(http://www.php.net/);

print $snoopy->results;

아 놀라워라.. 너무 쉽다

이런것도 가능하다.

$submit_url = "http://lnk.ispi.net/texis/scripts/msearch/netsearch.html";    

$submit_vars["q"] = "amiga";

$submit_vars["submit"] = "Search!"; $submit_vars["searchhost"] = "Altavista";        

$snoopy->submit($submit_url,$submit_vars); print $snoopy->results;

저 주소로 쿼리를 보내서 결과값을 값는것이다이외에도 여러가지 기능들이 많다.

  • 웹사이트 내용을 긁어오기
  • html 태그는 쏙빼고 내용만 긁어오기
  • 링크만 골라서 가져오기
  • 프록시서버 지원
  • 기본적인 로그인인증 지원
  • 사용정보레퍼러쿠키등 설정 지원 (.. 이거 위험한데..)
  • 쉽게 폼데이타를 보내고 결과값 받기 (이거도 위험한데..)
  • 프레임 지원

자세한건 README 파일(프로그램파일들안에있음참조 



출처 : http://simples.kr/?mid=ITTalk&category=7592&document_srl=7597









Posted by 홍서기 트랙백 0 : 댓글 0

댓글을 달아 주세요