본문으로 바로가기
file_get_contents($path) : 파라미터에 해당하는 파일의 내용을 읽어 리턴함
$readfile = file_get_contents($path); //파일의 내용을 읽음

$pattern = "패턴에 맞는 정규식 입력";

//readfile에서 패턴(pattern)과 일치한 부분 match에 넣음
if(preg_match_all($pattern, $readfile, $match))
{
	$regular = strip_tags($match[0][0]); //html 제거
	$regular = preg_replace("/\s+/", " ", $regular); //모든 공백제거
	echo $regular; 
}
else {
	//예외 처리 : 없을경우 공백 처리
	$regular = "";
}

[ 자세한 함수 설명 ] 

 1. preg_match_all($pattern, $readfile, $match)
 - 특정값 추출할때 사용한다. 정규 표현식할때 사용하면 편하다

 2. strip_tags(‘문자열’)
 - 문자열에서 HTML(or tag)를 제거해준다.

 3. preg_replace(원래문자, 바꿀문자, 바뀐문자 담을 변수)
 - 예시로 설명하겠다.
$value = "Hello World";
preg_replace("Hello", "Bye", $value);
echo $value; //출력 : Bye World

[ 정규 표현식에 대한 설명 ] 

 1. (?(?=<\/div>)[^<\/div>]|.)* 
 - div가 여러개일때 제일 안쪽에 있는 div를 가져온다.
 - 참고 사이트 : http://leokevin.com/80134695276 

 2. 이외 참고 사이트 
- 위에 설명 외 정규 표현식에 대해 볼게 있음 여기서 참고했다. http://blog.naver.com/m5683?Redirect=Log&logNo=110140088345 
- 자동으로 정규 표현식을 생성한다 해서… 하지만 잘 안됀다 http://www.txt2re.com/index-php.php3