file_get_contents($path) : 파라미터에 해당하는 파일의 내용을 읽어 리턴함
[ 자세한 함수 설명 ]
$readfile = file_get_contents($path); //파일의 내용을 읽음
$pattern = "패턴에 맞는 정규식 입력";
//readfile에서 패턴(pattern)과 일치한 부분 match에 넣음
if(preg_match_all($pattern, $readfile, $match))
{
$regular = strip_tags($match[0][0]); //html 제거
$regular = preg_replace("/\s+/", " ", $regular); //모든 공백제거
echo $regular;
}
else {
//예외 처리 : 없을경우 공백 처리
$regular = "";
}
1. preg_match_all($pattern, $readfile, $match)
- 특정값 추출할때 사용한다. 정규 표현식할때 사용하면 편하다
2. strip_tags(‘문자열’)
- 문자열에서 HTML(or tag)를 제거해준다.
3. preg_replace(원래문자, 바꿀문자, 바뀐문자 담을 변수)
- 예시로 설명하겠다.
[ 정규 표현식에 대한 설명 ]
$value = "Hello World";
preg_replace("Hello", "Bye", $value);
echo $value; //출력 : Bye World
1. (?(?=<\/div>)[^<\/div>]|.)*
- div가 여러개일때 제일 안쪽에 있는 div를 가져온다.
- 참고 사이트 : http://leokevin.com/80134695276
2. 이외 참고 사이트
- 정규 표현식에 잘 정리되어있다.
http://phpschool.com/gnuboard4/bbs/board.php?bo_table=tipntech&wr_id=61629&sca=&sfl=wr_subject%7C%7Cwr_content&stx=%C1%A4%B1%D4%C7%A5%C7%F6%BD%C4&sop=and