|
本帖最后由 iranwang 于 2011-8-8 09:00 编辑
才写一个网页采集程序的时候发现一个问题
代码如下
PHP复制代码
<?php
header ( 'Content-Type:text/html;charset=utf-8' );
$html = file_get_contents ( "http://roll.games.sina.com.cn/news_list/default/djyx-xw/index.shtml" );
$html = iconv ( "gbk", "utf-8", $html );
//$html = preg_replace ( "/([\n]+)/", ' ', $html );
preg_match_all ( "/<ul class=\"list_009\">(.*)<\/ul>/Ui", $html, $links );
print_r ( $links );
?>
复制代码
这样子代码是无法匹配到内容了 但是在将上面一行的注释去掉 (也就是吧换行符去除) 就可以匹配掉
这个是为什么呢???
疑问??????????????????????????
|
|