用户
 找回密码
 入住 CI 中国社区
搜索
查看: 3158|回复: 1
收起左侧

[HELP] CI CURL採集问题,高手赐教

[复制链接]
发表于 2013-2-24 00:15:42 | 显示全部楼层 |阅读模式
本帖最后由 bax 于 2013-2-24 00:19 编辑

我想采集一个网站简单的table内容
  1. http://www.malaysiaairlines.com/content/mas/my/en/book-and-plan/flight-status/jcr:content/contentpar/flightstatussearch_0.processSearch.html/?flightdate=02/24/2013&flightfrom=MYY
复制代码
我只要时间表..我尝试过用以下方法,但是网上说CURL的效率比较快...有哪位高手可以教教我,网址中的日期记得自行更改成 昨天/今天/明天,否则无效

PHP复制代码
 
$url="http://www.malaysiaairlines.com/content/mas/my/en/book-and-plan/flight-status/jcr:content/contentpar/flightstatussearch_0.processSearch.html/?flightdate=02/24/2013&flightfrom=MYY";
$result = file_get_contents($url);
$pattern = '/<tbody>([^"]+)<\/tbody>/';
preg_match_all($pattern, $result, $arr);
 
复制代码




发表于 2013-2-24 19:17:31 | 显示全部楼层
PHP复制代码
 
        function curl_get_content( $url )
        {
                $ch = curl_init();   
                curl_setopt($ch, CURLOPT_URL, $url); //Set access url adress
                curl_setopt($ch, CURLOPT_TIMEOUT, 5); //Set timeout
                curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); //Ser return value
                $r = curl_exec($ch); //Set $r
                curl_close($ch); //Close curl function
                return $r; //Return data
        }
        $url="http://www.malaysiaairlines.com/content/mas/my/en/book-and-plan/flight-   status/jcr:content/contentpar/flightstatussearch_0.processSearch.html/?flightdate=02/24/2013&flightfrom=MYY";
        $result = curl_get_content($url);
        $pattern = '/<tbody>([^"]+)<\/tbody>/';
        preg_match_all($pattern, $result, $arr);
 
复制代码

把CURL操作封装起来,基本上木有什麽困难。

可以参考UDSync用的方式。

评分

参与人数 1威望 +2 收起 理由
bax + 2 值得參考

查看全部评分

本版积分规则