Skip to content

Latest commit



141 lines (115 loc) · 4.38 KB

File metadata and controls

141 lines (115 loc) · 4.38 KB

简单、易用、灵活的网络类,spider/network for PHP , too simple .





  • php 界内最简单易用的 http-utils,自动识别支持 curl、socket、file_get_contents 三种方式。
  • http 请求支持 gzip,加速请求,节约请求成本。
  • 跟踪 301、302 跳转(可设置最大跳转数量)。
  • 支持统一转码为 utf-8,不再需要关心页面是否是 gbk、big5、utf8 等编码。
  • 字符串支持通配符、正则表达式、DOM表达式(已弃用)三种方式匹配。
  • url支持匹配后自动相对路径转绝对路径。
  • ToBe Continue.


	// return
	$result = spider::abs_url('', '../bac/index.html');


	// return 123
	$result = spider::html2txt('<p><a href="">1</a>23<p>');


	// return 23abcde
	$result = spider::cut_str('123abcdef', '1', 'f');


	// return abc
	$result = spider::mask_match('123abc123', '123(*)123');
	// return abc
	$result = spider::mask_match('abc123', '(*)123');
	// return 123
	$result = spider::mask_match('123abcabc', '(*)abc');
	// return 123abc
	$result = spider::mask_match('123abcdef', '(*)abc', true);

##What?发送http GET请求?

    // 所有的 http 请求都会自动识别并统一转码成 utf-8
    $result =  spider::GET('');
    // process your $result
    echo $result;
    // or get response status code
    echo spider::$last_response_code;
    // or get spider fetch latest url(include 302)
    echo spider::$url;
    // or process your last_header

##What?发送http POST请求?

    // bind post varialbe
    $post = "wd=".urlencode("你的网址"); 
    // 数组也一样
    // $post = array("wd" => urlencode("你的网址"));
    $result = spider::POST('', $post);

##What?POST File?

    // add @ to post file
    $post = array("wd" => "http://", "file" => "@c:/1.txt");
    $result = spider::POST('', $post);

##What?要带 UserAgent 和 Cookie?

	// 一切 headers 都可以传入
	$headers = array(
                // set cookie
		'Cookie' => 'uid=1; my_name_is=mzphp',
                // set UserAgent
		'UserAgent' => 'userAgentForIphone',
                // set Referer
		'Referer' => '',
		// set ip(multi ip support), 设置外网 ip (需要您有多个外网 IP 支持)
		'ip' => '',
		// set proxy, 设置代理
		'proxy' => array(
			'type' => 'HTTP', //HTTP or SOCKET
			'host' => '',
                        // BASIC or NTLM
			//'auth' => 'BASIC:user:pass',
    // build post
    $post = array("wd" => "http://", "test" => "123");
    $result = spider::POST('', $post, $headers);


	// 首先你需要一个女朋友
	$key = "女朋友";
	$url = ''.urlencode($key).'&ie=utf8';
	$html = spider::GET($url, array('Referer'=>''));
	// 对你的女朋友进行分析
	$keywordlist = spider::match($html, array('list'=>array(
                // 先是让 spider 去取得(*)对应的结果
		'cut' => '相关搜索</caption>(*)</tr></table>',
                // 然后让 spider 用正则去匹配对应的列表,美其名曰:表白
		'pattern' => array(
	                // 什么第一次表白没有成功?好那么我们来第二种表白方式
	$newarr = array();
	foreach($keywordlist['list'] as $key=>$val){
		$newarr[$val['key']] = array('key'=>$val['key']);


好吧,你可以参考一下 mzphp2 项目中的 start_example 里的index_control,on_spider 方法: