PHP获取URL的方法【总结】
服务器变量:$_SERVER
使用范例
Php代码
$uri=$_SERVER['REQUEST_URI']; echo$uri; 输出:/snowing/products $url='http://'.$_SERVER['SERVER_NAME'].':'.$_SERVER["SERVER_PORT"].$_SERVER["REQUEST_URI"]; echo$url; 输出:http://www.site.com:80/snowing/products $http=(isset($_SERVER['HTTPS'])&&$_SERVER['HTTPS']!='off')?'https://':'http://'; $port=$_SERVER["SERVER_PORT"]==80?'':':'$_SERVER["SERVER_PORT"]; $url=$http.$port.$_SERVER["REQUEST_URI"]; echo$url; 输出:http://www.site.com/snowing/products
注:在PHP4.1.0及以后版本使用。之前的版本,使用$HTTP_SERVER_VARS。
$_SERVER是一个包含诸如头部(headers)、路径(paths)和脚本位置(scriptlocations)的数组。数组的实体由web服务器创建。不能保证所有的服务器都能产生所有的信息;服务器可能忽略了一些信息,或者产生了一些未在下面列出的新的信息。这意味着,大量的这些变量在CGI1.1specification中说明,所以您应该仔细研究它。
这是一个“superglobal”,或者可以描述为自动全局变量。这只不过意味这它在所有的脚本中都有效。在函数或方法中您不需要使用global$_SERVER;访问它,就如同使用$HTTP_SERVER_VARS一样。
$HTTP_SERVER_VARS包含着同样的信息,但它不是一个自动全局变量。(注意:$HTTP_SERVER_VARS和$_SERVER是不同的变量,PHP处理它们的方式不同。)
如果设置了register_globals指令,这些变量也在所有脚本中可用;也就是,分离了$_SERVER和$HTTP_SERVER_VARS数组。相关信息,请参阅安全的相关章节使用RegisterGlobals。这些单独的全局变量不是自动全局变量。
您或许会发现下面列出的某些$_SERVER元素并不可用。注意,如果以命令行方式运行PHP,下面列出的元素几乎没有有效的(或是没有任何实际意义的)。
“PHP_SELF”
当前正在执行脚本的文件名,与documentroot相关。举例来说,在URL地址为http://example.com/test.php/foo.bar的脚本中使用$_SERVER['PHP_SELF']将会得到/test.php/foo.bar这个结果。如果PHP以命令行方式运行,该变量无效。
“argv”
传递给该脚本的参数。当脚本运行在命令行方式时,argv变量传递给程序C语言样式的命令行参数。当调用GET方法时,该变量包含请求的数据。
“argc”
包含传递给程序的命令行参数的个数(如果运行在命令行模式)。
“GATEWAY_INTERFACE”
服务器使用的CGI规范的版本。例如,“CGI/1.1”。
'SERVER_NAME'
当前运行脚本所在服务器主机的名称。如果该脚本运行在一个虚拟主机上,该名称是由那个虚拟主机所设置的值决定。
'SERVER_SOFTWARE'
服务器标识的字串,在响应请求时的头部中给出。
“SERVER_PROTOCOL”
请求页面时通信协议的名称和版本。例如,“HTTP/1.0”。
“REQUEST_METHOD”
访问页面时的请求方法。例如:“GET”、“HEAD”,“POST”,“PUT”。
“QUERY_STRING”
查询(query)的字符串。
“DOCUMENT_ROOT”
当前运行脚本所在的文档根目录。在服务器配置文件中定义。
“HTTP_ACCEPT”
当前请求的Accept:头部的内容。
“HTTP_ACCEPT_CHARSET”
当前请求的Accept-Charset:头部的内容。例如:“iso-8859-1,*,utf-8”。
“HTTP_ACCEPT_ENCODING”
当前请求的Accept-Encoding:头部的内容。例如:“gzip”。
“HTTP_ACCEPT_LANGUAGE”
当前请求的Accept-Language:头部的内容。例如:“en”。
“HTTP_CONNECTION”
当前请求的Connection:头部的内容。例如:“Keep-Alive”。
“HTTP_HOST”
当前请求的Host:头部的内容。
“HTTP_REFERER”
链接到当前页面的前一页面的URL地址。不是所有的用户代理(浏览器)都会设置这个变量,而且有的还可以手工修改HTTP_REFERER。因此,这个变量不总是正确真实的。
“HTTP_USER_AGENT”
当前请求的User_Agent:头部的内容。该字符串表明了访问该页面的用户代理的信息。一个典型的例子是:Mozilla/4.5[en](X11;U;Linux2.2.9i586)。您也可以使用get_browser()得到这个信息。
“REMOTE_ADDR”
正在浏览当前页面用户的IP地址。
'REMOTE_HOST'
正在浏览当前页面用户的主机名。反向域名解析基于该用户的REMOTE_ADDR。
注:必须配置Web服务器来建立此变量。例如Apache需要在httpd.conf中有HostnameLookupsOn。参见gethostbyaddr()。
“REMOTE_PORT”
用户连接到服务器时所使用的端口。
“SCRIPT_FILENAME”
当前执行脚本的绝对路径名。
“SERVER_ADMIN”
该值指明了Apache服务器配置文件中的SERVER_ADMIN参数。如果脚本运行在一个虚拟主机上,则该值是那个虚拟主机的值。
“SERVER_PORT”
服务器所使用的端口。默认为“80”。如果你使用SSL安全连接,则这个值为您所设置的HTTP端口。
“SERVER_SIGNATURE”
包含服务器版本和虚拟主机名的字符串。
“PATH_TRANSLATED”
当前脚本所在文件系统(不是文档根目录)的基本路径。这是在服务器进行虚拟到真实路径的映像后的结果。
“SCRIPT_NAME”
包含当前脚本的路径。这在页面需要指向自己时非常有用。
“REQUEST_URI”
访问此页面所需的URI。例如,“/index.html”。
“PHP_AUTH_USER”
当PHP运行在Apache模块方式下,并且正在使用HTTP认证功能,这个变量便是用户输入的用户名。
“PHP_AUTH_PW”
当PHP运行在Apache模块方式下,并且正在使用HTTP认证功能,这个变量便是用户输入的密码。
“AUTH_TYPE”
当PHP运行在Apache模块方式下,并且正在使用HTTP认证功能,这个变量便是认证的类型。
获取访客来路URL地址信息
不少网站访问统计程序提供有“来路”信息,客户查阅统计资料时从中得知访问者从什么网站连接过来。所谓“来路”,其实就是别人从哪里点击了你网站的链接,即,从什么页面连接到你的网站。在PHP中,获取“来路”信息是非常简单的,我们只需用到referer。HTTP头携带的信息当中包含有一个变量$_SERVER['HTTP_REFERER'],它提供的就是“来路”完整URL地址。以下代码放入你的PHP页面脚本,它就能够打印出连接到该脚本所在页面的具体地址(即“来路”):
$v_url=$HTTP_REFERER;
print$v_url;
比如,用户从本站的友情链接点击你的网站,你将得到类似”http://blog.0356sh.com/mayun_xingye.html“的URL地址。就这么简单。
来路的URL地址可能是很长的。作为来路地址,很多情况下,我们可能只关心它属于哪个网站,即,网站的虚拟主机名叫什么。一个URL地址包含有诸多实体信息,主要有:
·方案(scheme)-HTTP
·主机(host)–www.0356sh.com
·路径(path)–/blog/mayun_xingye.html
PHP提供一个截取这些实体信息的简便方案:parse_url()函数。
?parse_url()函数
arrayparse_url(stringurl);
parse_url()函数解析一个URL并返回一个关联数组,包含在URL中出现的各种组成部分。本函数不是用来验证给定URL的合法性的,只是将其分解为下面列出的部分。不完整的URL也被接受,parse_url()会尝试尽量正确地将其解析。对严重不合格的URL,parse_url()可能会返回FALSE并发出E_WARNING。否则会返回一个关联数组,其组成部分为(至少有一个):
scheme-如http
host
port
user
pass
path
query-在问号?之后
fragment-在散列符号#之后
Example#1parse_url()例子
$url='http://username:password@hostname/path?arg=value#anchor';
print_r(parse_url($url));
?>
以上例程会输出:
Array
(
[scheme]=>http
[host]=>hostname
[user]=>username
[pass]=>password
[path]=>/path
[query]=>arg=value
[fragment]=>anchor
)
可以看到,可以很容易分解出一个URL的各个部,那如果要拿指定的部分出来的话也很容易,如:
echoparse_url($url,PHP_URL_PATH);
就是在第二个参数中,设定如下的参数:PHP_URL_SCHEME,PHP_URL_HOST,PHP_URL_PORT,PHP_URL_USER,PHP_URL_PASS,PHP_URL_PATH,PHP_URL_QUERYorPHP_URL_FRAGMENT.
parse_url()是专门用来解析URL而不是URI的,也不能用于相对URL。不过为遵从PHP向后兼容的需要有个例外,对file://协议允许三个斜线(file:///...)。其它任何协议都不能这样。
pathinfo()函数
mixedpathinfo(string$path[,int$options])
pathinfo()返回一个关联数组包含有path的信息。包括以下的数组单元:dirname,basename和extension。
可以通过参数options指定要返回哪些单元。它们包括:PATHINFO_DIRNAME,PATHINFO_BASENAME和PATHINFO_EXTENSION。默认是返回全部的单元。如果不是要求取得所有单元,则本函数返回字符串。
Example#1pathinfo()例子
$path_parts=pathinfo("/www/htdocs/index.html");
echo$path_parts["dirname"]."\n";
echo$path_parts["basename"]."\n";
echo$path_parts["extension"]."\n";
?>
以上例程会输出:
/www/htdocs
index.html
html
其他相关函数
dirname()-返回路径中的目录部分
basename()-返回路径中的文件名部分
版权所有:《晋城生活服务》 => 《PHP获取URL的方法【总结】》
本文地址:http://blog.0356sh.com/php_url.html
除非注明,文章均为 《晋城生活服务》 原创,欢迎转载!转载请注明本文地址,谢谢。
发表评论: