上次我用file_get_contents()获取Google搜索结果源代码失败,在本地正常,但是上传到空间就不行了,去PHP群问了一位朋友,有人说也遇到这样的问题,说是Google可以判断是不是浏览器获取,如果不是将禁止获取。在网上搜索Google搜索小偷源码,几乎没有这样的程序,而百度小偷源码却很多。郁闷的是我用同样的代码获取115.com的源代码一切正常,最后我以为获取Google搜索结果源代码真的很难,但是网友酷鱼却能正常获取,我们都用Linux主机,而我的主机商说没有禁止任何函数的。哎~最终折腾了很久,还是放弃了,辛苦写的新程序就这样白搞了。
直到今天,我用curl完美在我的Linux主机上获取了Google搜索结果源代码,真的很纳闷,我现在还搞不清什么原因,不说了,说正事吧!
curl与file_get_contents()都可以获取远程网页源代码,但是curl确更强大,先不说curl其它功能,就说如何获取远程网页源代码吧!
开启curl函数库
在Windows下,默认是无法使用的,需要开启,开启方法:
去掉windows/php.ini 文件里;extension=php_curl.dll前面的;把php5/libeay32.dll,ssleay32.dll复制到系统目录windows/下,重启apache,OK!
使用curl获取远程网页源代码
代码:
<?php
$ch = curl_init();
$timeout = 5;
curl_setopt ($ch, CURLOPT_URL, ‘http://www.gonten.com’);
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
$gonten = curl_exec($ch);
curl_close($ch);
echo $gonten;
?>
使用file_get_contents()函数获取远程网页源代码
代码:
<?php
$f = file_get_contents(“http://www.gonten.com”);
echo $f;
?>
发表一下你的评论吧!有你才更精彩! 来我的腾讯微博关注我的最新动态吧
10 条评论我要评论 »
1 - 先看看 | 2009-11-10 at 09:39
相当专业,支持下
[回复]
2 - 90后的贼 | 2009-11-10 at 13:06
恩,不错,看来过几天能用的着
[回复]
十一月 10th, 2009 at 18:14
@90后的贼, 嘿嘿,你也要开始“偷”?
[回复]
3 - 卢松松 | 2009-11-10 at 13:17
我更喜欢用更简单的办法
[回复]
4 - 蛋王 | 2009-11-10 at 14:15
纯,纯,纯支持。。。不知道我能用它来干嘛。。
[回复]
5 - 男儿国博客 | 2009-11-10 at 15:30
你咋总是这么牛呢?
[回复]
6 - Hobo | 2009-11-10 at 20:25
呵呵,原来是获取到html代码啊。。我还以为能获取程序源代码呢
[回复]
十一月 10th, 2009 at 22:21
@Hobo, 源程序代码是获取不了的… 不管用什么办法 至少暂时还办不到!
[回复]
十一月 11th, 2009 at 15:05
@酷鱼, 我发现又有问题出来了,Google搜索结果HTML源代码是获取到了,但是当查询次数过多,Google就判断是计算机自动查询,要求填入验证码,郁闷了囧
[回复]
7 - 小强 | 2009-11-10 at 20:30
不搞这个,看不懂!
[回复]