<p>本文实例讲述了php获取百度收录、百度热词及百度快照的方法。分享给大家供大家参考。具体如下:</p> <p>获取百度收录:</p> <p>&lt;?php<br /> /*<br /> 抓取百度收录代码<br /> */<br /> function baidu($s){<br /> $baidu=&quot;http://www.baidu.com/s?wd=site%3A&quot;.$s;<br /> $site=file_get_contents($baidu);<br /> //$site=iconv(&quot;gb2312&quot;, &quot;UTF-8&quot;, $site);<br /> ereg(&quot;找到相关网页(.*)篇,&quot;, $site,$count);<br /> $count=str_replace(&quot;找到相关网页&quot;,&quot;&quot;,$count);<br /> $count=str_replace(&quot;篇,&quot;,&quot;&quot;,$count);<br /> $count=str_replace(&quot;约&quot;,&quot;&quot;,$count);<br /> $count=str_replace(&quot;,&quot;,&quot;&quot;,$count);<br /> return $count[0];<br /> }<br /> echo baidu(www.jb51.net);<br /> //获取帮客之家在百度中的收录数量<br /> ?&gt;<br /> 获取百度的热词</p> <p>&lt;?php<br /> /**<br /> * @return array 返回百度的热词数据(数组返回)<br /> */<br /> function getBaiduHotKeyWord()<br /> {<br /> $templateRss = file_get_contents(&#39;http://top.baidu.com/rss_xml.php?p=top10&#39;);<br /> if (preg_match(&#39;/&lt;table&gt;(.*)&lt;\/table&gt;/is&#39;, $templateRss, $_description)) {<br /> $templateRss = $_description [0];<br /> $templateRss = str_replace(&quot;&amp;&quot;, &quot;&amp;&quot;, $templateRss);<br /> }<br /> $templateRss = &quot;&lt;?xml version=1.0 encoding=GBK?&gt;&quot; . $templateRss;<br /> $xml = @simplexml_load_String($templateRss);<br /> foreach ($xml-&gt;tbody-&gt;tr as $temp) {<br /> if (!empty ($temp-&gt;td-&gt;a)) {<br /> $keyArray [] = trim(($temp-&gt;td-&gt;a));<br /> }<br /> }<br /> return $keyArray;<br /> }<br /> print_r(getBaiduHotKeyWord());<br /> 这是在网上找的 稍微修改了下 将下面代码写入php文件<br /> 百度收录和百度快照时间</p> <p>&lt;?php<br /> $domain = &quot;http://www.bkjia.com/ *欲查询的域名*/<br /> $site_url = &#39;http://www.baidu.com/s?wd=site%3A&#39;;<br /> $all = $site_url.$domain; /*域名所有收录的网址*/<br /> $today = $all.&#39;&amp;lm=1&prime;; /*域名今日收录的网址*/<br /> $utf_pattern = &quot;/找到相关结果数(.*)个/&quot;;<br /> $kz_pattern = &quot;/&lt;span class=&quot;g&quot;&gt;(.*)&lt;/span&gt;/&quot;; /*用以匹配快照日期的字符串*/<br /> $times = &quot;/d{4}-d{1,2}-d{1,2}/&quot;; /*匹配快照日期的正则表达式,如:2011-8-4*/<br /> $s0 = @file_get_contents($all); /*将site:www.jb51.net的网页置入$s0字符串中*/<br /> $s1 = @file_get_contents($today);<br /> preg_match($utf_pattern,$s0,$all_num); /*匹配&quot;找到相关结果数*个&quot;*/<br /> preg_match($utf_pattern,$s1,$today_num);<br /> preg_match($kz_pattern,$s0,$temp);<br /> preg_match($times,$temp[0],$screenshot);<br /> if($all_num[1] == &quot;&quot;)<br /> $all_num[1] = 0;<br /> if($today_num[1] == &quot;&quot;)<br /> $today_num[1] = 0;<br /> if($screenshot[0] == &quot;&quot;)<br /> $screenshot[0] = &quot;暂无快照&quot;;<br /> ?&gt;<br /> &lt;html&gt;<br /> &lt;head&gt;<br /> &lt;title&gt;Test&lt;/title&gt;<br /> &lt;/head&gt;<br /> &lt;body&gt;<br /> &lt;table&gt;<br /> &lt;tr&gt;<br /> &lt;td&gt;日期&lt;/td&gt;&lt;td&gt;百度收录&lt;/td&gt;&lt;td&gt;百度今日收录&lt;/td&gt;&lt;td&gt;百度快照日期&lt;/td&gt;<br /> &lt;/tr&gt;<br /> &lt;tr&gt;<br /> &lt;td&gt;&lt;?php echo date(&#39;m月d日G时&#39;);?&gt; &lt;/td&gt;&lt;td&gt;<br /> &lt;?php echo $all_num[1]; ?&gt;&lt;/td&gt;&lt;td&gt;<br /> &lt;?php echo $today_num[1]; ?&gt;&lt;/td&gt;&lt;td&gt;<br /> &lt;?php echo $screenshot[0]; ?&gt;&lt;/td&gt;<br /> &lt;/tr&gt;<br /> &lt;/table&gt;<br /> &lt;p&gt;百度收录:&lt;a href=&quot;&lt;?php echo $all; ?&gt;&quot; target=&quot;_blank&quot;&gt;<br /> &lt;?php echo $all_num[1]; ?&gt;&lt;/a&gt;&lt;/p&gt;<br /> &lt;p&gt;百度今日收录:&lt;a href=&quot;&lt;?php echo $today; ?&gt;&quot; target=&quot;_blank&quot;&gt;<br /> &lt;?php echo $today_num[1]; ?&gt;&lt;/a&gt;&lt;/p&gt;<br /> &lt;p&gt;百度快照日期:&lt;a href=&quot;&lt;?php echo $all; ?&gt;&quot;&gt;<br /> &lt;?php echo $screenshot[0]; ?&gt;&lt;/a&gt;&lt;/p&gt;<br /> &lt;/body&gt;<br /> &lt;/html&gt;</p>
返回顶部 留言