当前位置: 首页 > news >正文

深圳网站设计师怎么在网站上做宣传

深圳网站设计师,怎么在网站上做宣传,软件开发前端和后端区别,服务器放网站之前做页面抓取#xff0c;数据采集等功能的时候#xff0c;第一个想到的就是用正则表达式去匹配页面内容。但是对于像我这种#xff0c;正则只懂皮毛的人来说#xff0c;写正则是真的很恶心的一件事。去网上找#xff0c;也不一定能改成自己需要的正则。今天给大家推荐一…之前做页面抓取数据采集等功能的时候第一个想到的就是用正则表达式去匹配页面内容。但是对于像我这种正则只懂皮毛的人来说写正则是真的很恶心的一件事。去网上找也不一定能改成自己需要的正则。今天给大家推荐一个很好用的工具smiple html dom。文档地址http://www.phpddt.com/manual/simplehtmldom_1_5/manual.htm解析器不仅仅只是帮助我们验证html文档更能解析不符合W3C标准的html文档。它使用了类似jQuery的元素选择器通过元素的idclasstag等等来查找定位同时还提供添加、删除、修改文档树的功能。当然这样一款强大的html Dom解析器也不是尽善尽美在使用的过程中需要十分小心内存消耗的情况。不过不要担心本文中笔者在最后会为各位介绍如何避免消耗过多的内存。下面是我解析的mm131.com的页面内容代码主要是盗链他的图片O(∩_∩)O哈哈~index.phprequire ./dom/simple_html_dom.php;require ./include/function.php;//打开错误信息error_reporting(E_ERROR | E_WARNING | E_PARSE);$count  0;error_reporting(0);$url  trim(post(url));$str  ;if($url){$html  new simple_html_dom();$html-load_file($url..html);$ret  $html-find(.content-pic img);$title  $html-find(title,0);echo str_ireplace(www.mm131.com,,iconv(GBK,UTF-8,$title-innertext)).;foreach($ret as $v){if($v-src){$str . $v-src.\n;$count;}}flush();for($i  2;$i $html-clear();$location  $url._.$i..html;if(!GetCurl($location)){break;}$html-load_file($location);$ret  $html-find(.content-pic img);foreach($ret as $v){if($v-src){$str . $v-src.\n;$count;}}flush();}echo $count;}以上3个代码块都是index.php的内容。其中的require ./dom/simple_html_dom.php; 即引用的simple html dom 解析器。function.php 只是封装了2个方法 代码如下function GetCurl($url){$ch  curl_init();curl_setopt($ch,CURLOPT_URL,$url);curl_setopt($ch, CURLOPT_HEADER, true);curl_setopt($ch, CURLOPT_NOBODY,true);curl_setopt($ch, CURLOPT_RETURNTRANSFER,true);curl_setopt($ch, CURLOPT_FOLLOWLOCATION,true);curl_setopt($ch, CURLOPT_AUTOREFERER,true);curl_setopt($ch, CURLOPT_TIMEOUT,30);$rtn  curl_exec($ch);curl_exec($ch);if(strpos($rtn,404 Not Found)true) {return false;}return true;}function post($id) {return isset ( $_POST [$id] ) ? $_POST [$id] : ;}如何避免解析器消耗过多内存在本文的开篇中笔者就提到了Simple HTML DOM解析器消耗内存过多的问题。如果php脚本占用内存太多会导致网站停止响应等一系列严重的问题。解决的方法也很简单在解析器加载html文档并使用完成后记得清理掉这个对象就可以了。当然也不要把问题看得太严重了。如果只是加载了2、3个文档清理或不清理是没有多大区别的。当你加载了5个10个甚至更多的文档的时候用完一个就清理一下内存绝对是对自己负责啦^_^
http://www.pierceye.com/news/603237/

相关文章:

  • 公司网站代码模板下载山东城建设计院网站
  • 茂港网站建设公司妇科医院网站建设怎么做
  • 怎么自己改自己做的网站的图片策划案网站
  • 养殖p2p网站建设网址大全浏览器下载
  • 建立网站的过程沈阳做网站直播的公司
  • 沈阳市网站设计公司大全电商毕业设计作品
  • 做网站怎么赚钱滑县电桂林两江四湖景区导游词
  • 加快门户网站建设文网站建设费用计入什么科目
  • 网站建设合同英文模板下载湖州做网站的公司
  • 网站内容页设计济南网站优化
  • 简洁中文网站模板下载军事新闻头条最新消息
  • 湘潭网站建设 诚信磐石网络开发app软件的步骤
  • 阿里云网站备案网站建设方案书私有云可以建设网站
  • 网站建设如何增加流量做杂志的网站有哪些
  • 可信网站认证有用建设网站什么语言
  • 福州网站建设 大公司wordpress顺序
  • 为什么网站开发要用架构个人主页网站制作教程
  • 东莞教育网站建设做网站工资还没有文员高
  • 郑州网站制作工作室国内网站开发
  • 现在什么网站做外贸的最好wordpress window系统
  • 柬埔寨网赌网站开发新网络营销
  • html5毕业设计作品苏州关键词优化排名推广
  • 网站建设包括的内容相册在线设计平台
  • 花生壳可做网站吗微商城开发用华网天下首选
  • 口岸地区网站建设内容塔里木油田公司档案馆网站建设研究
  • 网站备案属于公司哪一块石家庄最新状况
  • 秦州建设网站免费代刷网站推广
  • 怎么查看一个网站是用什么程序做的我的家乡湛江网站设计
  • 沈阳网页模板建站开发手机app多少钱
  • 全国建设注册中心网站网页设计师培训价格