php采集安装教程(Python数据采集流程)

  本篇文章给大家带来的内容是关于php中常用的采集函数的总结(附代码),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。  这几天关注了一下PHP的采集程序,才发现用PHP采集内容是这么方便,

  本篇文章给大家带来的内容是关于php中常用的采集函数的总结(附代码),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。

  「php」php中常用的采集函数的总结,值得收藏!(附代码)「php」php中常用的采集函数的总结,值得收藏!(附代码)这几天关注了一下PHP的采集程序,才发现用PHP采集内容是这么方便,把经常用到的采集函数在这里总结一下,方便以后使用!

  获取所有链接内容和地址

  function getAllURL($code){

  preg_match_all(‘/”‘ ]+)[“|’]?s*[^>]*>([^>]+)/i’,$code,$arr);

  return array(‘name’=>$arr[2],’url’=>$arr[1]);

  }

  获取所有的图片地址

  function getImgSrc($code){

  $reg = “/]*src=”(http://(.+)/(.+).(jpg|gif|bmp|bnp|png))”/isU”;

  preg_match_all($reg, $code, $img_array, PREG_PATTERN_ORDER);

  return $img_array[1];

  }

  当前的脚本网址

  function getSelfURL(){

  if(!empty($_SERVER[“REQUEST_URI”])){

  $scriptName = $_SERVER[“REQUEST_URI”];

  $nowurl = $scriptName;

  }else{

  $scriptName = $_SERVER[“PHP_SELF”];

  if(empty($_SERVER[“QUERY_STRING”])) $nowurl = $scriptName;

  else $nowurl = $scriptName.”?”.$_SERVER[“QUERY_STRING”];

  }

  return $nowurl;

  }

  把全角数字转为半角数字

  function getAlabNum($fnum){

  $nums = array(“0”,”1”,”2”,”3”,”4”,”5”,”6”,”7”,”8”,”9”);

  $fnums = “0123456789”;

  for($i=0;$i”,”>”,$txt);

  $txt = preg_replace(“/[rn]{1,}/isU”,”rn”,$txt);

  return $txt;

  }

  清除HTML标记

  function clearHtml($str){

  $str = str_replace(‘’,’>’,$str);

  return $str;

  }

  相对路径转化成绝对路径

  function relative2Absolute($content, $feed_url) {

  preg_match(‘/(http|https|ftp):///’, $feed_url, $protocol);

  $server_url = preg_replace(“/(http|https|ftp|news):///”, “”, $feed_url);

  $server_url = preg_replace(“//.*/”, “”, $server_url);

  if ($server_url == ”) {

  return $content;

  }

  if (isset($protocol[0])) {

  $new_content = preg_replace(‘/href=”//’, ‘href=”‘.$protocol[0].$server_url.’/’, $content);

  $new_content = preg_replace(‘/src=”//’, ‘src=”‘.$protocol[0].$server_url.’/’, $new_content);

  } else {

  $new_content = $content;

  }

  return $new_content;

  }

  获取指定标记中的内容

  function getTagData($str, $start, $end){

  if ( $start == ” || $end == ” ){

  return;

  }

  $str = explode($start, $str);

  $str = explode($end, $str[1]);

  return $str[0];

  }

  「php」php中常用的采集函数的总结,值得收藏!(附代码)「php」php中常用的采集函数的总结,值得收藏!(附代码)HTML表格的每行转为CSV格式数组

  function getTrArray($table) {

  $table = preg_replace(“‘]*?>’si”,’”‘,$table);

  $table = str_replace(“”,’”,’,$table);

  $table = str_replace(“”,”{tr}”,$table);

  //去掉 HTML 标记

  $table = preg_replace(“‘’si”,””,$table);

  //去掉空白字符

  $table = preg_replace(“‘([rn])[s]+’”,””,$table);

  $table = str_replace(” “,””,$table);

  $table = str_replace(” “,””,$table);

  $table = explode(“,{tr}”,$table);

  array_pop($table);

  return $table;

  }

  将HTML表格的每行每列转为数组,采集表格数据

  function getTdArray($table) {

  $table = preg_replace(“‘]*?>’si”,””,$table);

  $table = preg_replace(“‘]*?>’si”,””,$table);

  $table = preg_replace(“‘]*?>’si”,””,$table);

  $table = str_replace(“”,”{tr}”,$table);

  $table = str_replace(“”,”{td}”,$table);

  //去掉 HTML 标记

  $table = preg_replace(“‘’si”,””,$table);

  //去掉空白字符

  $table = preg_replace(“‘([rn])[s]+’”,””,$table);

  $table = str_replace(” “,””,$table);

  $table = str_replace(” “,””,$table);

  $table = explode(‘{tr}’, $table);

  array_pop($table);

  foreach ($table as $key=>$tr) {

  $td = explode(‘{td}’, $tr);

  array_pop($td);

  $td_array[] = $td;

  }

  return $td_array;

  }

  返回字符串中的所有单词 $distinct=true 去除重复

  function splitEnStr($str,$distinct=true) {

  preg_match_all(‘/([a-zA-Z]+)/’,$str,$match);

  if ($distinct == true) {

  $match[1] = array_unique($match[1]);

  }

  sort($match[1]);

  return $match[1];

  }

原创文章,作者:发布专员,如若转载,请注明出处:https://ziliaobaba.com/13614.html

(0)
发布专员发布专员
上一篇 2022年1月9日 22:20
下一篇 2022年1月9日 23:07

相关推荐

  • 专业乒乓球拍怎么选?乒乓球拍的选择

    咱们接着说,要打好乒乓球,一款适合自己的拍子就显得尤为重要。 这里我说一个原则: 鞋合不合适,脚知道。 选择乒乓球拍最关键的是适合自己,适合自己,匹配自己最合适。 乒乓球拍分为两部…

    2022年10月20日
  • 用白醋洗脸的正确步骤是什么?用白醋洗脸的正确方法

    很多女性会用白醋洗脸,那么用白醋洗脸的功效有哪些,对应不同的功效应该如何洗脸呢? 功效一:美白护肤 具体方法:先准备一小盆水,不要太热,最好是温水,然后倒入约二汤匙白醋调均。洗净脸…

    2022年12月11日
  • 夏天开空调温度多少合适

    夏天开空调温度多少合适 ======================================================== 随着夏天的到来,空调成为人们夏天生活中不可…

    投稿 2023年3月23日
  • lol暴击猴子出装(lol猴子出装)

    想必大家应该都听过这么一句话:如果一个一个上,盖伦能打十个猴子。其实这并非夸大其词,因为曾经的猴子就是全联盟公认的“上路计量单位”,同等水平之下绝大部分上单都能把它按在地上摩擦。但…

    2022年11月7日
  • 怎样做表格?电脑制作表格

    EXCEL是一款专门制作表格,输入数据、统计分析的办公软件,下面我们来看如何在EXCEL表格里制作一张表格,我把它分为一选二线三调四合五设置,当然这几个步骤的顺序不是绝对的,可以根…

    2022年11月29日
  • 元旦档上映的影片数量已达13部

    即将到来的2024年新年,元旦档电影备受期待,将再次燃起观众的热情。今年,共有13部影片确认在元旦档上映,其中包括了一系列备受瞩目的作品。这些电影将为观众呈现丰富多样的题材和精彩的…

    2023年12月26日
  • 怎样才能做一个好的管理?如何做好管理

    如何才能做好管理?吃透人性,抓住人心,你就能轻松做好管理。管理就是和人性做博弈,掌握这6招,让你调动人性,拉拢人心,做一个成功的领导者。   一、定目标,用目标告诉员工—…

    2022年11月28日
  • 黑色运动裤搭配黑色大衣?呢子大衣配运动裤

    大家好呀。 黑色大衣是一件非常经典又百搭的单品。穿的时间还蛮长的,可以从深秋一直穿到第二年早春。搭配的空间也是很大的。而且这件衣服不怎么挑人,基本上谁都可以穿的。 不过再百搭的衣服…

    2021年11月15日
  • 2022中国经济形势预测(2022年国内经济形势预测)

    新华财经北京12月31日电(王春霞)2021年,在新冠肺炎疫情反复、变异新冠病毒德尔塔毒株和奥密克戎毒株出现与蔓延的背景下,全球经济脆弱复苏。站在年尾,回看这一年,我们发现,作为“十四五”的开局之年,中国经济彰显出巨大潜力和韧性,宏观经济数据亮点

    投稿 2022年1月5日
  • 第一次开店应该注意些什么问题和细节

    开店是一件重要的事情,如果没有恰当的准备,很可能会影响到店铺的运营和发展。那么,第一次开店应该注意些什么问题和细节呢? 一、选择合适的店铺地址 在开店之前,首先要考虑的就是店铺的地…

    投稿 2023年6月22日