您的位置:首页网页设计PHP实例 → 同时提取多条新闻中的文本一例

同时提取多条新闻中的文本一例

时间:2004/11/7 3:25:00来源:本站整理作者:蓝点我要评论(1)

本文为一个提取一批新闻网页中的文本的小程序,它可以将各篇新闻的内容存为以该新闻标题为文件名的文本文件。如有更好的处理方法,请和我联系:

lwx3069@sina.com

   这里以人民网中的“今日要闻”下的新闻为例.

<?php

($url) ? "" : $url = "http://www.unn.com.cn/GB/channel2/3/11/index.html";        // 今日要闻

if(isset($url)&&$url!="")        {

   $str = implode("",file($url));

   $str_ary = explode("

",$str);


   $str_ary = explode("

",trim($str_ary[1]));

   for ($i=0; $i<8; $i++)        {

      if (strlen(trim($str_ary[$i]))<3){

      continue;

      }

      echo "新闻".$i.":".$str_ary[$i];

      $str1=strstr("$str_ary[$i]",'<a href="/');

      $str2=strstr("$str_ary[$i]",'" target');

      $len1=strlen("$str1");

      $len2=strlen("$str2");

      $len=$len1-$len2;

      $url=substr("$str1",10,$len-10);

      if (strlen(trim($url))!=0) {

         $url = "http://www.unn.com.cn/".$url;

         define(CONTENTS_DIR,"./contents/");

         if(isset($url)&&$url!="")        {

            $str = implode("",file($url));

            $str1=explode('

',$str);            //去掉文件没用的上半部分

            $str2 = explode('

&nbsp;

',$str1[1]);

            //取出文件的下半部分,并去掉没用的下半部分,这时得到的都是有用的

            $str3=explode('',$str2[0]);   //从整个有用部分取出文件标题和正文

            $str4=explode('

',$str2[0]);   //取出日期和时间

            $str5=explode('',$str3[1]);     //从标题和正文部分取出标题

            $title=str_replace("
","",$str5[0]);

            $str3=explode('

',$str2[0]);          //从整个有用部分取出文件正文

            $str3[1]=str_replace('

&nbsp;&nbsp;&nbsp;&nbsp;',"\n"."  ",$str3[1]);

            $str3[1]=str_replace('&nbsp;',"",$str3[1]);

            $str3=strip_tags($str3[1]);

            $pf=trim($title).".txt";

            $ppf=fopen(CONTENTS_DIR."$pf",'w');

            fputs($ppf,$title);

            fputs($ppf,"$str4[0]");

            fputs($ppf,$str3);

        }

     }

  }

}

?> 

相关阅读 Windows错误代码大全 Windows错误代码查询激活windows有什么用Mac QQ和Windows QQ聊天记录怎么合并 Mac QQ和Windows QQ聊天记录Windows 10自动更新怎么关闭 如何关闭Windows 10自动更新windows 10 rs4快速预览版17017下载错误问题Win10秋季创意者更新16291更新了什么 win10 16291更新内容windows10秋季创意者更新时间 windows10秋季创意者更新内容kb3150513补丁更新了什么 Windows 10补丁kb3150513是什么

文章评论
发表评论

热门文章 没有查询到任何记录。

最新文章 我的php文件怎么打开_php运算符怎么写 php 如何生成静态页面的函数PHP生成图片缩略图PHP session常见问题集锦及解决办法PHP实现同步远程Mysql

人气排行 DEDE在文章列表文章没有缩略图的不显示图片php+mysq修改用户密码我的php文件怎么打开_如何打开php文件的办法FCKeditor的配置和使用方法使用dedecms建站教程PHP+Ajax实现分页技术图片存储与浏览一例Linux+Apache+PHP+MySQLPHP生成图片缩略图