这篇文章是在采集文章并发布到 DedeCMS系统的基础上进行扩展,一些部分会讲得略一些,如果您有的操作看不懂,请查看一下原文.
我们打开火车默认的任务 下载软件并发布到木翼,然后一步步不说,
首先是标签的建立,下载类的因为标签很多,且需要和模块里一一对应,手工加容易出错,我们使用软件的标签智能提取功能,程序会自动新建标签.
网址获得部分很简单,主要是规则里有一些难度的,比如文件大小的获得和单位用的是正则表达式.
关键的一步是获得文件下载地址,我们看一下规则;
这里是使用了替换,注意.原来网页上的下载地址是 http://www.codepub.com/d/downpage.php?n=1&id=14293::1230976050,我们点击后 打开
http://www.codepub.com/d/downpage.php?n=1& id=14293::1230976050,还是原来的地址,但是上边有下载地址了,注意,地址是这样的
有三个地址,我们取第一个:http://www.codepub.com/d/download.php?n=1& amp;server=1&id=14293::1230976050,注意这里是有联系的,所以我们用替换就可以直接得到地址了.然后用它下载 软件.测试,可以下载到了.
下面是下载的保存地址 udownload2009-0210 这个是程序默认的地址,后边的年月日是随时间变化的,我们用随机目录,然后测试下
但是有一个问题,就是木翼默认会将
这里的文件地址和原来的动态地址加起来,这样就有问题了,下载地址不对了.怎么办呢?目前我还没有发现比较好的解决方 法,只有先采集不发布,采集完了替换一下,只要标题,然后发布,就可以了.我们看批量采集.
发布到网站的结果.
点进去看一下都正常,OK.