RSS

dedecms 采集教程大全


{dede:trim}<table([^>]*)&gt;([^&gt;]*)</table>{/dede:trim} 
{dede:trim}<table([^>]*)&gt;{/dede:trim} 
{dede:trim}</table>{/dede:trim} 
{dede:trim}<span([^>]*)&gt;{/dede:trim} 
{dede:trim}</span>{/dede:trim} 
{dede:trim}</IFRAME>{/dede:trim} 
{dede:trim}<script>(.*)</script>{/dede:trim} 
{dede:trim}<script(.*)>{/dede:trim} 
{dede:trim}</script>{/dede:trim} 

----------------------------------- 
对于下面这些规则就请慎用 
----------------------------------- 
{dede:trim}<div(.*)>{/dede:trim} 
{dede:trim}</div>{/dede:trim} 
{dede:trim}<stong>{/dede:trim} 
{dede:trim}</stong>{/dede:trim} 
{dede:trim}<div(.*)>(.*)</div>{/dede:trim} 
{dede:trim}<center(.*)>{/dede:trim} 
{dede:trim}</center>{/dede:trim} 
{dede:trim}<p(.*)>{/dede:trim} 
{dede:trim}</p>{/dede:trim} 
{dede:trim}<span(.*)>{dede:trim} 
{dede:trim}</span>{dede:trim} 
{dede:trim}<img(.*)>{/dede:trim} 
{dede:trim}<div(.*)>{/dede:trim} 
{dede:trim}</div>{/dede:trim} 
以上就是本篇要介绍的内容,正则也许并不是每处都用得上,但当你了解其写法后,自己也可以写出一些更加适合自己使用的规则出来。

 【DEDECMS采集基础教程】分页采集篇(五)
分页采集,一直是困扰很多站长的问题,对于文章内容的采集来说,并不难,最难的莫过于分页采集。因为多种多样的分页格式,在采集的时候怎样去取分页的区域,怎样才不会采集回来重复的内容,这确实是个头疼的问题。有次johnny在写采集规则的时候就因为疏忽,结果采集回来的文章内容重复了,所以johnny决定单独写此文来。在写本文的时候,johnny也思考过该怎么去写好本文,毕竟在这方面johnny也不是懂很多,希望能和各位一起学习研究。 
接下来就以一个例子来分析,本次的例子网址是: 
http://www.ladysfashion.cn/dress/dapei/20080321/1319.html  
1、打开本文例子网址,把页面拉到下面,可以看到其分页,见下面图1: 

图1 
图1  
[时间:2008-11-20]
相关文章