ET使用技巧之采集文章的栏目分类自动匹配

虽然一个方案对应一个发布栏目是最准确的方式,但有些用户不希望建立多个方案,来分别对应自己网站的各个栏目。

 

这里讲述一个ET的使用技巧,通过它,可以在一个方案中向不同的栏目自动发布适合的文章。

 

一些目标网站不同栏目、分类的文章,它们的版式一样,我们如下操作可以将它们自动对应到我们的网站不同 的栏目中:

 

1、在采集规则-列表网址里填上目标采集页各个栏目的网址,也可以是一个包含多个栏目/分类文章的列表网址;

 

2、在采集规则中建立一个新数据项,譬如我们可以取名为“栏目名称”,并在采集页中关联它,见图示1;

(图示1)

 

3、用这个“栏目名称”数据项去采集目标文章中的分类名称或标识作为它的值,见图示1;

 

4、建立这个“栏目名称”数据项的专用数据整理组,并和“栏目名称”数据项关联,见图示1;

 

5、设置这个数据整理组,将“栏目名称”数据项采集到的每一个可能的值,替换为用户自己网站的对应栏目真实ID,见图示2;

(图示2)

 

如果采集到的“栏目名称”中还包括其他多余字符,那么可以用变量标记进行匹配替换,见图示3:

(图示3)

 

如果有匹配不到的情况,即设置的栏目关键词不足以囊括对方所有内容,我们可以用不等式标记将未匹配到的内容统一替换为指定ID,如图示4。

该条规则的作用是,经过上面几条整理规则处理后的数据项的值不等于21、22、23时,将数据项的值替换为2。

(图示4)

 

6、在发布规则-发布项-参数取值中,添加或修改“栏目ID”参数名(栏目ID参数名见接口说明)的值为“栏目名称”数据项,见图示5;

(图示5)

 

至此,当我们采集文章时,通过数据整理,就会将自动的将文章对应到我们发布目的网站的各个栏目中了。

 

注:发布规则-检查网址栏不支持使用【文章标题】标记外的任何内部标记,即不能在此调用标题之外的数据项,因此不能通过上述方法自动匹配栏目,建议留空栏目ID参数的值以在全站检查重复(是否支持栏目ID参数留空请看接口说明书)