该插件允许您在保存网页的时候,或者使用“批量文章处理”功能的时候,通过自定义的规则,来获得文章正文,以去除不必要的广告等其它信息。
 
 
 
获得文章正文插件作用,就是通过自定义的一些规则,来获得文章正文:下面的对话框,显示了当前存在的规则。
 
 
导入 按钮:允许从XML文件导入规则。您可以从用户交流区,获得其他用户提供的规则。
导出 按钮,允许将当前的规则,保存成XML文件,您可以将这个XML文件,提供给其他用户使用。
 
添加 按钮:允许您自己添加一个规则
编辑 按钮:允许您编辑已经存在的规则
删除 按钮:允许您删除存在的规则
 
复制 按钮:允许您复制一个已经存在的规则
 
向上 按钮:向上移动规则
向下 按钮:向下移动规则
 
规则:
 
 
描述:规则的描述
网址:规则适用的网址。程序会在网页的原始网址里面查找,如果找到规则指定的网址,则使用该规则,否则不使用。如果网址为空,则适用于所有网页。
查找正文开始的文字:用来查找文章HTML正文开始部分的文字标记,例如新浪新闻网页里面,文章正文开始,会有“<!--正文内容开始-->”这样的文字。
正则表示式:查找正文开始的文字是一个正则表达式。
匹配大小写:查找正文开始的文字,需要匹配大小写。
查找正文结束的文字:用来查找文章HTML正文结束部分的文字标记。
 
添加到正文之前的文字:程序将会把这部分文字,添加到已经获得的文章正文前面。
里面可以使用以下参数:
%NodeTitle%:会使用文章标题进行替换。
%NodeURL%:会使用文章来源URL进行替换。
 
追加到正文之后的文字:程序会把这部分文字,追加到已经获得的文章正文之后。同样,程序会替换上面的参数。
 
包含标记文字:在获得的文章正文里面,包含进行标记的文字。
包含HTML头:最终的文章结果,包含HTML的 HEAD部分。
 
注意:
在浏览器内,选择“查看源代码”功能看到的网页源代码,可能和CyberArticle获得的网页源代码有所不同,因此,建议您先保存一个网页,然后在CyberArticle里面查看保存后的网页的源代码,来查找合适的文字标记,以获取文章正文。