插件名称:文章采集

发布日期:2023-06-25 19:19浏览次数:

文章采集(批量采集目标网站数据信息到本网站存储,节省编辑人工采集时间)

价格

 

¥165元

 

【全国24小时热线】联系人:赖经理 电话:159-7096-7616

可以分页和批量采集***文章到网站的文章库,免去手工复制文章繁琐操作。
插件下载后将解压的文件夹放在public/addons/ 目录里。


一、配置采集任务信息。

倒序采集:则从分页中的***后一页的***后一篇文章开始采集。

过滤重复标题:检测文章库中是否已存在当前标题的文章,存在则不进行采集。

图片本地保存:将采集文章中的图片下载到服务器。

采集首张图为封面图:如果通过列表封面图没能获取到图片,则从文章中获取第,一张图片。

采集后立即发布:不建议开启,建议采集后手工检查文章内容是否正确,标签是否缺失,没问题后再进行发布。


二、配置要采集的文章链接信息

举例:

1、打开网址http://.com/12/index.php/node/1.html


2、分页网址:通过翻页找到分页参数规律,该网站的分页规律是参数p作为页面值,所以分页网址应填写如下:

http://.com/12/index.php/node/1.html?p={{pageid}}


3、列表内容:在文章列表页按F12查看源代码,找到可以截取列表内容的***开始代码和结束代码,如下图

通过右键“查看网页源代码”找到代码进行复制,若需要多行代码请原样复制,所以列表内容应填写如下内容:

<div class="review">{{html}}<div id="pager">

<div class="review">{{html}}</div>

            <div id="pager">


4、通过网页源代码找到文章链接和列表封面图(没有可以不填)的开始结束代码,如下图


文章链接应填写如下内容:

<h3><a target="_blank" href="{{html}}" title="

列表封面图应填写如下内容:

"><img src="{{html}}" alt="


三、配置要采集的文章内容信息

举例:

1、打开网址http://.com/12/index.php/article/13.html


2、在文章页按F12查看源代码,找到可以截取文章标题、SEO标题、SEO关键字、SEO描述的开始结束代码,如下图


文章标题应填写如下内容:

<h1>{{html}}</h1>

SEO标题应填写如下内容:

<title>{{html}}</title>

SEO关键字应填写如下内容:

<meta name="keywords" content="{{html}}" />

SEO描述应填写如下内容:

<meta name="description" content="{{html}}" />


3、文章内容获取同上,如下图

通过右键“查看网页源代码”找到代码进行复制,所以文章内容应填写如下内容:

<div class="art_info">{{html}}<div class="hc_sxpost">


四、点击“测试”,查看采集效果,确认采集没问题后,点击“采集”,正式采集。


如果您有什么问题,欢迎咨询技术员 点击QQ咨询