当前位置 : 主页 > SEO实战 > 正文

最详细火车头数据采集系统DedeCMS发布文章攻略(2)

原创

重庆seo2016-06-09 08:33:00阅读()网站改版dedecms编辑文章A+ / A-

最详细火车头数据采集系统DedeCMS发布文章攻略(2)

第二步:采集内容规则

       打开任意的目标站的内容页,找到标题、作者、来源、发布时间、正文内容对应的特征代码片段。获取方式和前面审查元素一样,最后测试一下目标内容页能否正常采集。

火车头采集内容规则

第三步:发布内容设置

①这里选择启用方式一:web在线发布到网站

       刚开始添加发布配置的是空的,需要点击“Web发布配置管理”。

火车头采集发布内容设置方法

       在弹出的对话框内,新建一个发布模块。跟一定要填写好根目录地址

http://127.0.0.1/lvshi/

②设置网站自动登陆(难点)

火车头采集新建发布配置

       上图的第四个红框就是自动登陆设置,采取的是URL抓包的方法,继续往下看。

       打开Fiddler,如果软件左侧很多url,可以按Ctrl+X删除,建议把浏览器其他无关的页面关闭。可以看到Fiddler工具里面会显示当前web的数据,由于是在本地测试,DedeCMS安装在htdocs的lvshi目录下,完整路径是

E:\APMServ5.2.6\www\htdocs\lvshi\dede\

       找到相应的登陆url,点击

http://127.0.0.1/lvshi/dede/login.php?gotopage=%2Flvshi%2Fdede%2Findex.php 

       点击右侧的Inspectors按钮,显示代码如下(每个人的都不一样)。

采集URL抓包工具Fiddler使用方法

       分别复制下面红色的字体部分,填写到对应文本框内

User-Agent(User-Agent后面代码):Mozilla/5.0(windows NT 10.;WOW64)...(此处代码省略) 
登陆地址后缀(GET:后面代码):/dede/login.php
来源地址后缀(Referer:后面代码):/dede/login.php?gotopage=%2Flvshi%2Fdede%2Findex.php
粘贴抓包获取的数据(Cookie:后面代码):CNZZDATA1000250736=2025245578-1461249721-http%253A%252F%252F127.0.0.1%252F%7C1461299919;..(此处代码省略)

       把双击用户名、密码、验证码等,在弹出的对话框内,把对应的值替换成对应的标签。

       用默认的标签进行替换规则,一般有[用户名]、[密码]、[验证码]等。

dede火车头设置网站自动登陆

       最后填写自定义的系统命名及版本号,保存模块即可。

扩展阅读

本文地址:https://www.vi586.com/case/295.html
版权声明:原创文章,版权归重庆SEO吖七所有,欢迎分享本文,支持原创,转载请保留出处

赞(21)