Dragon
  • 欢迎来到主题派官网,主题源码,插件,模板下载。wordpress,thinkphp,discuz,织梦模板,小程序。
主题派主题派  2023-06-16 14:12 主题派 隐藏边栏 |   抢沙发  8 
文章评分 0 次,平均分 0.0

火车头采集器使用教程–寻找目标网站

这一步教程值得单独开一篇文章来写,每个网站的设计都不一样,他们发表的文章分类也不同。这里就介绍最常见的一种结构。

我们首先需要确定你要采集什么内容,然后根据不同内容去找目标网站。

比如我要采集 IT 资讯、云服务器类的内容。

以景安的文章为例,我先找到了他的文章都放在了哪个网站。

在百度这样搜索 site:zzidc.com windows2008

site:zzidc.com 代表仅搜索这个域名下的内容,包括 www 域名和其他二级域名的内容

空格后跟一个 windows2008 的关键词,这样我搜出来都是景安网站下的关于 windows2008 的相关内容了。

从搜索结果里可以看到主要有两个域名地址,我选择了 server.zzidc.com 这个站点,因为这个内容多!

站点里有很多文章,我们要寻找自己想采集的文章。我选择了服务器教程相关的文章

点击这个分类,看看,里面有 33 页的列表,数量还可以

现在在列表第一页,他的地址是 https://server.zzidc.com/fwqjc/

然后我们翻页看一下第二页,发现地址变成了 https://server.zzidc.com/fwqjc/list_7_2.html

第三页变成了 https://server.zzidc.com/fwqjc/list_7_3.html

这就有一个比较好的列表页规律,非常适合我们采集。

就选择它了!

下面我们就打开火车头采集器吧,后面的要配合采集器来操作。

请看后续教程

「点点赞赏,手留余香」

还没有人赞赏,快来当第一个赞赏的人吧!

主题派给主题派打赏
×
予人玫瑰,手有余香
  • 2
  • 5
  • 10
  • 20
  • 50
2
支付

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

主题派
主题派 关注:0    粉丝:0
Wordpress主题,插件,源码商城

发表评论

表情 格式 贴图 链接 私密 签到 常用语
扫一扫二维码分享
×
艾瑞克网