52杰奇论坛

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 5055|回复: 0

杰奇 cms 笔趣阁后台采集规则[免费分享]

[复制链接]

598

主题

251

回帖

100万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1004949
发表于 2022-4-23 16:00:00 | 显示全部楼层 |阅读模式
很早之前写过,也有人在评论里提到过,很多网站章节用 js 显示,杰奇后台根本采集不到,我之前的尝试就失败过。今天下午看了看 www.qu.la 这个网站,发现章节并不是我想象的那种显示,而是直接代码,所以就试试写了后台采集规则,没想到成功了,只是 windows 下采集真的很慢,我的电脑采集到一半 nginx 竟然还崩溃了,不过这也是个成功吧。所以我觉得如果是用 windows 系统,直接用关关采集器好多了,linux 下用后台采集还行。或许看我这个,应该可以学会自己配置后台采集吧。以下为我的填法,最底下我会附配置好的文件,除了我设置的之外,其它的可以不填:网站名称:笔趣阁网站地址:http://www.qu.la发送HTTP_REFERER标志,用于突破防采集设置:是小说信息页面采集规则小说信息页面地址:http://www.qu.la/book/<{articleid}>/小说标题采集规则:作者采集规则:小说类型采集规则:小说类型对应关系:根据自己网站的填写关键字采集规则:内容简介采集规则:封面图片采集规则:目录页面链接采集规则 :全文标记采集规则:小说目录页面采集规则小说目录页面地址:http://www.qu.la/book/<{articleid}>/分卷名称采集规则:》!!!!章节名称采集规则:>!!!!章节序号采集规则:/$$$$.html">章节内容页面采集规则章节内容页面地址:http://www.qu.la/book/<{articleid}>/<{chapterid}>.html章节内容采集规则:****
章节内容过滤规则:看情况吧,目标网站有哪些广告文字就填哪些进来是否采集图片内容到本地:是提示:目前遇到的问题就是,虽然可以成功获取到小说的封面,但是似乎无法本地化,当然不排除是我试验时候,是用的一库多站分站的原因,或者看了这篇文章的人也可以试试,希望可以留下反馈,当然如果出现问题或者有问题也留下评论,我都会解答。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|52杰奇论坛  

GMT+8, 2024-5-3 05:48 , Processed in 0.080846 second(s), 25 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表