搭建能够自动采集的漫画网站

给大家带来一个搭建能够自动采集的漫画网站的教程

话不多说,教程开始

首先上图:

安装教程

环境要求:

1、安装环境
这里使用宝塔面板做演示,使用命令:

#CentOS系统

wget -O install.sh http://download.bt.cn/install/install_6.0.sh && sh install.sh

#Ubuntu系统

wget -O install.sh http://download.bt.cn/install/install-ubuntu_6.0.sh && sudo bash install.sh

#Debian系统

wget -O install.sh http://download.bt.cn/install/install-ubuntu_6.0.sh && bash install.sh

安装完成后,进入面板,点击左侧软件管理,然后安装PHP 7.2NginxMysql 5.7+Redis

接下来再找到左侧软件管理-PHP管理-设置-安装Redis扩展。

2、安装程序
我们先点击左侧网站,添加域名;然后再点击左侧数据库-添加数据库。

运行命令:
[collapse]

#进入网站根目录,将路径修改成自己的再运行

cd /www/wwwroot/www.moerats.com

#拉取源码

git clone https://github.com/hiliqi/hanman.git

#将源码移动到根目录

mv hanman/{,.}* ./

#授权用户组

chown -R www:www ./

3、设置伪静态
点击域名设置-网站目录,运行目录选择public,并把防跨站的勾去掉并重启PHP。然后点击伪静态,输入以下代码:

if (!-e $request_filename) { rewrite  ^(.*)$  /index.php?s=/$1  last; break; }

然后打开域名开始安装程序。

如果要开启404,而不让cms报错信息显示出来,需要修改config/app.php文件:

#去掉第一排的//即可

‘exception_tmpl’         => Env::get(‘app_path’) . ‘index/view/pub/404.html’,

‘exception_tmpl’         => Env::get(‘think_path’) . ‘tpl/think_exception.tpl’,

采集
通常情况下,漫画站图片资源分两种,一种本地化,一种盗链方式,这里建议将图片本地化,这样能保证网站资源稳定性,并且该程序还提供了火车头采集器的API,能够很简单的对接火车头采集器进行漫画和章节图片的采集。

首先我们需要一个火车采集器,官网→传送门,不过分为免费版和收费版,但免费版由于某些功能限制,没法满足图片本地化需求,所以暂时不适用,如果你有钱可以买一个收费版的,不过没钱也没事,可以直接使用火车头V7.6企业破解版,大概目前最新的一个破解版,也可以满足该程序的采集需求,具体怎么下载,就自行百度,很多网站提供下载链接。

注意:由于火车头V7和V8没有url编码解码功能,所以不能采集带有中文链接的漫画网站,但V9版本可以,有钱可以直接上。

采集api说明:

  1. 采集api地址:域名/api/index/save。
  2. 请求方式:post
  3. 表单字段及说明:
  4. book_name 漫画名
  5. nick_name 漫画别名
  6. tags 分类,多个分类用|隔开
  7. author 作者名字
  8. src 采集源
  9. end 状态,1代表完结,0代表连载中
  10. cover_url 封面图远程地址
  11. chapter_name 章节名
  12. images 由图片标签组成的字符串,示例:
  13. <img src=“http://www.m.com/1.jpg”><img src=“http://www.m.com/2.jpg”><img src=“http://www.m.com/3.jpg”>
  14. api_key 用于身份验证,要和后台配置的api密钥相同
  15. summary 漫画简介

下载地址:[/collapse]

吾爱博客|AYFRE.COM 版权所有,转载请标明出处
吾爱博客 » 搭建能够自动采集的漫画网站

41 评论

发表评论

吾爱博客|AYFRE.COM