搭建能够自动采集的漫画网站-吾爱博客

给大家带来一个搭建能够自动采集的漫画网站的教程

话不多说，教程开始

首先上图：

安装教程

环境要求：

1、安装环境
这里使用宝塔面板做演示，使用命令：

#CentOS系统

wget -O install.sh http://download.bt.cn/install/install_6.0.sh && sh install.sh

#Ubuntu系统

wget -O install.sh http://download.bt.cn/install/install-ubuntu_6.0.sh && sudo bash install.sh

#Debian系统

wget -O install.sh http://download.bt.cn/install/install-ubuntu_6.0.sh && bash install.sh

安装完成后，进入面板，点击左侧软件管理，然后安装PHP 7.2、Nginx、Mysql 5.7+、Redis。

接下来再找到左侧软件管理-PHP管理-设置-安装Redis扩展。

2、安装程序
我们先点击左侧网站，添加域名；然后再点击左侧数据库-添加数据库。

运行命令：
[collapse]

#进入网站根目录，将路径修改成自己的再运行

cd /www/wwwroot/www.moerats.com

#拉取源码

git clone https://github.com/hiliqi/hanman.git

#将源码移动到根目录

mv hanman/{,.}* ./

#授权用户组

chown -R www:www ./

3、设置伪静态
点击域名设置-网站目录，运行目录选择public，并把防跨站的勾去掉并重启PHP。然后点击伪静态，输入以下代码：

if (!-e $request_filename) { rewrite ^(.*)$ /index.php?s=/$1 last; break; }

然后打开域名开始安装程序。

如果要开启404，而不让cms报错信息显示出来，需要修改config/app.php文件：

#去掉第一排的//即可

‘exception_tmpl’         => Env::get(‘app_path’) . ‘index/view/pub/404.html’,

‘exception_tmpl’         => Env::get(‘think_path’) . ‘tpl/think_exception.tpl’,

采集
通常情况下，漫画站图片资源分两种，一种本地化，一种盗链方式，这里建议将图片本地化，这样能保证网站资源稳定性，并且该程序还提供了火车头采集器的API，能够很简单的对接火车头采集器进行漫画和章节图片的采集。

首先我们需要一个火车采集器，官网→传送门，不过分为免费版和收费版，但免费版由于某些功能限制，没法满足图片本地化需求，所以暂时不适用，如果你有钱可以买一个收费版的，不过没钱也没事，可以直接使用火车头V7.6企业破解版，大概目前最新的一个破解版，也可以满足该程序的采集需求，具体怎么下载，就自行百度，很多网站提供下载链接。

注意：由于火车头V7和V8没有url编码解码功能，所以不能采集带有中文链接的漫画网站，但V9版本可以，有钱可以直接上。

采集api说明：

采集api地址：域名/api/index/save。
请求方式：post
表单字段及说明：
book_name 漫画名
nick_name 漫画别名
tags 分类，多个分类用|隔开
author 作者名字
src 采集源
end 状态，1代表完结，0代表连载中
cover_url 封面图远程地址
chapter_name 章节名
images 由图片标签组成的字符串，示例：
<img src=“http://www.m.com/1.jpg”><img src=“http://www.m.com/2.jpg”><img src=“http://www.m.com/3.jpg”>
api_key 用于身份验证，要和后台配置的api密钥相同
summary 漫画简介