小白第一次在windows安装,老大之前有发布过教程,小白不是很明白,在群主大人的指导下完成,把这个过程截图下来,希望有需要的童鞋少走一些弯路,下面教程系统是64位,32位安装方法一致,把软件换成32位即可,老司机勿喷!
环境安装包合集百度云网盘
http://pan.baidu.com/s/1bp6c35l 密码:5anx
第一步:安装JRE
下载地址: http://www.java.com/zh_CN/download/
data:image/s3,"s3://crabby-images/689fc/689fc821088e1d34dacf1448fe34a5da1e055e90" alt="01.png"
data:image/s3,"s3://crabby-images/78b88/78b88c14ba7e577ef85038225b5c724c98b95605" alt="02.png"
data:image/s3,"s3://crabby-images/17428/17428fb89cb3773e0ca891020473e1a394f03a57" alt="03.png"
环境变量----
data:image/s3,"s3://crabby-images/08459/0845931579c5bd36d8c40b4716b5f06957ddd126" alt="04.png"
data:image/s3,"s3://crabby-images/cf075/cf0757b615d67e6b85f469a80ffccc2a4d5dc32d" alt="05.png"
data:image/s3,"s3://crabby-images/8c989/8c9893ebb9fbd756745d67acc95415e45805b5e5" alt="06.png"
data:image/s3,"s3://crabby-images/8164e/8164e452abcd850c020aad55ad143b48d018c44a" alt="07.png"
data:image/s3,"s3://crabby-images/5521f/5521f38a96e71f9b0c7bd2faee154489a42445db" alt="08.png"
第二步:安装tomcat
下载地址:http://www.51yd.org/apache-tomcat-7.0.52.exe
data:image/s3,"s3://crabby-images/91ba9/91ba94ca62abf595da049166c67ac878e0b281f0" alt="09.png"
data:image/s3,"s3://crabby-images/3d09e/3d09ea6ddea3fc6ce4b055beba600e7a7a684070" alt="10.png"
data:image/s3,"s3://crabby-images/2d074/2d07421068cf562b5205312eb2d049cfe231f34e" alt="11.png"
data:image/s3,"s3://crabby-images/24eb5/24eb5922fd53cf783f44fbe937a6ee5dd2f05250" alt="12.png"
data:image/s3,"s3://crabby-images/15057/15057de9383086575f8092c53eef15da8b5f0ef7" alt="13.png"
data:image/s3,"s3://crabby-images/bed3a/bed3a5702559b3bf7ca5275798a0988a8a971add" alt="WechatIMG66.jpeg"
第三步:安装数据库Postgresql
下载地址:
32bit http://www.51yd.org/postgresql-9.3.3-1-windows.exe
64bit http://www.51yd.org/postgresql-9.3.3-1-windows-x64.exe
data:image/s3,"s3://crabby-images/991fe/991fe3eb37b723bc72f04ca69de5510b1fd96190" alt="14.png"
data:image/s3,"s3://crabby-images/a2a6e/a2a6e6cd2c28e098a50867418d22cf1414afe410" alt="15.png"
data:image/s3,"s3://crabby-images/c9d38/c9d38d801a2cde6d2093fb68b3fe5094fe0d2239" alt="16.png"
data:image/s3,"s3://crabby-images/1b0f6/1b0f654b4ebbe281112c65a5dc52242fa84c088c" alt="21.png"
data:image/s3,"s3://crabby-images/fa67e/fa67e3e2fbc2af1967e4094c6224724385eb6507" alt="22.png"
data:image/s3,"s3://crabby-images/976ac/976ac91064ada05a6321284d21b3876143b2b7a4" alt="WechatIMG67.jpeg"
添加本地访问权限
D:\YiDuNovel\PostgreSQL\data\pg_hba.conf
修改如下内容
host all all 127.0.0.1/32 md5
↓
host all all 127.0.0.1/32 trust
重启下postgresql
第四部步:连接postgresql
data:image/s3,"s3://crabby-images/63d5d/63d5d2083f06e3bf914c591b3e766590bd10f575" alt="23.png"
data:image/s3,"s3://crabby-images/d8131/d813157abbb60374e36da42b39ccdf752d8eb9f6" alt="24.png"
第五部步:拷贝易读程序到ROOT
D:\YiDuNovel\Tomcat\webapps\ROOT
data:image/s3,"s3://crabby-images/c08bf/c08bf82a6c9ac67fe2450675b9e82dd3e3cd4298" alt="25.png"
data:image/s3,"s3://crabby-images/6b976/6b976f243b3da69b3e79a501156a351b47acb829" alt="26.png"
data:image/s3,"s3://crabby-images/1e434/1e4341511d2af653ba05c0728ede572c77832686" alt="27.png"
1.将tomcat/webapp下的内容备份或直接删除!
2.把程序解压缩到tomcat/webapp/ROOT下面
3.更改数据库链接的密码
文件位置:WEB-INF\classes\jdbc.properties
jdbc.password=postgres
把postgres改成你安装postgres时的密码
4.启动tomcat
5.输入www.xxx.com/install/index
data:image/s3,"s3://crabby-images/f5278/f52782fe5b6e8ea361889232549fed0ec796a12e" alt="WechatIMG68.jpeg"
到这里环境配置和易读程序就全部完工了,接下来配置易读采集器
第五步:采集规则
1.把准备好的采集规则拷贝到'rules'目录
2.编辑文件'collect.ini' rule_name=hk020.com.xml 把红色部分替换成你的采集规则名称
3.编辑文件'jdbc.properties' jdbc.password=postgres 把红色部分改成自己安装数据库输入的密码
4.编辑文件'run.ini' 这样演示是线程采集设置【群主教程】
这里教大家一个方法,对一个站开两个线程,一个线程采集全部小说,另一个线程采集更新小说。
添加下面两条,第一条默认是采集更新列表的,第二条是指定小说编号,现在的设置是从1到88888,可以根据自己的想法设置
一,-rule hk020.com.xml -ca
-rule hk020.com.xml -c 1-88888
二,修改start.bat
默认的java -jar spider.jar -ca & 改成 java -jar spider.jar -m &
启动采集器就可以啦,这样就可以最快的从一个网站把数据都抓过来啦!
等把对方站的数据采集的差不多了,就可以把-rule hk020.com.xml -c 1-88888 去掉啦,用更新列表就可以啦!
另外如果要采集多个站的话,就在run.ini再加几条规则就可以啦
5.编辑文件'site.ini' 把下面红色部分替换成你安装Tomcat的绝对路径,下面是演示
#本站根目录
base_path=D:/YiDuNovel/Tomcat/webapps/ROOT/
#章节txt存放绝对路径
txt_file=D:/YiDuNovel/Tomcat/webapps/ROOT/txt/#subDir#/#articleNo#/#chapterNo#.txt
#文章封面存放绝对路径
cover_dir=D:/YiDuNovel/Tomcat/webapps/ROOT/cover/#subDir#/#articleNo#/
全部编辑完之后我们现在可以启动采集器了,如果安装配置没什么问题现在是可以正常采集的
好废话不多说,我们双击'start.bat' 启动 'stop.bat' 停止
到此易读程序全部安装完成,可以放在一边不用管了
这里提供一个已经配置好的'yispider2.1' 替换上面教程即可!
链接:http://pan.baidu.com/s/1skAJzUt 密码:ydcl
第六步:解决搜索框编码问题(搜索不到内容)
打开tomcat的conf/server.xml,找到下面这行配置:
<Connector port="80" protocol="HTTP/1.1"
connectionTimeout="20000"
redirectPort="8443" />
改为
<Connector executor="tomcatThreadPool"
port="80" protocol="HTTP/1.1"
connectionTimeout="20000"
redirectPort="8443" URIEncoding="UTF-8"/>