网站采集工具大比拼
脚本之家
1、火车头 使用人数上应该是最多的,主要集中在新站
特色:功能多,速度快
优点:功能比较齐全,采集速度比较快,主要针对cms,短时间可以采集很多,过滤,替换都不错,比较详细,很多人写接口,发布,接口比较齐全,适合不太懂程序的站长
技术:技术主要是论坛支持,帮助文件多,上手容易。有收费,免费版本
缺点:功能增多,越来越大,费内存,速度快,采集的质量有些降低,不稳定
2、三人行 主要针对论坛,可以称的上是第一
特色:针对各大论坛,搬家,移动,速度快,准确度高
优点:还是针对论坛,适合开论坛的
技术:收费技术,免费有广告
缺点:对cms支持比较差
3、ET工具
特色:无人值守,稳定,几乎不占内存
优点:无人值守,自动更新,适合长期做站,用户群主要集中在长期做站潜水站长。软件清晰,必备功能也很齐全,关键是软件免费,听说已经增加采集中英文翻译功能。
技术:论坛支持,软件本身免费,但是也提供收费服务。帮助文件较少,上手不容易
缺点:似乎帮助文件少才是这个软件的缺点
4、海纳
特色:海量,关键词抓取,可以预览采集内容,不用写规则
优点:海量,可以抓取网站很多一个关键词文章,似乎适合做网站的专题
技术:无论坛 收费,免费有功能限制
缺点:分类不方便,也就说采集文章归类不方便,要手动(自动容易混淆),特定接口
5、八爪鱼采集器
号称:最好用的网页数据采集器,让数据触手可及!
一直在寻找一个优秀的采集软件,直到使用了八爪鱼。和市面上其他采集软件不同的是,八爪鱼采集器没有繁杂的采集规则设置,通过鼠标点击几次就可以成功配置一个采集任务,把体验做到了极简,大幅度提高了工作效率。用一句话形容八爪鱼采集器,那就是:追本朔源,将一切行为回归到人的本性。
总结:追求功能齐全的,似乎应该选择火车头,火车头被称之为“无所不能”,初期作站,可以迅速采集很多的资源,充实网站内容。如果做论坛,那选择三人行,没错了,可以实现采集论坛,回复,搬家等多项论坛功能。长期做站,当然选择ET了,花点时间,弄懂,是个长期受益的事情。写好规则,设置好过滤替换,然后可以像开QQ一样,长期运行,不费内存,自动采集更新,分类明确,采集内容完整,可是说,一个站,一个站长+ET足够了。至于海纳,似乎不写规则,上手容易,但是对文章的发布上,不能如ET一劳永逸,反而觉得增加很多工作,但是可以做专题,这是网站专题一个不错的选择。