热门排行
简介
网络神采是一款通用的、速度最快的网络信息采集软件,可以用来采集: 新闻、文章、论坛贴子、企业营销资料、图片、FLASH、MP3、软件、电影等任何通过浏览器看得到的东西,快来下载体验吧。
软件功能
1、网站内容维护:可以定时采集新闻、文章等,并自动发布到您的网站。
2、Internet数据挖掘:可以从指定网站抓取所需数据,通过分析和处理后保存到您的数据库。
3、网络信息监控:通过自动采集,可以监控论坛等社区类网站,让您第一时间发现您所关注的内容。
4、文件批量下载:可以批量下载PDF、RAR、图片等各种文件,并同时采集其相关信息。
5、通过二次开发扩展功能。
软件特点
A、通用:通过定制采集规则,能够采集任何通过浏览器看得到的东西。
B、灵活:支持网站登录采集、网站跨层采集、POST采集、脚本采集、动态页面采集等高级功能。
C、扩展性强:支持存储过程、插件等,您可以通过二次开发扩展功能。
D、高效:为了让您节省一分钟去做其它事情,软件做了精心设计。
E、速度快:速度最快、效率最高的采集软件。
F、稳定:系统资源占用少、有详细的运行日志、采集性能稳定,而且,软件要求“零BUG”。
G、人性化:我们始终注重细节,并及时为您提供全方位服务。
更新日志
1、增加定期重启软件功能。
2、修复bug:定时采集启动任务时会进队列2次。
3、增加设置:特殊结果设置->记录任务名称。
4、修复bug:Win7下启动服务IO异常。
5、按任务统计插件。
6、修复bug:文本查看器切换到空白单元格会出错。
7、如果不下载文件,不要再生成子目录(即使选中设置)。
8、F9运行文件夹下所有任务后,子文件夹的任务状态没有改变。
9、修复bug:访问休息间隔设置为“0-1秒”时失效。
10、处理JS中的相对地址时,可识别“'”前面的转义符“\”。
11、发生WorkerThreadError的异常时,可记录异常的详细内容。
12、读取网址时出错后,可暂停任务。
13、发生WorkerThreadError的异常时,任务可暂停;若暂停失败,则停止任务。
14、修复bug:继续任务时,如果任务进入任务队列,则会重新开始任务。
15、停止任务,同样要写日志。
16、改进了任务队列的查询算法。
17、改进了机器码的可读性。
18、WorkerThreadError:引发类型为“System.OutOfMemoryException”的异常。该异常发生后,可暂停任务。
19、保存“提取网址”时如果出错,可恢复。
20、增加设置:如果“使用插件处理采集结果数据行”失败(即返回“false”),仍显示采集结果。
21、废弃设置:关闭软件时,如果有软件正在运行,强制停止所有任务。
22、改进“源文件查看器”用户体验3处:Cookie变化、粘贴POST参数时自动分离、菜单快捷键。
23、捕获地址时,如果某个参数有变化,文本框背景色则变红。
24、将检查“关键规则”调整到“采集结果筛选”之前。
25、更新插件接口(IBget3.4),更新内容:CheckSchedule、Create新增参数:lastTaskState、lastPausingReason。
26、请求休息间隔,支持随机数。
27、请求重试可以设置为无限次数,同时增加“重试休息间隔”、“重试错误范围”设置。
28、任务增加设置:动作失败后不暂停任务。
29、下载文件时,只请求一次。
30、运行整个文件夹的任务时,增加快捷键:F9。
31、修复bug:批量暂停正在启动的任务时,会有“运行中”状态闪过。
32、解决:运行信息窗口资源释放问题。
33、使用插件处理结果数据行后,如果返回false,则数据行不再显示。
34、循环采集拆分字符串数组时,保留空值。
35、修复内存bug一处。
36、修复bug:查看等待区出错:集合已修改;可能无法执行枚举操作。
37、修复bug:由于插件日志回调事件,会引发异常:远程对象已断开。
38、修复bug:设置窗口如果不操作,2分钟后会抛异常:远程对象已断开。
39、更新插件接口(IBget3.3),更新内容:ExtractResult新增参数:rowIndex;Create新增参数:supportAsyncCall。
40、创建插件时如果出错,任务不再提示连接数据库。
41、特殊结果-》记录当前网址,如果有POST参数,则包含在其中。
42、修复bug:任务完成后取消定时采集,在选中“使用插件检查定时采集”时仍起作用。
43、修复bug:源文件查看器预览功能,不能预览框架页。
44、增加复制采集规则功能。
45、提取下一网址时,如果与网址队列重复,则提示:提取n条,已去重.
46、连续提取下一层网址失败已达到n次后,不再提取下一页网址,不然下次请求时会重复提取。
47、修复几处内存溢出问题。
48、修复bug:文本查看器html方式查看,关闭窗口后,再打开出错“未将对象引用设置到实例”。
49、改进定时采集检查思路:取当前时间并缓存,这样就没有了定时偏差。