热门排行
简介
蜜蜂采集器是一款采集网页数据的工具软件,它能让您方便快速地从各种网页上抓取大量规范化的数据内容,帮助您实现数据自动化采集。软件支持PHP、Python、Nodejs、Go的插件,支持多帐号采集、多帐号发布,支持FTP、SFTP、自定义插件方式的文件上传(可上传到各个云空间),支持图片水印,支持JSON/XPath/CSS选择子/正则表达式等多种数据提取方式,支持内置JavaScript运行,支持POST采集,支持翻页等。华军软件园为你提供蜜蜂采集器2023免费下载,快来体验吧!
蜜蜂采集器软件特色
极低的资源占用,优异的运行性能,可长期稳定运行
基于QT构建,原生C++编写,程序的资源占用极低,运行速度极快,从而可以支持更多的并发任务。
丰富的管理器,安全的帐号管理
软件有四种管理器:基本管理器、采集管理器、发布管理器、其他管理器。
基本管理器,主要是一些帐号相关的管理器,用于存储软件中需要使用的各种帐号信息,数据均加密存储。包括:Cookie管理、User-Agent管理、数据库连接管理、FTP连接管理、SSH连接管理、SMTP邮箱帐号、代理服务器管理、代理配置管理、外部程序管理。
采集管理器,主要是一些采集相关的管理器,用于采集工作。包括:列表页网址插件、数据处理插件、图片水印管理、中文分词设置、同义词库管理。
发布管理器,主要是一些发布相关的管理器,用于发布工作。包括:发布到站点、站点发布模块、发布到数据库、数据库发布模块、发布到文件、发布到插件、内容发布插件、发布到邮箱、文件上传配置管理、文件上传插件、消息通知配置管理、消息通知插件。
其他管理器,主要是一些杂项。包括:任务运行管理、计划任务、任务运行统计、任务运行日志文件,等等。
强大灵活的功能
数据库的连接访问,支持SSH隧道模式。
支持代理,采集更方便。
支持多帐号采集、多帐号发布。
丰富的插件类型。支持PHP、Python、Nodejs、Go四种编程语言的插件。
强大的图片水印功能。
文件下载支持断点续传。
丰富的文件上传方式。FTP、SFTP、插件方式、站点发布模块中的文件上传方式。支持上传文件到阿里云OSS、腾讯云、七牛云。FTP方式支持断点续传。
内置大量小工具。JSON分析工具、表单抓取工具,等等。
各管理器均支持导入导出。
蜜蜂采集器更新日志:
1. 修复:几处严重的内存泄露,并优化内存占用量。
2. 增加:TCP网络请求测试工具。
3. 修复:图片过大导致不水印的bug。
4. 增加:数据编辑的文件管理中将特定文件标记为未下载、未上传。
5. 优化:深色主题皮肤的一些问题。
6. 增加:续采上一次没采集的记录。
7. 增加:http头部自定义列表的导入功能。
8. 增加:自定义SSL协议最低版本的功能。
9. 增加:“任务运行管理-基本信息”的启动、暂停、停止按钮。
10. 增加:编辑采集规则的列表页的地址启用、禁用功能。
11. 增加:编辑采集规则的高级设置和站点发布模块编辑窗口中的分组控件收缩、展开功能。
12. 优化:运行日志支持主题皮肤切换功能。
13. 增加:标签数据二次处理 - HTML标签过滤的style标签的过滤。
14. 优化:其他若干功能优化与BUG修复。