DiiDú爬虫-专业数据采集软件
基于浏览器的网页爬虫工具扩展程序,可自定义爬虫抓取数据并导出,对动态加载页面有奇效!
What is DiiDú爬虫-专业数据采集软件?
Stats
- storage
- tabs
- alarms
- unlimitedStorage
- declarativeNetRequest
- declarativeNetRequestWithHostAccess
- scripting
- debugger
- http://*/*
- https://*/*
Chrome-Stats Rank
Other platforms
Summary
🕷DiiDú专业数据采集软件是一款Edge浏览器扩展插件。其以轻巧敏捷的代码,塑造强大的爬虫能力,只需要一台安装Edge浏览器的电脑,即可采集各种页面上您所需的信息。
与其他爬虫软件设计理念不同的,它不仅可以分析页面原始的HTML代码,而且还支持动态加载的DOM元素,按照您预先设计的字段定义,切分组合这些网页上的数据,并储存到您的本地,最后导出成常见的Excel数据格式。它是基于Edge浏览器原生的行为设计的,因此针对异步加载页面的数据,也可以轻松采集。
✅ 使用须知 🔸目前该软件系原创,完全免费下载使用,已开设会员,对于非会员有小部分功能有限制。目前除了会员信息和支付信息外,没有收集任何您在使用该软件过程的任何数据。你在使用之前,应及时阅读相应的隐私条款。 🔸请遵守中华人民共和国相关的法律法规,不得用于非法用途。在使用本软件之前,请您务必先阅读相关的法律法规。您能够采集的,仅限于对公众开放的互联网页面信息,例如公开的招投标信息、公开的招生信息、或者公开的产品型号性能信息等。您应该清楚了解到,涉及到国家安全数据、个人身份信息、私有(封闭的)信息系统、以及有版权商业信息的采集,都可能触犯国家的法律。而因为恶意的爬虫行为造成对方服务器宕机、数据丢失或者服务异常的,则是涉嫌破坏信息安全的犯罪。 🔸本软件所采用的爬虫技术是基于浏览器正常浏览行为的模拟,如模拟页面打开、翻页、滚动、下载。该技术不涉及到站点HTTP请求数据的破解、伪造、篡改、暴力刷新等非法的手段。在使用本软件过程中,请注意合理设置使用,否则您可能会遇到服务器IP封锁,或者受到网络监管部门的监控,甚至触犯法律得不偿失。 🔸本软件自1.1.6版本起,含有会员服务。对于非会员用户,我们可能会在软件界面上增加必要的广告,或者限制部分的功能。如果您觉得反感,请主动卸载。 🔸目前该版本支持单页面的文本循环采集,二级页面文本采集,计划任务,图片屏蔽,邮件统计发送,以及采集结果的自动过滤功能。后续将支持对图片的下载,实现地图采集等诸多功能。此外,本插件程序只支持Edge浏览器,请勿尝试安装在其他浏览器上。 🔸使用本软件的前提是您需要了解一定的编程知识,如Edge浏览器的开发者模式,能够阅读并快速网页HTML标签。如果您对此完全空白,您可能需要重点阅读官网的帮助文档。如果您能够掌握一些最基础的“正则表达式”语法,相信可以给您的数据采集工作带来极大的助力。
✅ 开始使用 🔸整体流程如为:编辑规则 → 测试规则 → 编辑任务 → 执行采集 → 导出数据 🔸您需要花几分钟创建一个采集规则,或者花几秒钟导入一个采集规则。
User reviews
Safety
Risk impact
DiiDú爬虫-专业数据采集软件 is very risky to use and it requires a lot of sensitive permissions. Avoid installing this add-on unless you absolutely trust this publisher.
Risk likelihood
DiiDú爬虫-专业数据采集软件 is probably trust-worthy. Prefer other publishers if available. Exercise caution when installing this add-on.