快速上手 | x-crawl - GitHub Pages
x-crawl 需要 Node.js 版本 18+ 。 可以使用谷歌浏览器扩展程序来解答问题。 在 间隔时间 页面向 Page AI 提问问题。 如果你尚未阅读简介,我们强烈推荐你在移步到后续文档之前返回去阅读一下。
一个灵活的 nodejs 爬虫库 —— x-crawl - coderhxl - 博客园
2023年4月10日 · x-crawl 是一个灵活的 Node.js 多功能爬虫库。 用于爬页面、爬接口、爬文件以及轮询爬。 如果你也喜欢 x-crawl ,可以给 x-crawl 存储库 点个 star 支持一下,感谢大家的支持! GitHub: https://github.com/coder-hxl/x-crawl. 🔥 异步同步 - 只需更改一下 mode 属性值即可切换异步或同步爬取模式。 ⚙️ 多种功能 - 可爬页面、爬接口、爬文件以及轮询爬,并且支持爬取单个或多个。 🖋️ 写法灵活 - 简单目标配置、详细目标配置、混合目标数组配置以及进阶配置,同种 …
x-crawl - AI增强的网络爬虫,适应性强且高效 - Aitoolnet
x-crawl 是一款灵活强大的 Node.js AI 辅助爬虫库,能够让网络爬取更有效率、更智能、更便捷。 其 AI 驱动的特性和灵活的使用选项使其能够适应不断变化的网站结构,确保可靠且准确地提取数据。 AI 辅助:利用高级 AI 模型来理解网页语义并提取数据,即使网站结构发生变化。 ?️ 灵活编写:支持多种爬取配置,每种配置都有其优势,以满足不同的爬取需求。 ⚙️ 多种用途:能够爬取动态页面、静态页面、API 和文件数据。 适应网站变更:当网站更新其类名或 HTML 结构 …
简介 | x-crawl - GitHub Pages
x-crawl 是一个灵活的 Node.js AI 辅助爬虫库。 灵活的使用方式和强大的 AI 辅助功能,使爬虫工作变得更加高效、智能和便捷。 它由两部分组成: 爬虫:由爬虫 API 以及各种功能组成,即使不依靠 AI 也能正常工作。 AI:目前基于 OpenAI 提供的 AI 大模型,让 AI 简化很多繁琐的操作。 如果您觉得 x-crawl 对您有所帮助,或者您喜欢 x-crawl ,可以在 GitHub 上给 x-crawl 存储库 点个 star 。 您的支持是我们持续改进的动力! 感谢您的支持! 🤖 AI 辅助 - 强大的 AI 辅助功能,使爬虫 …
配置 | x-crawl - GitHub Pages
一些通用的配置可以通过在这三个地方设置: 优先级为:详细目标配置 > 进阶配置 > 应用实例配置. 以 maxRetry 重试次数为例: 在上面的示例中, 应用实例配置 、 进阶配置 以及 详细目标配置 中都设置了 重试次数,page3 将会采用自己的重试次数(8次),page1、 page2 以及 page4 将采用进阶配置的重试次数(6次),page5 会使用应用实例配置的重试次数(3次)。 可在使用 null 取消上层配置。 以 maxRetry 重试次数为例: 在上面的示例中,page-1、page3、page4 都 …
