10.5k Star开源神器,流程图式爬虫定义平台,让数据采集更简单!

10.5k Star开源神器,流程图式爬虫定义平台,让数据采集更简单!

告别复杂配置,用流程图轻松构建你的专属爬虫!

项目地址: https://github.com/ssssssss-team/spider-flow

SpiderFlow 是一个以流程图方式定义爬虫的平台,拥有高度的灵活性和可配置性。它让你摆脱繁琐的代码编写,通过直观的流程图界面,轻松搭建各种类型的爬虫应用。

SpiderFlow 的强大特性包括:

  • 强大的数据提取能力: 支持 Xpath、JsonPath、CSS 选择器、正则表达式等多种提取方式,甚至可以混搭提取,满足各种复杂场景的需求。
  • 广泛的数据格式支持: 能够处理 JSON、XML、二进制等多种数据格式,灵活应对不同类型的数据源。
  • 多数据源集成: 支持多种数据源,包括 SQL 数据库 (select/selectInt/selectOne/insert/update/delete 操作),方便数据的存储和处理。
  • 动态渲染页面爬取: 能够爬取 JS 动态渲染 (或 ajax) 的页面,解决传统爬虫无法获取动态内容的难题。
  • 代理支持: 支持代理设置,有效避免 IP 限制。
  • 自动保存: 可以将爬取到的数据自动保存到数据库或文件中。
  • 丰富的函数库: 内置常用字符串、日期、文件、加解密等函数,方便数据处理。
  • 插件扩展: 支持插件扩展,可以自定义执行器和方法,满足个性化需求。
  • 完善的监控: 提供任务监控和任务日志功能,方便追踪任务状态。
  • HTTP 接口支持: 支持 HTTP 接口,方便与其他系统集成。
  • Cookie 自动管理: 自动管理 Cookie,简化登录和会话维持。
  • 自定义函数支持: 用户可以根据需要自定义函数,扩展平台功能。

项目部分截图:

爬虫列表:

爬虫测试:

Debug:

日志:

SpiderFlow 还支持多种插件扩展,例如:

怎么样,看完这个项目是不是觉得很棒? 如果你正在寻找一个易于使用、功能强大的爬虫平台,SpiderFlow 绝对是你的不二之选! 快来转发给你的朋友们一起学习使用吧!

Read more

16.0k Star开源神器:命令行交互式速查表,解放你的记忆力!

16.0k Star开源神器:命令行交互式速查表,解放你的记忆力!

告别死记硬背,用 Navi 轻松掌握各种命令,成为命令行大师! 项目地址: https://github.com/denisidoro/navi Navi 是一款交互式的命令行速查表工具,它能帮你浏览和执行命令,而无需死记硬背。你可以自己编写速查表,也可以从维护者那里下载。参数的建议值会动态地显示在一个列表中,极大地提升了效率。 Navi 的优势: * 无需牢记所有 CLI 命令 * 无需复制粘贴中间命令的输出 * 减少输入 * 学习新的单行命令 Navi 在底层使用 fzf 或 skim,可以作为命令或 shell 部件(类似于 Ctrl-R)使用。 安装方式: 推荐使用以下命令安装 Navi: brew install navi Navi 可以通过多种包管理器安装,支持的平台非常广泛,包括但不限于: * macOS (通过

By majichen
16.2k Star开源神器:你的终端信息仪表盘,效率提升不止一点!

16.2k Star开源神器:你的终端信息仪表盘,效率提升不止一点!

告别频繁切换!WTF将你需要的关键信息汇聚于终端,一目了然! 项目地址: https://github.com/wtfutil/wtf WTF (又名 'wtfutil') 是你的个人终端信息仪表盘,让你能够一目了然地访问那些非常重要但又不常用的统计数据。 想象一下,无需打开多个网页或应用程序,只需在终端中就能掌握所有关键信息,效率直接拉满! WTF已被全球数千名开发者和技术人员使用,它是免费且开源的。 WTF能为你做什么? * 集中显示信息: 将各种来源的数据整合到一个终端界面中。 * 高度可定制: 通过配置文件灵活添加和配置模块。 * 提升效率: 告别在不同应用间切换,快速获取所需信息。 支持平台: WTF 可以在以下平台运行: * macOS (通过 Homebrew 或 MacPorts 安装) * Linux (通过源码安装) * Docker 特色模块: WTF 通过模块化的方式集成各种服务和信息。以下是一些热门模块,助你快速上手: * DigitalOcean: 监控你的 DigitalOcean

By majichen
33.5k Star开源神器:让Python依赖管理从此轻松!

33.5k Star开源神器:让Python依赖管理从此轻松!

告别繁琐,Poetry以优雅的方式管理你的Python项目依赖 项目地址: https://github.com/python-poetry/poetry Poetry 是一款用于声明、管理和安装 Python 项目依赖的工具,它可以确保你在任何地方都拥有正确的堆栈。它旨在取代传统的 setup.py、requirements.txt、setup.cfg、MANIFEST.in 和 Pipfile,取而代之的是一个简单的基于 pyproject.toml 的项目格式。 Poetry 解决了什么痛点? * 依赖管理复杂: 传统方式需要手动维护多个文件,容易出错且难以管理。Poetry 将所有依赖信息集中在 pyproject.toml 文件中,方便管理和维护。 * 版本冲突: 不同的项目可能依赖于相同库的不同版本,容易导致冲突。Poetry 可以自动解决版本冲突,确保项目依赖的稳定性。 * 环境一致性: 在不同的开发环境和部署环境之间保持依赖一致性是一个挑战。Poetry 通过锁定依赖版本,

By majichen
1.9k Star开源神器,让你的安卓手机化身荒野求生利器!

1.9k Star开源神器,让你的安卓手机化身荒野求生利器!

无需网络,功能强大!这款开源 Android 应用助你在野外安全无忧 项目地址: https://github.com/kylecorry31/Trail-Sense Trail Sense 是一款强大的开源 Android 应用,旨在利用你手机的传感器来辅助你在野外徒步旅行或应对生存场景。 最重要的是,它完全设计为离线使用,无需担心网络连接问题! 这款应用的功能非常丰富,可以满足你在野外环境中的各种需求: * 导航定位: 你可以设置信标并导航到它们,跟随路径,甚至可以使用照片作为地图。 * 安全保障: 通过回溯功能,你可以轻松地原路返回,避免迷路。日落警报功能可以提前提醒你日落时间,让你有足够的时间准备。 * 生存辅助: 应用内置手电筒功能,方便你在黑暗环境中照明。此外,还可以预测天气,帮助你做好应对准备。 Trail Sense 的主要特点: * 完全离线使用: 无需网络连接,所有功能均可使用。 * 功能丰富: 涵盖导航、安全、生存等多个方面,满足你在野外环境中的各种需求。 * 利用手机传感器:

By majichen