• 注册
  • php爬虫框架 关注:2 内容:8

    Beanbun

  • 查看作者
  • 打赏作者
  • 拉黑名单
    • 特点

        支持守护进程与普通两种模式(守护进程模式只支持 Linux 服务器)

        默认使用 Guzzle 进行爬取

        支持分布式

        支持内存、Redis 等多种队列方式

        支持自定义URI过滤

        支持广度优先和深度优先两种爬取方式

        遵循 PSR-4 标准

        爬取网页分为多步,每步均支持自定义动作(如添加代理、修改 user-agent 等)

        灵活的扩展机制,可方便的为框架制作插件:自定义队列、自定义爬取方式…

      你需要登录,才能进行发帖操作
    • 单栏布局 帖子间隔 侧栏位置: