以下是对已实现的内置策略的一些目标和简介
WARNING
请注意, 一定要为每个策略配置相应的参数, 为了防止用户不设置默认值, 各策略的配置都不是用户想要的, 而是为了快速方便测试而设置的
IP 地址黑名单
这个没什么可说的
实现思路:
获取当前ip地址并判断是否在黑名单之中
IP 访问频率检测
爬虫的一个重要特征就是频繁访问, 访问频率远远高于正常用户
所以对此只能记录每个IP的每次访问, 判断是否过于频繁
IP 持续访问检测
如果一个用户, 连续一天访问目标网站, 每分钟都有访问记录, 那几乎可以判定是爬虫无疑了, 当然也不排除多个用户共用同一台设备的情况