参考别人的文档:https://blog.csdn.net/qq_36957681/article/details/110846217

 

通常来说,使用Pyppeteer需突破被检测识别的方案首先必须做到最基本的三个部分:

第一步:启动浏览器增加移除参数【--enable-automation】是必须的,参数:https://segmentfault.com/a/1190000019539509

const browser = await puppeteer.launch({ignoreDefaultArgs: ["--enable-automation"]});

 

第二步:使用pyppeteer_stealth框架,隐藏!参考官方:https://pypi.org/project/pyppeteer-stealth/

 

第三步【最核心的地方】:很多网站会根据你页面延迟的情况来判断是不是机器人!

1、你进入页面时是不是延迟几秒

2、每个input的输入是否为人工输入【每个字符是否间隔多少毫秒】

3、你提交按钮之前,是否延迟几秒

4、其他各种延迟的限制,是否完全符合人工操作【这个是pyppeteer框架最常用的方式,必须自己调试才能确保某个网站最佳的模拟方案】

 

Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐