## Playwright 教程
**last update: 2022-06-06 10:23:11**
----
[TOC=3,8]
----
### 背景
https://chromedriver.chromium.org/downloads
[Pyppeteer:比selenium更高效的爬虫界的新神器](https://baijiahao.baidu.com/s?id=1660869583480840819&wfr=spider&for=pc)
> 然而,Selenium 以不可靠而著称。Selenium 测试通常是不稳定的...
----
Pyppeteer 与 Playwright 的历史:
[开源爬虫神器,Playwright vs Puppeteer 对比,你应该选择哪个?_puppeteer safari_9点0频道的博客-CSDN博客](https://blog.csdn.net/limingblogs/article/details/122425455)
https://pypi.org/project/pyppeteer/
https://github.com/miyakogi/pyppeteer
> Pyppeteer 已经转移到 pyppeteer/pyppeteer
https://github.com/pyppeteer/pyppeteer
https://pyppeteer.github.io/pyppeteer/
> 注意:这个 repo 是无人维护的,很长时间以来一直没有进行小的改动。请考虑将 **playwright-python** 作为替代方案。
> Unofficial Python port of [GoogleChrome/puppeteer](https://github.com/GoogleChrome/puppeteer) JavaScript (headless) chrome/chromium browser automation library. **puppeteer** JavaScript(无头)chrome/chromium 浏览器自动化库的**非官方 Python 端口**。
https://github.com/microsoft/playwright-python
https://playwright.dev/python/
> Playwright 测试和自动化库的 Python 版本。
https://github.com/microsoft/playwright
https://playwright.dev
> **Playwright** 是一个用于 Web 测试和自动化的框架。它允许使用单个 API 测试 Chromium、Firefox 和 WebKit。 Playwright 旨在实现常绿、功能强大、可靠且快速的跨浏览器 Web 自动化。(Microsoft 微软开发)
----
https://github.com/GoogleChrome/puppeteer
https://github.com/puppeteer/puppeteer
https://pptr.dev/
> **Puppeteer** 是一个 Node.js 库,它提供了一个高级 API 来通过 DevTools Protocol 控制 Chrome/Chromium。 Puppeteer 默认以无头模式运行,但可以配置为以完整(“有头”)Chrome/Chromium 模式运行。(Chrome DevTools 团队开发)
----
### 安装
[Installation | Playwright Python](https://playwright.dev/python/docs/intro)
----
### 简单示例
----
### 拦截请求
----
### 拦截响应
----
### Locator
定位器**操作**会自动等待元素直至可见(直到匹配的元素附加到 DOM)。
https://playwright.dev/python/docs/api/class-page#page-wait-for-timeout
https://playwright.dev/python/docs/api/class-locator#locator-wait-for
https://playwright.dev/python/docs/actionability
https://playwright.dev/python/docs/api/class-locatorassertions#locator-assertions-not-to-be-attached
```python
from playwright.sync_api import sync_playwright, expect, TimeoutError as PlaywrightTimeoutError
# not wait
page.get_by_test_id("directions")
# wait
# Locator.click(timeout=3_000)
page.get_by_test_id("directions").click(timeout=3_000)
# wait
# Locator.inner_text(timeout=3_000)
page.get_by_test_id("directions").inner_text(timeout=3_000)
page.get_by_test_id("directions").is_visible(timeout=3_000)
page.get_by_test_id("directions").wait_for(timeout=3_000)
# wait
expect(page.locator(".class")).to_be_visible(timeout=3_000)
```
### a
https://zhuanlan.zhihu.com/p/623669043
目前市面上有不少类似于本案的产品,通过抓取各种内容平台数据,进行数据整理、加工处理后推出相关产品,**长久做下去的必然是和官方有合作的**,单单依靠爬虫进行数据采集的话,只要被平台方发现,告上法庭,必然会构成不正当竞争的,搞不好还有破坏计算机系统罪,广大爬虫工程师们如果公司正在研发此类产品,**一定要确认是否与官方有合作**,多多关注业务的合法合规性,避免走上违法犯罪的道路。
- 开始
- 公益
- 更好的使用看云
- 推荐书单
- 优秀资源整理
- 技术文章写作规范
- SublimeText - 编码利器
- PSR-0/PSR-4命名标准
- php的多进程实验分析
- 高级PHP
- 进程
- 信号
- 事件
- IO模型
- 同步、异步
- socket
- Swoole
- PHP扩展
- Composer
- easyswoole
- php多线程
- 守护程序
- 文件锁
- s-socket
- aphp
- 队列&并发
- 队列
- 讲个故事
- 如何最大效率的问题
- 访问式的web服务(一)
- 访问式的web服务(二)
- 请求
- 浏览器访问阻塞问题
- Swoole
- 你必须理解的计算机核心概念 - 码农翻身
- CPU阿甘 - 码农翻身
- 异步通知,那我要怎么通知你啊?
- 实时操作系统
- 深入实时 Linux
- Redis 实现队列
- redis与队列
- 定时-时钟-阻塞
- 计算机的生命
- 多进程/多线程
- 进程通信
- 拜占庭将军问题深入探讨
- JAVA CAS原理深度分析
- 队列的思考
- 走进并发的世界
- 锁
- 事务笔记
- 并发问题带来的后果
- 为什么说乐观锁是安全的
- 内存锁与内存事务 - 刘小兵2014
- 加锁还是不加锁,这是一个问题 - 码农翻身
- 编程世界的那把锁 - 码农翻身
- 如何保证万无一失
- 传统事务与柔性事务
- 大白话搞懂什么是同步/异步/阻塞/非阻塞
- redis实现锁
- 浅谈mysql事务
- PHP异常
- php错误
- 文件加载
- 路由与伪静态
- URL模式之分析
- 字符串处理
- 正则表达式
- 数组合并与+
- 文件上传
- 常用验证与过滤
- 记录
- 趣图
- foreach需要注意的问题
- Discuz!笔记
- 程序设计思维
- 抽象与具体
- 配置
- 关于如何学习的思考
- 编程思维
- 谈编程
- 如何安全的修改对象
- 临时
- 临时笔记
- 透过问题看本质
- 程序后门
- 边界检查
- session
- 安全
- 王垠
- 第三方数据接口
- 验证码问题
- 还是少不了虚拟机
- 程序员如何谈恋爱
- 程序员为什么要一直改BUG,为什么不能一次性把代码写好?
- 碎碎念
- 算法
- 实用代码
- 相对私密与绝对私密
- 学习目标
- 随记
- 编程小知识
- foo
- 落盘
- URL编码的思考
- 字符编码
- Elasticsearch
- TCP-IP协议
- 碎碎念2
- Grafana
- EFK、ELK
- RPC
- 依赖注入
- 开发笔记
- 经纬度格式转换
- php时区问题
- 解决本地开发时调用远程AIP跨域问题
- 后期静态绑定
- 谈tp的跳转提示页面
- 无限分类问题
- 生成微缩图
- MVC名词
- MVC架构
- 也许模块不是唯一的答案
- 哈希算法
- 开发后台
- 软件设计架构
- mysql表字段设计
- 上传表如何设计
- 二开心得
- awesomes-tables
- 安全的代码部署
- 微信开发笔记
- 账户授权相关
- 小程序获取是否关注其公众号
- 支付相关
- 提交订单
- 微信支付笔记
- 支付接口笔记
- 支付中心开发
- 下单与支付
- 支付流程设计
- 订单与支付设计
- 敏感操作验证
- 排序设计
- 代码的运行环境
- 搜索关键字的显示处理
- 接口异步更新ip信息
- 图片处理
- 项目搭建
- 阅读文档的新方式
- mysql_insert_id并发问题思考
- 行锁注意事项
- 细节注意
- 如何处理用户的输入
- 不可见的字符
- 抽奖
- 时间处理
- 应用开发实战
- python 学习记录
- Scrapy 教程
- Playwright 教程
- stealth.min.js
- Selenium 教程
- requests 教程
- pyautogui 教程
- Flask 教程
- PyInstaller 教程
- 蜘蛛
- python 文档相似度验证
- thinkphp5.0数据库与模型的研究
- workerman进程管理
- workerman网络分析
- java学习记录
- docker
- 笔记
- kubernetes
- Kubernetes
- PaddlePaddle
- composer
- oneinstack
- 人工智能 AI
- 京东
- pc_detailpage_wareBusiness
- doc
- 电商网站设计
- iwebshop
- 商品规格分析
- 商品属性分析
- tpshop
- 商品规格分析
- 商品属性分析
- 电商表设计
- 设计记录
- 优惠券
- 生成唯一订单号
- 购物车技术
- 分类与类型
- 微信登录与绑定
- 京东到家库存系统架构设计
- crmeb
- 命名规范
- Nginx https配置
- 关于人工智能
- 从人的思考方式到二叉树
- 架构
- 今日有感
- 文章保存
- 安全背后: 浏览器是如何校验证书的
- 避不开的分布式事务
- devops自动化运维、部署、测试的最后一公里 —— ApiFox 云时代的接口管理工具
- 找到自己今生要做的事
- 自动化生活
- 开源与浆果
- Apifox: API 接口自动化测试指南