ThinkChat2.0新版上线,更智能更精彩,支持会话、画图、阅读、搜索等,送10W Token,即刻开启你的AI之旅 广告
# Selenium 获取 HTML > 原文: [https://pythonbasics.org/selenium_get_html/](https://pythonbasics.org/selenium_get_html/) Selenium 是用于浏览器自动化的 Python 模块。 您可以使用它来抓取 html 代码,该网页由什么构成:超文本标记语言(HTML)。 要获取它,首先启动 Web 浏览器并加载页面。 然后,您可以获取它。 为此,必须安装 Web 驱动程序。 ## 获取 html ### Selenium 获取 html 下面的代码启动 Firefox Web rbowser,使用`get()`方法打开一个网页,最后使用`browser.page_source`存储该网页 html。 ```py #_*_coding: utf-8_*_ from selenium import webdriver import time # start web browser browser=webdriver.Firefox() # get source code browser.get("https://en.wikipedia.org") html = browser.page_source time.sleep(2) print(html) # close web browser browser.close() ``` ![selenium get html](https://img.kancloud.cn/3c/3b/3c3b1ef7365b6a1174732c9b5dc1aac0_1068x542.jpg) [下载示例](https://gum.co/GjuJxo)