# 第十六章 在应用程序中加入HTML
**本章内容:**
* 在`wxPython`窗口中显示`HTML`
* 处理和打印`HTML`窗口
* 使用`HTML`分析器(`parser)`
* 支持新的标记和其它的文件格式
* 在`HTML`中使用控件
`HTML`最初是打算被作为超文本系统使用的一个简单的语义标记来使用的。迄今为止,`HTML`已经变得更加的复杂和被广泛使用。`HTML`文档标记已经被证明在网页浏览器之外也是有用的。目前`HTML`文档标记通常被用于文本标记(如在文本控件中),或用于管理一系列的超链接页面(帮助系统中)。在`wxPython`中,有许多专用于处理你的`HTML`需求的特性。你可以在一个窗口中显示简单的`HTML`,并用超链接创建你自己的帮助页面,如果你需要的话,甚至你还可以嵌入一个功能更全的浏览器。
下一节内容提示:如何在`wxPython`窗口中显示`HTML`?
## 显示HTML
在`wxPython`中,你对`HTML`能做的最重要的事情就是将它显示在一个窗口中。下面的两节,我们将讨论`HTML`窗口对象,以及给你展示如何对本地的文本或远程的`URL`使用它。
### 如何在一个wxPython窗口中显示HTML?
正如我们在第六章中讨论的,对于使用样式文本或简单的网格来快速地描述文本的布局,`wxPython`中的`HTML`是一个有用的机制。`wxPython`的`wx.html.HtmlWindow`类就是用于此目的的。图16.1显示了一个例子。
**图16.1**
![](https://box.kancloud.cn/2016-08-21_57b99647b8cdb.gif)
例16.1显示了用于产生图16.1的代码。
**例16.1** **显示简单地`HtmlWindow`**
`import wx`
```
import wx.html
class MyHtmlFrame(wx.Frame):
def __init__(self, parent, title):
wx.Frame.__init__(self, parent, -1, title)
html = wx.html.HtmlWindow(self)
if "gtk2" in wx.PlatformInfo:
html.SetStandardFonts()
html.SetPage(
"Here is some b formatted /b i u text /u /i "
"loaded from a font color=\"red\" string /font .")
app = wx.PySimpleApp()
frm = MyHtmlFrame(None, "Simple HTML")
frm.Show()
app.MainLoop()
```
`wx.html.HtmlWindow`的构造函数基本上是与`wx.ScrolledWindow`相同的,如下所示:
```
wx.html.HtmlWindow(parent, id=-1, pos=wx.DefaultPosition,
size=wx.DefaultSize, style=wx.html.HW_SCROLLBAR_AUTO,
name="htmlWindow")
```
上面的这些参数现在看着应该比熟悉。这最重要的不同点是默认样式`wx.html.HW_SCROLLBAR_AUTO`,它将告诉`HTML`窗口在需要的时候自动增加滚动条。与之相反的样式是`wx.html.HW_SCROLLBAR_NEVER`,使用该样式将不会显示滚动条。还有一个`HTML`窗口样式是`wx.html.HW_NO_SelectION`,它使得用户不能选择窗口中的文本。
当在`HTML`窗口中写要显示的`HTML`时,记住所写的`HTML`要是简单的。因为`wx.html.HtmlWindow`控件仅设计用于简单样式文本显示,而非用于全功能的多媒体超文本系统。它只支持最基本的文本标记,更高级的特性如层叠样式表(`css)`和`JavaScript`不被支持。表16.1包含了官方支持的`HTML`标记。通常,这里的标记和它的属性的行为和`web`浏览器中的一样,但是由于它不是一个完全成熟的浏览器,所以有时会出现一些奇怪行为的情况。表16.1中列出了后跟有属性的标记。
**表16.1** **用于`HTML`窗口控件的有效的标记**
| | |
| --- | --- |
| 文档结构标记 | `a href name target body alignment bgcolor ` |
| `link text meta content http-equiv title ` |
| 文本结构标记 | `br div align hr align noshade size width p ` |
| 文本显示标记 | `address b big blockquote center cite` |
| `code em font color face size h1 h2 h3 h4 h5 h6 ` |
| `i kbd pre samp small strike string tt u ` |
| 列表标记 | `dd dl dt li ol ul ` |
| 图像和地图标记 | `area coords href shape img align ` |
| `height src width usemap map name ` |
| 表格标记 | `table align bgcolor border cellpadding ` |
| `cellspacing valign width td align bgcolor colspan` |
| `rowspan valign width nowrap th align bgcolor colspan` |
| `valign width rowspan tr align bgcolor valign ` |
`HTML`窗口使用`wx.Image`来装载和显示图像,所以它可以支持所有`wx.Image`支持的图像文件格式。
### 如何显示来自一个文件或URL的HTML?
一旦你创建了一个`HTML`窗口,接下来就是在这个窗口中显示`HTML`文本。下面的四个方法用于在窗口中得到`HTML`文本。
* `SetPage(source)`
* `AppendToPage(source)`
* `LoadFile(filename)`
* `LoadPage(location)`
其中最直接的方法是`SetPage(source)`,参数`source`是一个字符串,它包含你想显示在窗口中的`HTML`资源。
你可以使用方法`AppendToPage(source)`添加`HTML`到窗口中的文本的后面。至于`SetPage()`和`AppendToPage()`方法,其中的参数`source`被假设是`HTML`,这意味着,如果你传递的是纯文本,那么其中的间距将被忽略,以符合`HTML`标准。
如果你想让你的窗口在浏览外部的资源时更像一个浏览器,那么你有两种方法。方法`LoadFile(filename)`读取本地文件的内容并将它们显示在窗口中。在这种情况中,窗口利用`MIME`文件类型来装载一个图像文件或一个`HTML`文件。如果它不能确定文件是何种类型,那么它将以纯文本的方式装载该文件。如果被装载的文档包含有相关图像或其它文档的链接,那么被用于解析那些链接的位置是原文件的位置。
当然,一个实际的浏览器不会只局限于本地文件。你可以使用方法`LoadPage(location)`来装载一个远程的`URL`,其中参数`location`是一个`URL`,但是对于本地文件,它是一个路径名。`MIME`类型的`URL`被用来决定页面如何被装载。本章的稍后部分,我们将讨论如何增加对新文件类型的支持。
图16.2显示了被装载入`HTML`窗口中的一个页面。
**图16.2**
![](https://box.kancloud.cn/2016-08-21_57b99647ccce8.gif)
例16.2显示了产生图16.2的代码
**例16.2** **从一个`web`页装载`HTML`窗口的内容**
```
import wx
import wx.html
class MyHtmlFrame(wx.Frame):
def __init__(self, parent, title):
wx.Frame.__init__(self, parent, -1, title, size=(600,400))
html = wx.html.HtmlWindow(self)
if "gtk2" in wx.PlatformInfo:
html.SetStandardFonts()
wx.CallAfter(
html.LoadPage, "http://www.wxpython.org")
app = wx.PySimpleApp()
frm = MyHtmlFrame(None, "Simple HTML Browser")
frm.Show()
app.MainLoop()
```
例16.2中关键的地方是方法`LoadPage()`。拥有更完整特性的浏览器窗口还应有显示`URL`的文本框,并在当用户键入一个新的`URL`后,可以改变窗口中的内容。
## 管理HTML窗口
一旦你有了一个`HTML`窗口,你就可以通过不同的方法来管理它。你可以根据用户的输入来触发相应的动作,处理窗口的内容,自动显示有关窗口的信息和打印页面等。在随后的几节中,我们将讨论如何实现这些。
### 如何响应用户在一个链接上的敲击?
`wx.html.HtmlWindow`的用处不只限于显示。还可以用于响应用户的输入。在这种情况下,你不需要定义你自己的处理器,你可以在你的`wx.html.HtmlWindow`的子类中覆盖一些处理函数。
表16.2说明了已定义的处理函数。`wx.html.HtmlWindow`类没有使用事件系统定义事件,所以你必须使用这些重载的成员函数来处理相关的事件,而非绑定事件类型。
另外,如果你想让一个`HTML`窗口响应用户的输入,你必须创建你自己的子类并覆盖这些方法。
**表16.2** **`wx.html.HtmlWindow`的事件处理函数**
| | |
| --- | --- |
| `OnCellClicked(cell, x, y, event)` | 当用户在`HTML`文档中敲击时调用。参数`cell`是一个`wx.html.HtmlCell`对象,该对象代表所显示的文档的一部分,诸如文本、单元格或图像等。`wx.html.HtmlCell`类被`HTML`解析器创建,这将在本章后部分讨论。参数`x,y`是鼠标敲击的准确位置(像素单位),参数`event`是相关的鼠标敲击事件。如果`cell`包含一个链接,那么这个方法的默认版本将简单地委托给`OnLinkClicked()`,否则它什么也不做。 |
| `OnCellMouseHover(cell, x, y)` | 当鼠标经过一个`HTML`单元时调用。参数同`OnCellClicked()`。 |
| `OnLinkClicked(link)` | 当用户在一个超链接上敲击时调用。该方法的默认版对链接的`URL`调用`LoadPage`。覆盖该方法通常用于使用`HtmlWindow`来为应用程序制作一个关于框。在那种情况下,你可以改变行为以便用户通过敲击其中的主页来使用`Python`的`webbrowser`模块去运行系统默认的浏览器。 |
| `OnOpeningURL(type, url)` | 当用户请求打开一个`URL`时调用,不管打开页面或页面中的一个图像。参数`type`可以是`wx.html.HTML_URL_PAGE, wx.html.HTML_URL_IMAGE, `或`wx.html.HTML_URL_OTHER`。该方法返回下列值之一——`wx.html.HTML_OPEN`允许资源装载,`wx.html.HTML_BLOCK`;阻止载入资源;或用于`URL`重定向的一个字符串,并且在重定向后该方法再一次被调用。该方法的默认版总是返回`wx.html.HTML_OPEN`。 |
| `OnSetTitle(title)` | 当`HTML`源文件中有 `title `标记时调用。通常用于在应用程序中显示标题。 |
### 如何使用编程的方式改变一个HTML窗口?
当你正显示一个`HTML`页时,你还可以改变你的窗口像浏览器样去显示其它的内容,如一另一个`Web`页,或帮助文件或其它类型的数据,以响应用户的需要。
有两个方法来当`HTML`窗口在运行时,访问和改变`HTML`窗口中的信息。首先,你可以使用`GetOpenedPage()`方法来得到当前打开的页面的`URL`。该方法只在当前页是被`LoadPage()`方法装载的才工作。如果是这样的,那么方法的返回值是当前页的`URL`。否则,或当前没有打开的页面,该方法返回一个空字符串。另一个相关的方法是`GetOpenedAnchor()`,它返回当前打开页面中的锚点(`anchor`)。如果页面不是被`LoadPage()`打开的,你将得到一个空的字符串。
要得到当前页的`HTML`标题,可以使用方法`GetOpenedPageTitle()`,这将返回当前页的 `title `标记中的值。如果当前页没有一个 `title `标记,你将得到一个空的字符串。
这儿有几个关于改变窗口中文本的选择的方法。方法`SelectAll()`选择当前打开的页面中的所有文本。你可以使用`SelectLine(pos)`或`SelectWord(pos)`做更有针对性的选择。其中`pos`是鼠标的位置`wx.Point`,这两个方法分别选择一行或一个词。要取得当前选择中的纯文本内容,可以使用方法`SelectionToText()`,而方法`ToText()`返回整个文档的纯文本内容。
`wx.html.HtmlWindow`维护着历史页面的一个列表。使用下表16.3中的方法,可以如通常的浏览器一样浏览这个历史列表。
**表16.3**
| | |
| --- | --- |
| `HistoryBack()` | 装载历史列表中的前一项。如果不存在则返回`False`。 |
| `HistoryCanBack()` | 如果历史列表中存在前一项,则返回`True`,否则返回`False`。 |
| `HistoryCanForward()` | 如果历史列表中存在下一项,则返回`True`,否则返回`False`。 |
| `HistoryClear()` | 清空历史列表。 |
| `HistoryForward()` | 装载历史列表中的下一项。如果不存在则返回`False`。 |
要改变正在使用的字体,可以使用方法`SetFonts(normal_face, fixed_face, sizes=None)`。参数`normal_face`是你想用在窗口显示中的字体的名字字符串。如果`normal_face`是一个空字符串,则使用系统默认字体。参数`fixed_face`指定固定宽度的文本,类似于 `pre `标记的作用。如果指定了`fixed_face`参数,那么参数`sizes`则应是一个代表字体的绝对尺寸的包含7个整数的列表,它对应于`HTML`逻辑字体尺寸(如 `font `标记所使用的)-24之间。如果该参数没有指定或是`None`,则使用默认的。关于默认常量`wx.html.HTML_FONT_SIZE_n`,n位于1~7之间。这些默认常量指定了对应于`HTML`逻辑字体尺寸所使用的默认字体。准确的值可能因不同的底层系统而不同。要选择一套基于用户的系统的字体和尺寸,可以调用`SetStandardFonts()`。这在`GTK2`下运行`wxPython`时是特别有用的,它能够提供一套更好的字体。
如果由于某种原因,你需要改变窗口中文本边缘与窗口边缘之间的间隔的话,`HTML`窗口定义了`SetBorders(b)`方法。参数b是间隔的像素宽度(整数值)。
### 如何在窗口的标题栏中显示页面的标题?
在你的`web`浏览器中,你可能也注意到了一件事,那就是浏览器中不光只有显示窗口,还有标题栏和状态栏。通常,标题栏显示打开页面的标题,状态栏在鼠标位于链接上时显示链接信息。在`wxPython`中有两个便捷的方法来实现这些。图16.3对此作了展示。窗口显示的标题是基于`web`页面的标题的,状态栏文本也来自`Html`窗口。
例16.3是产生图16.3的代码。
**图16.3** **带有状态栏和标题栏的`HTML`窗口**
![](https://box.kancloud.cn/2016-08-21_57b99647f0f90.gif)
**例16.3** **从一个`web`页载入`HTMLWindow`的内容**
```
#-*- encoding:UTF-8 -*-
import wx
import wx.html
class MyHtmlFrame(wx.Frame):
def __init__(self, parent, title):
wx.Frame.__init__(self, parent, -1, title, size=(600,400))
self.CreateStatusBar()
html = wx.html.HtmlWindow(self)
if "gtk2" in wx.PlatformInfo:
html.SetStandardFonts()
html.SetRelatedFrame(self, self.GetTitle() + " -- %s") #关联HTML到框架
html.SetRelatedStatusBar(0) #关联HTML到状态栏
wx.CallAfter(
html.LoadPage, "http://www.wxpython.org")
app = wx.PySimpleApp()
frm = MyHtmlFrame(None, "Simple HTML Browser")
frm.Show()
app.MainLoop()
```
要设置标题栏的关联,使用方法`SetRelatedFrame(frame, format)`。参数`frame`你想显示页面标题的框架。参数`format`是你想在框架的标题栏中显示的字符串。通常的格式是这样:“`My wxPython Browser: `%s”。:%s前面的字符串可以是你想要的任何字符串,%s将会被`HTML`页面的标题所取代。在窗口中,一个页面被载入时,框架的标题自动被新的页面的信息取代。
要设置状态栏,使用方法`SetRelatedStatusBar(bar)`。该方法必须在`SetRelatedFrame()`之后调用。参数`bar`是状态栏中用于显示状态信息的位置。通常它是0,但是如果状态栏中存在多个显示区域,那么`bar`可以有其它的值。如果`bar`的取值为-1,那么不显示任何信息。一旦与状态栏的关联被创建,那么当鼠标移动到显示的页面的链接上时,相关链接的`URL`将显示在状态栏中。
### 如何打印一个HTML页面?
一旦`HTML`被显示在屏幕上,接下来可能做的事就是打印该`HTML`。类`wx.html.HtmlEasyPrinting`就是用于此目的的。你可以使用下面的构造函数来创建`wx.html.HtmlEasyPrinting`的一个实例:
```
wx.html.HtmlEasyPrinting(name="Printing", parentWindow=None)
```
参数`name`只是一个用于显示在打印对话框中的字符串。参数`parentWindow`如果被指定了,那么`parentWindow`就是这些打印对话框的父窗口。如果`parentWindow`为`None`,那么对话框为顶级对话框。你只应该创建`wx.html.HtmlEasyPrinting`的一个实例。尽管`wxPython`系统没有强制要这样做,但是该类是被设计为独自存的。
**使用`wx.html.HtmlEasyPrinting`的实例**
从该类的名字可以看出,它应该是容易使用的。首先,通过使用`PrinterSetup()`和`PageSetup()`方法,你能够给用户显示用于打印设置的对话框。调用这些方法将导致相应的对话框显示给用户。实例将存储用户所做的设置,以备后用。如果你想访问这些设置数据,以用于你自己特定的处理,你可以使用方法`GetPrintData()`和`GetPageSetupData()`。`GetPrintData()`方法返回一个`wx.PrintData`对象,`GetPageSetupData()`方法返回一`wx.PageSetupDialogData`对象,我们将在第17章中更详细地讨论。
**设置字体**
你可以使用方法`SetFonts(normal_face, fixed_face, sizes)`来设置打印所使用的字体。这个方法的行为同用于`HTML`窗口的`SetFonts()`相同(在打印对象中的设置不会影响到`HTML`窗口中的设置)。你可以使用方法`SetHeader(header, pg)`和`SetFooter(footer, pg)`来页眉和页脚。参数`header`和`footer`是要显示的字符串。字符串中你可以使用点位符@`PAGENUM`@,占位符在执行时被打印的页号替代。你也可以使用@`PAGENUM`@占位符,它是打印的页面总数。参数`pg`的取值可以是这三个:`wx.PAGE_ALL`、`wx.PAGE_EVEN`或`wx.PAGE_ODD`。它控制页眉和页脚显示在哪个页上。通过对不同的`pg`参数多次调用该方法,可以为奇数页和偶数页设置单独的页眉和页脚。
**输出预览**
如果在打印前,你想预览一下输出的结果,你可以使用`PreviewFile(htmlfile)`方法。在这种情况下,参数`htmlfile`是你本地的包含`HTML`的文件的文件名。另一是`PreviewText(htmlText, basepath=`"")。参数`htmlText`是你实际想打印的`HTML`。`basepath`文件的路径或`URL`。如预览成功,这两个方法均返回`True`,否则返回`False`。如果出现了错误,那么全局方法`wx.Printer.GetLastError()`将得到更多的错误信息。关于该方法的更详细的信息将在第17章中讨论。
**打印**
现在你可能想知道如何简单地打印一个`HTML`页面。方法就是`PrintFile(htmlfile)`和`PrintText(htmlText, basepath)`。其中的参数同预览方法。所不同的是,这两个方法使用对话框中的设置直接让打印机打印。打印成功,则返回`True`。
## 拓展HTML窗口
在这一节,我们将给你展示如何处理`HTML`窗口中的`HTML`标记,如何创造你自己的标记,如何在`HTML`中嵌入`wxPython`控件,如何处理其它的文件格式,以及如何在你的应用程序中创建一个真实的`HTML`浏览器。
### HTML解析器(parser)是如何工作的?
在`wxPython`中,`HTML`窗口有它自己内在的解析器。实际上,这里有两个解析器类,但是其中的一个是另一个的改进。通常,使用解析器工作仅在你想扩展`wx.html.HtmlWindow`自身的功能时有用。如果你正在使用`Python`编程,并基于其它的目的想使用一个`HTML`解析器,那么我们建议你使用随同`Python`发布的`htmllib`和`HTMLParser`这两个解析器模块之一,或一个外部的`Python`工具如“`Beautiful Soup`”。
两个解析器类分别是`wx.html.HtmlParser`,它是一个更通用的解析器,另一个是`wx.html.HtmlWinParser`,它是`wx.html.HtmlParser`的子类,增加了对在`wx.html.HtmlWindow`中显示文本的支持。由于我们所关注的基本上是`HTML`窗口,所以我们将重点关注`wx.html.HtmlWinParser`。
要创建一个`HTML`解析器,可以使用两个构造函数之一。其中基本的一个是`wx.html.HtmlWinParser()`,没有参数。`wx.html.HtmlWinParser`的父类`wx.html.HtmlParser`也有一个没有参数的构造函数。你可以使用另一个构造函数`wx.html.HtmlWinParser(wnd)`将一个`wx.html.HtmlWinParser()`与一个已有的`wx.html.HtmlWindow`联系在一起,参数`wnd`是`HTML`窗口的实例。
要使用解析器,最简单的方法是调用`Parse(source)`方法。参数`source`是要被处理的`HTML`字符串。返回值是已解析了的数据。对于一个`wx.html.HtmlWinParser`,返回值是类`wx.html.HtmlCell`的一个实例。
`HTML`解析器将`HTML`文本转换为一系列的单元,一个单元可以表示一些文本,一个图像,一个表,一个列表,或其它特定的元素。`wx.html.HtmlCell`的最重要的子类是`wx.html.HtmlContainerCell`,它是一个可以包含其它单元在其中的一个单元,如一个表或一个带有不同文本样式的段落。对于你解析的几乎任何文档,返回值都将是一个`wx.html.HtmlContainerCell`。每个单元都包含一个`Draw(dc, x, y, view_y1, view_y2)`方法,这使它可以在`HTML`窗口中自动绘制它的信息。
另一个重要的子类单元是`wx.html.HtmlWidgetCell`,它允许一个任意的`wxPython`控件像任何其它单元一样被插入到一个`HTML`文档中。除了可以包括用于格式化显示的静态文本,这也包括任何类型的用于管理`HTML`表单的控件。`wx.html.HtmlWidgetCell`的构造函数如下:
```
wx.html.HtmlWidgetCell(wnd, w=0)
```
其中参数`wnd`是要被绘制的`wxPython`控件。参数w是一个浮动宽度。如果w不为0,那么它应该是介于1和100之间的一个整数,`wnd`控件的宽度则被动态地调整为相对于其父容器宽度的w%。
另外还有其它许多类型的用于显示`HTML`文档的部分的单元。更多的信息请参考`wxWidget`文档。
### 如何增加对新标记的支持?
被解析器返回的单元是被标记处理器内在的创建的,通过`HTML`标记,一个可插入的结构与`HTML`解析器单元的创建和处理相联系起来。你可以创建你自己的标记处理器,并将它与`HTML`标记相关联。使用这个机制,你可以扩展`HTML`窗口,以包括当前不支持的标准标记,或你自己发明的自定义的标记。图16.4显示了自定义`HTML`标记的用法。
**图16.4**
![](https://box.kancloud.cn/2016-08-21_57b99648119c8.gif)
下例16.4是产生图16.4的代码。
例16.4 定义并使用自定义的标记处理器
```
import wx
import wx.html
page = """ html body
This silly example shows how custom tags can be defined and used in a
wx.HtmlWindow. We've defined a new tag, blue that will change
the blue foreground color /blue of the portions of the document that
it encloses to some shade of blue. The tag handler can also use
parameters specifed in the tag, for example:
ul
li blue shade='sky' Sky Blue /blue
li blue shade='midnight' Midnight Blue /blue
li blue shade='dark' Dark Blue /blue
li blue shade='navy' Navy Blue /blue
/ul
/body /html
"""
class BlueTagHandler(wx.html.HtmlWinTagHandler):#声明标记处理器
def __init__(self):
wx.html.HtmlWinTagHandler.__init__(self)
def GetSupportedTags(self):#定义要处理的标记
return "BLUE"
def HandleTag(self, tag):#处理标记
old = self.GetParser().GetActualColor()
clr = "#0000FF"
if tag.HasParam("SHADE"):
shade = tag.GetParam("SHADE")
if shade.upper() == "SKY":
clr = "#3299CC"
if shade.upper() == "MIDNIGHT":
clr = "#2F2F4F"
elif shade.upper() == "DARK":
clr = "#00008B"
elif shade.upper == "NAVY":
clr = "#23238E"
self.GetParser().SetActualColor(clr)
self.GetParser().GetContainer().InsertCell(wx.html.HtmlColourCell(clr))
self.ParseInner(tag)
self.GetParser().SetActualColor(old)
self.GetParser().GetContainer().InsertCell(wx.html.HtmlColourCell(old))
return True
wx.html.HtmlWinParser_AddTagHandler(BlueTagHandler)
class MyHtmlFrame(wx.Frame):
def __init__(self, parent, title):
wx.Frame.__init__(self, parent, -1, title)
html = wx.html.HtmlWindow(self)
if "gtk2" in wx.PlatformInfo:
html.SetStandardFonts()
html.SetPage(page)
app = wx.PySimpleApp()
frm = MyHtmlFrame(None, "Custom HTML Tag Handler")
frm.Show()
app.MainLoop()
```
标记内在的由类`wx.Html.Tag`的方法来表现,标记的实例由`HTML`解析器来创建,通常,你不需要自己创建。表16.4显示了`wx.Html.Tag`类的方法,它们有用于检索标记的信息。
**表16.4** **`wx.Html.Tag`的一些方法**
| | |
| --- | --- |
| `GetAllParams()` | 返回与标记相关的所有参数,返回值是一个字符串。出于某些目的,解析字符串比得到各个单独的参数更容易。 |
| `GetName()` | 以大写的方式,返回标记的名字。 |
| `HasParam(param)` | 如果标记给定了参数,则返回`True`。 |
| `GetParam(param, with_commas=False)` | 返回参数`param`的值。如果参数 `with_commas`为 `True`,那么你得到一个首尾都有引号的原始字符串。如果没有指定该参数,那么返回一个空字符串。方法`GetParamAsColour(param)`返回的参数值是一个`wx.Color`,方法`GetParamAsInt(param)`返回整数值。 |
| `HasEnding()` | 如果标记有结束标记的话,返回`True`,否则返回`false`。 |
用于扩展`HTML`窗口的标记处理器都是`wx.html.HtmlWinTagHandler`的子类。你的子类需要覆盖两个方法,并且你需要知道进一步的方法。需要覆盖的第一个方法是`GetSupportedTags()`。该方法返回由处理器管理的标记的列表。标记必需是大写的,并且标记之间以逗号分隔,中间不能有空格,如下所示:
```
GetSupportedTags(self):
return "MYTAG,MYTAGPARAM"
```
第二个你需要覆盖的方法是`HandleTag(tag)`。在`HandleTag(tag)`方法中,你通过增加新的单元元素到解析器来处理标记(或者交替地改变解析器已经打开的容器单元)。你可以通过调用标记处理器的`GetParser()`方法来得到解析器。
要写一个`HandleTag(tag)`方法,你应该像下面这样做:
1、得到解析器。 2、对你的标记的参数做必要的处理,可能要改变或创建一个新的单元。 3、如果被解析的标记包括着内在的文本,那么解析标记之间的文本。 4、执行对于解析器所需要的任何清理工作。
如上所述,你使用`GetParser()`方法得解析器。要添加或编辑解析器中的单元,你有三个可选方案。第一个,如果你想添加另一个单元到容器中,你可以工作于当前的容器。第二个,你可以调用解析器的`Container()`方法,然后创建你的`wx.html.HTMLCell`子类实例,并通过调用容器的`InsertCell(cell)`方法将它添加到容器。
有时,你可能想在当前打开的容器中创建一个附属的或内嵌的容器。例如内嵌于表的一行中的一个单元格。要实现这个,你需要调用解析器的`OpenContainer()`方法。这个方法返回你的新的容器单元,你可以使用`InsertCell(cell)`方法来插入显示单元到你的新的容器单元中。对于每个在你的标记处理器中打开的容器,你应该使用`CloseContainer()`方法来关闭它。如果你没有成对的使用`OpenContainer()`和`CloseContainer()`,那么这将导致解析器解析余下的`HTML`文本时出现混乱。
第三个方案是创建一个与解析器的当前容器同级的容器,意思是不是嵌入的。例如一个新的段落——它不是前一段的一部分,也不附属于前一段;它是该页中?囊桓鲂碌氖堤濉N嗽诮馕銎髦惺迪终飧龇桨福阈枰乇障执娴娜萜鳎俅蛞桓鲂碌娜萜鳎缦滤荆?
```
parser = self.GetParser()
parser.CloseContainer()#关闭现存的容器
parser.OpenContainer()#打一个新的容器
# 添加或编辑解析器中的单元
parser.CloseContainer()
parser.OpenContainer()
```
### 如何支持其他的文件格式?
默认情况下,`HTML`窗口可以处理带有`MIME`类型`text`/`html, text`/`txt, `和`image`/*(假设`wxPython`图像处理器已经被装载)的文件。当碰上一个不是图像或`HTML`文件的文件时,该`HTML`窗口试图以纯文本的方式显示它。这可以不是你想要的行为。如果有一些文件你想以自定义的方式显示它的话,你可以创建一个`wx.html.HtmlFilter`来处理它。比如,你可能想以源代码树的方式显示`XML`文件,或使用语法着色来显示`Python`源代码文件。
要创建一个筛选器(`filter`),你必须建造`wx.html.HtmlFilter`的一个子类。`wx.html.HtmlFilter`类有两个方法,你必须都覆盖它们。这第一个方法是`CanRead(file)`。参数`file`是`wx.FSFile`(一个打开的文件的`wxPython`表示)的一个实例。类`wx.FSFile`有两个属性,你可以用来决定你的筛选器是否能够读该文件。方法`GetMimeType()`以一个字符串的形式返回该文件的`MIME`类型。`MIME`类型通常由文件的后缀所定义。方法`GetLocation()`返回带有相关文件位置的绝对路径或`URL`的一个字符串。如果筛选器会处理该文件的话,`CanRead()`方法应该返回`True`,否则返回`False`。处理`Python`源文件的`CanRead()`的一个示例如下:
```
CanRead(self, file):
return file.GetLocation().endswith('.py')
```
第二个你需要覆盖的方法是`ReadFile(file)`。这个方法要求一个同样的`file`参数,并返回该文件内容的一个字符串的`HTML`表达。如果你不想使用`wxWidgets C`++的文件机制来读该文件的话,你可以通过简单地打开位于`file.GetLocation()`的文件来使用`Python`的文件机制。
一旦筛选器被创建了,那么它必须被注册到`wx.html.HtmlWindow`,使用`wx.html.HtmlWindow`窗口的`AddFilter(filter)`静态方法来实现。参数`filter`是你的新的`wx.html.HtmlFilter`类的一个实例。一旦注册了筛选器,那么该窗口就可以使用筛选器来管理通过了`CanRead()`测试的文件对象。
### 如何得到一个性能更加完整的HTML控件?
尽管`wx.html.HtmlWindow`不是一个完整特性的浏览器面板,但是这儿有一对用于嵌入更加完整特性的`HTML`表现窗口的选择。如果你是在`Windows`平台上,你可以使用类`wx.lib.iewin.IEHtmlWindow`,它是`Internet Explorer ActiveX`控件的封装。这使得你能够直接将`ie`窗口嵌入到你的应用程序中。
使用`IE`控件比较简单,类似于使用内部的`wxPython`的`HTML`窗口。它的构造函数如下:
```
wx.lib.iewin.IEHtmlWindow(self, parent, ID=-1,
pos=wx.DefaultPosition, size=wx.DefaultSize, style=0,
name='IEHtmlWindow')
```
其中参数`parent`是父窗口,`ID`是`wxPython ID`。对于`IE`窗口,这儿没有可用的样式标记。要装载`HTML`到`IE`组件中,可以使用方法`LoadString(html)`,其中参数`html`是要显示的一个`HTML`字符串。你可以使用方法`LoadStream(stream)`装载自一个打开的文件,或一个`Python`文件对象;或使用`LoadString(URL)`方法装载自一个`URL`。你能够使用`GetText(asHTML)`来获取当前显示的文本。参数`asHTML`是布尔值。如果为`True`,则返回`HTML`形式的文本,否则仅返回一个文本字符串。
在其它平台上,你可以尝试一下`wxMozilla`项目(`http:`//`wxmozilla.sourceforge.net)`,该项目尝试创建一个`Mozilla Gecko`表现器的`wxPython`封装。目前该项目仍在测试阶段。`wxMozilla`有用于`Windows`和`Linux`的安装包,对`Mac OS X`的支持正在开发中。
## 本章小结
1、`HTML`不再是只用于`Internet`了。在`wxPython`中,你可以使用一个`HTML`窗口来显示带有`HTML`标记的简单子集的文本。该`HTML`窗口属于`wx.html.HtmlWindow`类。除了`HTML`文本,该`HTML`窗口还可以管理任一的图像(图像处理器已装载的情况下)。
2、你可以让`HTML`窗口显示一个字符串,一个本地文件或一个`URL`的信息。你可以像通常的超文本浏览器的方式显示用户的敲击,或使用它自定义的响应。你也可以将`HTML`窗口与它的框架相连接起来,以便标题和状态信息自动地显示在适当的地方。`HTML`窗口维护着一个历史列表,你可以对它进行访问和处理。你可以使用类`wx.Html.HtmlEasyPrinting`来直接打印你的页面。
3、在`wxPython`中有一个`HTML`解析器,你可以用来创建用于你自己窗口的自定义标记。你也可以配置自定义的文件筛选器来在一个`HTML`窗口中表现其它的文件格式。
4、最后,如果你对`HTML`窗口的局限性不太满意的话,那么你可以使用一个对`IE`控件的`wxPython`封闭。如果你不在`Windows`上的话,这儿也有一个对`Mozilla Gecko HTML`表现器的`wxPython`的封装。
- 活学活用wxPython
- 前言
- 致谢
- 关于本书
- 第一部分
- 第一章 欢迎使用wxPython
- 第二章 给wxPython程序一个坚实的基础
- 第三章 在事件驱动环境中开发
- 第四章 用PyCrust使得wxPython更易处理
- 第五章 绘制蓝图
- 第六章 使用wxPython基本构件
- 第二部分 基础wxPython
- 第七章 使用基础控件
- 第八章 将构件放入窗体中
- 第九章 通过对话框让用户选择
- 第十章 创建和使用wxPython菜单
- 第十一章 使用sizer放置构件
- 第十二章 操作基本图像
- 第三部分 高级wxPython
- 第十三章 建造列表控件并管理列表项
- 第十四章 网格控件
- 第十五章 树形控件
- 第十六章 在应用程序中加入HTML
- 第十七章 wxPython的打印构架
- 第十八章 使用wxPython的其他功能