# 13.2 字符串类型
使用字符串类来代替标准的字符串指针的好处是被普遍接受的.而wxWidgets就提供了它自己的字符串类:wxString,无论在wxWidgets 内部还是在其提供的API接口上,这个类都被很广泛的使用.wxString类拥有你对一个字符串类期待的所有的操作,包括:动态内存管理,从其它字符串类型构建,赋值操作,单个字符访问,字符串连接和比较,子字符串获取,大小写转换,空格字符的修剪和补齐,查找和替换,类似C语言printf的操作以及类似流一样的插入函数等等.
除了上述的这些字符串处理常用功能,wxString还支持一些额外的特性.wxString完美支持Unicode,包括ANSI字符和Unicode的互相转换,这个特性是和wxWidgets的编译配置无关的.使用wxString还使得你的代码拥有直接将字符串传递给库函数以及直接从库函数返回字符串的能力.另外,wxString已经实现了90%的STL中的std::string类的函数,这意味着对STL熟悉的用户基本上不需要重新学习wxString的使用方法.
使用wxString
在你的应用程序中使用wxString类型是非常简单而直接的.将你程序中使用std::string或者是别的你习惯的字符串类的地方,全部用wxString代替基本就可以了.要注意的是,所有参数中使用字符串的地方,最好使用const wxString&这样的声明(这使得函数内部对于字符串的赋值操作由于使用了引用记数器技术而变得更快速),而所有返回值中使用的字符串则最好直接使用wxString类型,这使得在函数内部即使返回一个局部变量也是安全的.
C和C++的程序员通常都已经很熟悉字符串的各种操作了,因此wxString的详细的API参考就不在这里罗嗦了,请参考wxWidgets的相关文档.
你可能会注意到wxString的好多函数具有同样的功能,比如Length,Len和length函数都返回这个字符串的长度.在这种情况下,你最好使用标准STL兼容的函数形式.这会让你的代码对别的程序员来说更亲切,并且将使你的代码更容易转换为别的不使用wxWidgets库的代码,你甚至可以直接使用typedef将wxString重定义为std::string.另外wxWidgets某一天可能会开始使用标准的std:: string,因此这种作法也会让你的代码更容易保持前向兼容.(当然,wxString的函数也会保留以保证后向兼容.)
wxString,字符以及字符串常量
wxWidgets定义了一个wxChar类型,在不同的编译选项(ANSI或Unicode)下,这个类型用来映射char类型或者 wchar_t类型.象前面提到的那样,你不必使用单独的char类型或者wchar_t类型,wxString内部存储数据的时候使用的是相应的C类型.在任何时候,如果你需要对单个字符进行操作,你应该使用wxChar类型,这将使得你的代码在ANSI版本和Unicode版本中保持一致,而不必使用大量的预定义宏.
如果wxWidgets被编译成Unicode的版本,和标准字符串常量是不兼容的,因为标准字符串常量无论在哪种版本中都是 char*类型.如果你想在Unicode版本中直接使用字符串常量,你应该使用一个转义宏L.wxWidgets提供了一个宏wxT(或者_T)来封装字符串常量,这个宏在ANSI版本中被定义为什么事情也不做,而在Unicode版本中则用来封装L宏,因此无论在哪种版本中,你都可以使用下面的方法使用字符串常量:
```
wxChar ch = wxT('*');
wxString s = wxT("Hello, world!");
wxChar* pChar = wxT("My string");
wxString s2 = pChar;
```
关于使用Unicode版本的更详细的信息,请参考第16章:"编写国际化应用程序".
wxString到C指针的转换基础
因为有时候你需要直接以C类型访问wxString的内部数据进行底层操作,wxWidgets提供了几种对应的访问方法:
* mb_str函数无论在ANSI版本 还是Unicode版本都返回一个const char*类型的指针const char*, 如果是Unicode版本,则字符串首先经过转换,转换过程可能导致数据丢失.
* wc_str函数无论在ANSI版本还是Unicode版本都返回一个wchar_t*类型,如果是ANSI版本,则字符串首先被转换成Unicode版本然后再返回.
* c_str则返回一个指向内部数据的指针 (ANSI版本为const char*类型, Unicode版本为const wchar_t*类型).不进行任何转换.
你可以使用c_str函数的特性实现wxString和std::string之间的转换,如下所示:
```
std::string str1 = wxT("hello");
wxString str2 = str1.c_str();
std::string str3 = str2.c_str();
```
使用wxString经常遇到的一个陷井是过度使用对const char*类型的隐式的类型强制转换.我们建议你在任何需要使用这种转换的时候,显式使用c_str来指明这种转换,下面的代码演示了两个常见的错误:
```
// 这段代码将输入的字符串转换为大写函数,然后将其打印在屏幕上
// 并且返回转换以后的值 (这是一个充满bug的代码)
const char *SayHELLO(const wxString& input)
{
wxString output = input.Upper();
printf("Hello, %s!\n", output);
return output;
}
```
上面这四行代码有两个危险的缺陷,第一个是对printf函数的调用.在类似puts这样的函数中,隐式的类型强制转换是没有问题的,因为puts声明其参数为const char*类型,但是对于printf函数,它的参数采用的是可变参数类型,这意味着上述printf代码的执行结果可能是任何一个种结果(包括正确打印出期待结果),不过最常见的一种结果是程序异常退出,因此,应该使用下面的代码代替上面的printf语句:
```
printf(wxT("Hello, %s!\n"), output.c_str());
```
第二个错误在于函数的返回值.隐式类型强制转换又被使用了以此,因为这个函数的返回值是const char*类型,这样的代码编译是没有问题的,但是它返回的将是一个局部变量的内部指针,而这个局部变量在函数返回以后就很快被释放了,因此返回的指针将变成一个无效指针.解决的方法很简单,应该将返回类型更改为wxString类型,下面列出了修改了以后的代码:
```
// 这段代码将输入的字符串转换为大写函数,然后将其打印在屏幕上
// 并且返回转换以后的值 (这是正确的代码)
wxString SayHELLO(const wxString& input)
{
wxString output = input.Upper();
printf(wxT("Hello, %s!\n"), output.c_str());
return output;
}
```
标准C的字符串处理函数
因为大多数的应用程序都要处理字符串,因此标准C提供了一套相应的函数库.不幸的是,它们中的一部分是有缺陷的(比如strncpy函数有时候不会添加结束符NULL),另外一部分则可能存在缓冲区溢出的危险.而另一方面,一些很有用的函数却没能够进入标准的C函数库.这些都是为什么wxWidgets要提供自己的额外的全局静态函数的原因,wxWidgets的一些静态函数视图避免这些缺陷:wxIsEmpty函数增加了对字符串是否为NULL的校验, 在这种情况下也返回True.wxStrlen函数也可以处理NULL指针,而返回0.wxStricmp函数则是一个平台相关的大小写敏感字符串比较函数,它在某些平台上使用stricmp函数而在另外一些平台上则使用strcasecmp函数.
"wx/string.h"头文件中定义了wxSnprintf函数和wxVsnprintf,你应该使用它们代替标准的 sprintf函数以避免一些sprintf函数先天的危险.带"n"的函数使用了snprintf函数,这个函数在可能的时候对缓冲区进行大小检查.你还可以使用wxString::Printf而不必担心遭受可能受到的针对printf的缓冲区溢出攻击.
和数字的相互转换
应用程序经常需要实现数字和字符串之间的转换,比如将用户的输入转换成数字或者将计算的结果显示在用户街面上.
ToLong(long* val, int base=10)函数可以将字符串转换成一个给定进制的有符号整数.它在成功的时候返回True并将结果保存在val中,如果返回值是False,则表明字符串不是一个有效的对应的进制的数字.指定的进制必须是2到36的整数,0意味着根据字符串的前导符决定: 0x开头的字符串被认为是16进制的, 0-则被认为是8进制的, 其它情况下认为是10进制的.
ToULong(unsigned long* val, int base=10)的工作模式和ToLong函数一致,不过它的转换结果为无符号类型.
ToDouble(double* val)则实现字符串到浮点数的转换.返回值为Bool类型.
Printf(const wxChar* pszFormat, ...) 和C语言的sprintf函数类似,将格式化的文本作为自己的内容.返回值为填充字符串的长度.
静态函数Format(const wxChar* pszFormat, ...)则将格式化的字符串作为返回值.因此你可以使用下面的代码:
```
int n = 10;
wxString s = "Some Stuff";
s += wxString::Format(wxT("%d"),n );
```
操作符"<<"可以用来在wxString中添加一个int,float或者是double类型的值.
wxStringTokenizer
wxStringTokenizer帮助你将一个字符串分割成几个小的字符串,它被用类代替和扩展标准C函数strtok,它的使用方法是:传递一个字符串和一个可选的分割符(默认为空白符),然后循环调用GetNextToken函数直到HasMoreTokens返回False,如下所示:
```
wxStringTokenizer tkz(wxT("first:second:third:fourth"), wxT(":"));
while ( tkz.HasMoreTokens() )
{
wxString token = tkz.GetNextToken();
// 处理单个字符串
}
```
默认情况下,wxStringTokenizer对于全空字符串的处理和strtok的处理相同,但是和标准函数不同的是,如果分割符为非空字符,它将把空白部分也作为一个子字符串返回.这对于处理那些格式化的表格数据(每一行的列数相同但是单元格数据可能为空)是比较有好处的,比如使用 tab或者逗号作为分割符的情况.
wxStringTokenizer的行为还受最后一个参数的影响,相关的描述如下:
* wxTOKEN_DEFAULT: 如前所述的默认处理方式; 如果分割符为空白字符则等同于wxTOKEN_STRTOK,否则等同于wxTOKEN_RET_EMPTY.
* wxTOKEN_RET_EMPTY: 在这种模式,空白部分将作为一个子字符串部分被返回,例如"a::b:"如果用":"分割则返回三个子字符串a, ""和b.
* wxTOKEN_RET_EMPTY_ALL: 在这种模式下,最后的空白部分也将作为一个子字符串返回. 这样"a::b:"使用":"分割将返回四个子字符串,其三个和wxTOKEN_RET_EMPTY返回的相同,最后一个则为一个"".
* wxTOKEN_RET_DELIMS: 在这种模式下,分割符也作为子字符串的一部分(除了最后一个子字符串,它是没有分割符的),其它方面类似wxTOKEN_RET_EMPTY.
* wxTOKEN_STRTOK: 这种情况下,子字符串的产生结果和标准strtok函数完全相同.空白字符串将不作为一个子字符串.
wxStringTokenizer还有下面两个有用的成员函数:
* CountTokens函数返回分割完的子字符串的数目.
* GetPosition返回某个位置的子字符串.
wxRegEx
wxRegEx类用来实现正则表达式.这个类支持的操作包括正则表达式查找和替换.其实现方式有基于系统正则表达式库(比如现代的类 Unix系统以及Mac OSX支持的POSIX标准正则表达式库)或者基于由Henry Spencer提供的wxWidgets内建库.POSIX定义的正则表达式有基础和扩展两套版本.内建的版本支持这两种模式而基于系统库的版本则不支持扩展模式.
即使是对于那些支持正则表达式库的系统,wxWidgets默认的Unicode版本也采用了内建的正则表达式版本,ANSI版本则使用系统提供的版本.记住只有内建版本的正则表达式库才能完全支持Unicode.当编译wxWidgets的时候,覆盖这种默认设置是被允许的.如果在使用系统正则表达式库的Unicode版本中,在使用对应函数的之前,表达式和要匹配的数据都将被转换成8-bit编码的Unicode方式.
使用wxRegEx的方法和其它所有使用正则表达式的方法没有区别.因为正则表达式的内容较为罗嗦而且又鉴于正则表达式的只在特定情况下使用,请参考wxWidgets手册中的相关内容了解具体的API.
- 第一章 介绍
- 1.1 为什么要使用wxWidgets?
- 1.2 wxWidgets的历史
- 1.3 wxWidgets社区
- 1.4 wxWidgets和面向对象编程
- 1.5 wxWidgets的体系结构
- 1.6 许可协议
- 第一章小结
- 第二章 开始使用
- 2.1 一个小例子
- 2.2 应用程序类
- 2.3 Frame窗口类
- 2.4 事件处理函数
- 2.5 Frame窗口的构造函数
- 2.6 完整的例子
- 2.7 wxWidgets程序一般执行过程
- 2.8 编译和运行程序
- 第二章小结
- 第三章 事件处理
- 3.1 事件驱动编程
- 3.2 事件表和事件处理过程
- 3.3 过滤某个事件
- 3.4 挂载事件表
- 3.5 动态事件处理方法
- 3.6 窗口标识符
- 3.7 自定义事件
- 第三章小结
- 第四章 窗口的基础知识
- 4.1 窗口解析
- 4.2 窗口类概览
- 4.3 基础窗口类
- 4.4 顶层窗口
- 4.5 容器窗口
- 4.6 非静态控件
- 4.7 静态控件
- 4.8 菜单
- 4.9 控制条
- 第四章小结
- 第五章绘画和打印
- 5.1 理解设备上下文
- 5.2 绘画工具
- 5.3 设备上下文中的绘画函数
- 5.4 使用打印框架
- 5.5 使用wxGLCanvas绘制三维图形
- 第五章小节
- 第六章处理用户输入
- 6.1 鼠标输入
- 6.2 处理键盘事件
- 6.3 处理游戏手柄事件
- 第六章小结
- 第七章使用布局控件进行窗口布局
- 7.1 窗口布局基础
- 7.2 窗口布局控件
- 7.3 使用布局控件进行编程
- 7.4 更多关于布局的话题
- 第七章小结
- 第八章使用标准对话框
- 8.1信息对话框
- 8.2 文件和目录对话框
- 8.3 选择和选项对话框
- 8.4 输入对话框
- 8.5 打印对话框
- 第八章小结
- 第九章创建定制的对话框
- 9.1 创建定制对话框的步骤
- 9.2 一个例子:PersonalRecordDialog
- 9.3 在小型设备上调整你的对话框
- 9.4 一些更深入的话题
- 9.5 使用wxWidgets资源文件
- 第九章小结
- 第十章使用图像编程
- 10.1 wxWidgets中图片相关的类
- 10.2 使用wxBitmap编程
- 10.3 使用wxIcon编程
- 10.4 使用wxCursor编程
- 10.5 使用wxImage编程
- 10.6 图片列表和图标集
- 10.7 自定义wxWidgets提供的小图片
- 第十章小结
- 第十一章剪贴板和拖放操作
- 11.1 数据对象
- 11.2 使用剪贴板
- 11.3 实现拖放操作
- 第十一章小结
- 第十二章高级窗口控件
- 12.1 wxTreeCtrl
- 12.2 wxListCtrl
- 12.3 wxWizard
- 12.4 wxHtmlWindow
- 12.5 wxGrid
- 12.6 wxTaskBarIcon
- 12.7 编写自定义的控件
- 第十二章小结
- 第十三章数据结构类
- 13.1 为什么没有使用STL?
- 13.2 字符串类型
- 13.3 wxArray
- 13.4 wxList和wxNode
- 13.5 wxHashMap
- 13.6 存储和使用日期和时间
- 13.7 其它常用的数据类型
- 第十三章小结
- 第十四章文件和流操作
- 14.1 文件类和函数
- 14.2 流操作相关类
- 第十四章小结
- 第十五章内存管理,调试和错误处理
- 15.1 内存管理基础
- 15.2 检测内存泄漏和其它错误
- 15.3 构建自防御的程序
- 15.4 错误报告
- 15.5 提供运行期类型信息
- 15.6 使用wxModule
- 15.7 加载动态链接库
- 15.8 异常处理
- 15.9 调试提示
- 第十五章小结
- 第十六章编写国际化程序
- 16.1 国际化介绍
- 16.2 从翻译说起
- 16.3 字符编码和Unicode
- 16.4 数字和日期
- 16.5 其它媒介
- 16.6 一个小例子
- 第十六章小结
- 第十七章编写多线程程序
- 17.1 什么时候使用多线程,什么时候不要使用
- 17.2 使用wxThread
- 17.3 用于线程同步的对象
- 17.4 多线程的替代方案
- 第十七章小结
- 第十八章使用wxSocket编程
- 18.1 Socket类和功能概览
- 18.2 Socket及其基本处理介绍
- 18.3 Socket标记
- 18.4 使用Socket流
- 18.5 替代wxSocket
- 第十八章小结
- 第十九章使用文档/视图框架
- 19.1 文档/视图基础
- 19.2 文档/视图框架的其它能力
- 19.3 实现Undo/Redo的策略
- 第十九章小结
- 第二十章完善你的应用程序
- 20.1 单个实例和多个实例
- 20.2 更改事件处理机制
- 20.3 降低闪烁
- 20.4 实现联机帮助
- 20.5 解析命令行参数
- 20.6 存储应用程序资源
- 20.7 调用别的应用程序
- 20.8 管理应用程序设置
- 20.9 应用程序安装
- 20.10 遵循用户界面设计规范
- 20.11 全书小结