9.4. 字符串函数和操作符 · PostgreSQL 中文文档 9.3

# 9.4\. 字符串函数和操作符本节描述了用于检查和操作字符串数值的函数和操作符。在这个环境中的字符串包括`character`,`character varying`, `text`类型的值。除非另外说明，所有下面列出的函数都可以处理这些类型，不过要小心的是，在使用`character`类型的时候，需要注意自动填充的潜在影响。有些函数还可以处理位串类型。 SQL定义了一些字符串函数，用特定的关键字而不是逗号来分隔参数。详情请见[Table 9-5](#calibre_link-1044)。PostgreSQL 也提供了使用正常的函数调用语法实现的这些函数的版本(参阅 [Table 9-6](#calibre_link-2069))。 > **Note:** 在PostgreSQL 8.3之前，这些函数将默默接受一些非字符串数据类型的值，由于存在从这些数据类型到`text` 的隐式强制转换，转换后的它们经常发生意外的行为，因此删除了隐式强制转换。然而，字符串连接操作符(`||`)仍接受非字符串输入，只要至少有一个输入是字符串类型，如[Table 9-5](#calibre_link-1044)所示。对于其它情况下，如果你需要重复以前的行为，插入一个明确的强制转换到`text`。 **Table 9-5\. SQL 字符串函数和操作符** | 函数 | 返回类型 | 描述 | 示例 | 结果 | | --- | --- | --- | --- | --- | | `string` `||` `string` | `text` | 字符串连接 | `'Post' || 'greSQL'` | `PostgreSQL` | | `string` `||` `non-string` 或 `non-string` `||` `string` | `text` | 带有一个非字符串输入的字符串连接 | `'Value: ' || 42` | `Value: 42` | | ``bit_length(```string`) | `int` | 字符串的位 | `bit_length('jose')` | `32` | | ``char_length(```string`) 或 ``character_length(```string`) | `int` | 字符串中的字符个数 | `char_length('jose')` | `4` | | ``lower(```string`) | `text` | 把字符串转化为小写 | `lower('TOM')` | `tom` | | ``octet_length(```string`) | `int` | 字符串中的字节数 | `octet_length('jose')` | `4` | | ``overlay(```string` placing `string` from `int` [for `int`]) | `text` | 替换子字符串 | `overlay('Txxxxas' placing 'hom' from 2 for 4)` | `Thomas` | | ``position(```substring` in `string`) | `int` | 指定子字符串的位置 | `position('om' in 'Thomas')` | `3` | | ``substring(```string` [from `int`] [for `int`]) | `text` | 截取子字符串 | `substring('Thomas' from 2 for 3)` | `hom` | | ``substring(```string` from `_pattern_`) | `text` | 截取匹配POSIX正则表达式的子字符串。参阅[Section 9.7](#calibre_link-1400) 获取更多关于模式匹配的信息。 | `substring('Thomas' from '...$')` | `mas` | | ``substring(```string` from `_pattern_` for `_escape_`) | `text` | 截取匹配SQL正则表达式的子字符串。参阅[Section 9.7](#calibre_link-1400)获取更多关于模式匹配的信息。 | `substring('Thomas' from '%#"o_a#"_' for '#')` | `oma` | | ``trim([leading | trailing | both] [```characters`] from `string`) | `text` | 从字符串`string`的开头/结尾/两边删除只包含 `characters`中字符 (缺省是空白)的最长的字符串 | `trim(both 'x' from 'xTomxx')` | `Tom` | | ``upper(```string`) | `text` | 把字符串转化为大写 | `upper('tom')` | `TOM` | 还有额外的字符串操作函数可以用，它们在[Table 9-6](#calibre_link-2069)列出。它们有些在内部用于实现[Table 9-5](#calibre_link-1044) 列出的SQL标准字符串函数。 **Table 9-6\. 其它字符串函数** | 函数 | 返回类型 | 描述 | 示例 | 结果 | | --- | --- | --- | --- | --- | | ``ascii(```string`) | `int` | 参数中第一个字符的ASCII编码值。对于UTF8返回字符的宽字节编码值。对于其它的多字节编码，参数必须是一个ASCII字符。 | `ascii('x')` | `120` | | ``btrim(```string` `text` [, `characters` `text`]) | `text` | 从`string`开头和结尾删除只包含 `characters`中字符(缺省是空白)的最长字符串。 | `btrim('xyxtrimyyx', 'xy')` | `trim` | | ``chr(```int`) | `text` | 给定编码的字符。对于UTF8这个参数作为宽字节代码处理。对于其它的多字节编码，这个参数必须指定一个ASCII字符，因为text数据类型无法存储NULL数据字节，不能将NULL(0)作为字符参数。 | `chr(65)` | `A` | | ``concat(```str` `"any"` [, `str` `"any"` [, ...] ]) | `text` | 连接所有参数的文本表示。NULL 参数被忽略。 | `concat('abcde', 2, NULL, 22)` | `abcde222` | | ``concat_ws(```sep` `text`, `str` `"any"` [, `str` `"any"` [, ...] ]) | `text` | 连接所有参数，但是第一个参数是分隔符，用于将所有参数分隔。NULL 参数被忽略。 | `concat_ws(',', 'abcde', 2, NULL, 22)` | `abcde,2,22` | | ``convert(```string` `bytea`, `src_encoding` `name`, `dest_encoding` `name`) | `bytea` | 把原来编码为`src_encoding`的字符串转换为 `dest_encoding`编码。在这种编码格式中`string`必须是有效的。用`CREATE CONVERSION`定义转换。这也有些预定义的转换。参阅[Table 9-7](#calibre_link-2070)显示可用的转换。 | `convert('text_in_utf8', 'UTF8', 'LATIN1')` | `text_in_utf8` 用 Latin-1 编码表示 (ISO 8859-1) | | ``convert_from(```string` `bytea`, `src_encoding` `name`) | `text` | 把原来编码为`src_encoding`的字符串转换为数据库编码格式。这种编码格式中，`string`必须是有效的。 | `convert_from('text_in_utf8', 'UTF8')` | `text_in_utf8` 用当前数据库编码表示 | | ``convert_to(```string` `text`, `dest_encoding` `name`) | `bytea` | 将字符串转化为`dest_encoding`编码格式。 | `convert_to('some text', 'UTF8')` | `some text` 用 UTF8 编码表示 | | ``decode(```string` `text`, `format` `text`) | `bytea` | 把用`string`表示的文本里面的二进制数据解码。 `format`选项和`encode`相同。 | `decode('MTIzAAE=', 'base64')` | `\x3132330001` | | ``encode(```data` `bytea`, `format` `text`) | `text` | 把二进制数据编码为文本表示。支持的格式有：`base64`, `hex`, `escape`。`escape` 转换零字节和高位设置字节为八进制序列(`\``_nnn_`) 和双反斜杠。 | `encode(E'123\\000\\001', 'base64')` | `MTIzAAE=` | | ``format`(``formatstr` `text` [, `formatarg` `"any"` [, ...] ]) | `text` | 根据格式字符串格式参数。这个函数类似C函数`sprintf`。参阅[Section 9.4.1](#calibre_link-1813)。 | `format('Hello %s, %1$s', 'World')` | `Hello World, World` | | ``initcap(```string`) | `text` | 把每个单词的第一个字母转为大写，其它的保留小写。单词是一系列字母数字组成的字符，用非字母数字分隔。 | `initcap('hi THOMAS')` | `Hi Thomas` | | ``left(```str` `text`, `n` `int`) | `text` | 返回字符串的前`_n_`个字符。当`_n_`是负数时，返回除最后|`_n_`|个字符以外的所有字符。 | `left('abcde', 2)` | `ab` | | ``length(```string`) | `int` | `string`中字符的数目 | `length('jose')` | `4` | | ``length(```string` `bytea`, `encoding` `name` ) | `int` | 指定`encoding`编码格式的`string`的字符数。在这个编码格式中，`string`必须是有效的。 | `length('jose', 'UTF8')` | `4` | | ``lpad(```string` `text`, `length` `int` [, `fill` `text`]) | `text` | 通过填充字符`fill`(缺省时为空白)，把`string`填充为`length`长度。如果`string`已经比`length`长则将其尾部截断。 | `lpad('hi', 5, 'xy')` | `xyxhi` | | ``ltrim(```string` `text` [, `characters` `text`]) | `text` | 从字符串`string`的开头删除只包含`characters` 中字符(缺省是一个空白)的最长的字符串。 | `ltrim('zzzytrim', 'xyz')` | `trim` | | ``md5(```string`) | `text` | 计算`string`的MD5散列，以十六进制返回结果。 | `md5('abc')` | `900150983cd24fb0 d6963f7d28e17f72` | | ``pg_client_encoding()`` | `name` | 当前客户端编码名称 | `pg_client_encoding()` | `SQL_ASCII` | | ``quote_ident(```string` `text`) | `text` | 返回适用于SQL语句的标识符形式(使用适当的引号进行界定)。只有在必要的时候才会添加引号(字符串包含非标识符字符或者会转换大小写的字符)。嵌入的引号被恰当地写了双份。又见[Example 40-1](#calibre_link-1702)。 | `quote_ident('Foo bar')` | `"Foo bar"` | | ``quote_literal(```string` `text`) | `text` | 返回适用于在SQL语句里当作文本使用的形式(使用适当的引号进行界定)。嵌入的引号和反斜杠被恰当地写了双份。请注意，当输入是null时， `quote_literal`返回null；如果参数可能为null，通常`quote_nullable`更适用。又见[Example 40-1](#calibre_link-1702)。 | `quote_literal(E'O\'Reilly')` | `'O''Reilly'` | | ``quote_literal(```value` `anyelement`) | `text` | 将给定的值强制转换为text，加上引号作为文本。嵌入的引号和反斜杠被恰当地写了双份。 | `quote_literal(42.5)` | `'42.5'` | | ``quote_nullable(```string` `text`) | `text` | 返回适用于在SQL语句里当作字符串使用的形式(使用适当的引号进行界定)。或者，如果参数为空，返回`NULL`。嵌入的引号和反斜杠被恰当地写了双份。又见[Example 40-1](#calibre_link-1702)。 | `quote_nullable(NULL)` | `NULL` | | ``quote_nullable(```value` `anyelement`) | `text` | 将给定的参数值转化为text，加上引号作为文本；或者，如果参数为空，返回`NULL`。嵌入的引号和反斜杠被恰当地写了双份。 | `quote_nullable(42.5)` | `'42.5'` | | ``regexp_matches(```string` `text`, `pattern` `text` [, `flags` `text`]) | `setof text[]` | 返回`string`中所有匹配POSIX正则表达式的子字符串。参阅[Section 9.7.3](#calibre_link-1066)获得更多信息。 | `regexp_matches('foobarbequebaz', '(bar)(beque)')` | `{bar,beque}` | | ``regexp_replace(```string` `text`, `pattern` `text`, `replacement` `text` [, `flags` `text`]) | `text` | 替换匹配 POSIX 正则表达式的子字符串。参见[Section 9.7.3](#calibre_link-1066) 以获取更多模式匹配的信息。 | `regexp_replace('Thomas', '.[mN]a.', 'M')` | `ThM` | | ``regexp_split_to_array(```string` `text`, `pattern` `text` [, `flags` `text` ]) | `text[]` | 用POSIX正则表达式作为分隔符，分隔`string`。参阅[Section 9.7.3](#calibre_link-1066)以获取更多模式匹配的信息。 | `regexp_split_to_array('hello world', E'\\s+')` | `{hello,world}` | | ``regexp_split_to_table(```string` `text`, `pattern` `text` [, `flags` `text`]) | `setof text` | 用POSIX正则表达式作为分隔符，分隔`string`。参阅[Section 9.7.3](#calibre_link-1066)以获取更多模式匹配的信息。 | `regexp_split_to_table('hello world', E'\\s+')` | `hello` `world` (2 rows) | | ``repeat(```string` `text`, `number` `int`) | `text` | 将`string`重复`number`次 | `repeat('Pg', 4)` | `PgPgPgPg` | | ``replace(```string` `text`, `from` `text`, `to` `text`) | `text` | 把字符串`string`里出现地所有子字符串`from` 替换成子字符串`to` | `replace('abcdefabcdef', 'cd', 'XX')` | `abXXefabXXef` | | ``reverse(```str`) | `text` | 返回颠倒的字符串 | `reverse('abcde')` | `edcba` | | ``right(```str` `text`, `n` `int`) | `text` | 返回字符串中的后`_n_`个字符。当`_n_`是负值时，返回除前|`_n_`|个字符以外的所有字符。 | `right('abcde', 2)` | `de` | | ``rpad(```string` `text`, `length` `int` [, `fill` `text`]) | `text` | 使用填充字符`fill`(缺省时为空白)，把`string`填充到`length`长度。如果`string`已经比`length`长则将其从尾部截断。 | `rpad('hi', 5, 'xy')` | `hixyx` | | ``rtrim(```string` `text` [, `characters` `text`]) | `text` | 从字符串`string`的结尾删除只包含 `characters`中字符(缺省是个空白)的最长的字符串。 | `rtrim('trimxxxx', 'x')` | `trim` | | ``split_part(```string` `text`, `delimiter` `text`, `field` `int`) | `text` | 根据`delimiter`分隔`string` 返回生成的第 field 个子字符串(1为基)。 | `split_part('abc~@~def~@~ghi', '~@~', 2)` | `def` | | ``strpos(```string`, `substring`) | `int` | 指定的子字符串的位置。和`position(``substring` in `string`)一样，不过参数顺序相反。 | `strpos('high', 'ig')` | `2` | | ``substr(```string`, `from` [, `count`]) | `text` | 抽取子字符串。和`substring(``string` from `from` for `count`))一样 | `substr('alphabet', 3, 2)` | `ph` | | ``to_ascii(```string` `text` [, `encoding` `text`]) | `text` | 把`string`从其它编码转换为ASCII (仅支持`LATIN1`, `LATIN2`, `LATIN9`, `WIN1250`编码)。 | `to_ascii('Karel')` | `Karel` | | ``to_hex(```number` `int` or `bigint`) | `text` | 把`number`转换成十六进制表现形式 | `to_hex(2147483647)` | `7fffffff` | | ``translate(```string` `text`, `from` `text`, `to` `text`) | `text` | 把在`string`中包含的任何匹配`from` 中字符的字符转化为对应的在`to`中的字符。如果`from`比`to`长，删掉在`from`中出现的额外的字符。 | `translate('12345', '143', 'ax')` | `a2x5` | `concat`, `concat_ws`和`format` 函数是可变的，所以用`VARIADIC` 关键字标记传递的数值以连接或者格式化为一个数组是可能的。见[Section 35.4.5](#calibre_link-914)。数组的元素对函数来说是单独的普通参数。如果可变数组的元素是NULL，那么`concat`和`concat_ws` 返回NULL，但是`format`把NULL作为零元素数组对待。又见[Section 9.20](#calibre_link-1641)里面的聚集函数`string_agg`。 **Table 9-7\. 内置的转换** | 转换名 [[a]](#calibre_link-2071) | 源编码 | 目的编码 | | --- | --- | --- | | `ascii_to_mic` | `SQL_ASCII` | `MULE_INTERNAL` | | `ascii_to_utf8` | `SQL_ASCII` | `UTF8` | | `big5_to_euc_tw` | `BIG5` | `EUC_TW` | | `big5_to_mic` | `BIG5` | `MULE_INTERNAL` | | `big5_to_utf8` | `BIG5` | `UTF8` | | `euc_cn_to_mic` | `EUC_CN` | `MULE_INTERNAL` | | `euc_cn_to_utf8` | `EUC_CN` | `UTF8` | | `euc_jp_to_mic` | `EUC_JP` | `MULE_INTERNAL` | | `euc_jp_to_sjis` | `EUC_JP` | `SJIS` | | `euc_jp_to_utf8` | `EUC_JP` | `UTF8` | | `euc_kr_to_mic` | `EUC_KR` | `MULE_INTERNAL` | | `euc_kr_to_utf8` | `EUC_KR` | `UTF8` | | `euc_tw_to_big5` | `EUC_TW` | `BIG5` | | `euc_tw_to_mic` | `EUC_TW` | `MULE_INTERNAL` | | `euc_tw_to_utf8` | `EUC_TW` | `UTF8` | | `gb18030_to_utf8` | `GB18030` | `UTF8` | | `gbk_to_utf8` | `GBK` | `UTF8` | | `iso_8859_10_to_utf8` | `LATIN6` | `UTF8` | | `iso_8859_13_to_utf8` | `LATIN7` | `UTF8` | | `iso_8859_14_to_utf8` | `LATIN8` | `UTF8` | | `iso_8859_15_to_utf8` | `LATIN9` | `UTF8` | | `iso_8859_16_to_utf8` | `LATIN10` | `UTF8` | | `iso_8859_1_to_mic` | `LATIN1` | `MULE_INTERNAL` | | `iso_8859_1_to_utf8` | `LATIN1` | `UTF8` | | `iso_8859_2_to_mic` | `LATIN2` | `MULE_INTERNAL` | | `iso_8859_2_to_utf8` | `LATIN2` | `UTF8` | | `iso_8859_2_to_windows_1250` | `LATIN2` | `WIN1250` | | `iso_8859_3_to_mic` | `LATIN3` | `MULE_INTERNAL` | | `iso_8859_3_to_utf8` | `LATIN3` | `UTF8` | | `iso_8859_4_to_mic` | `LATIN4` | `MULE_INTERNAL` | | `iso_8859_4_to_utf8` | `LATIN4` | `UTF8` | | `iso_8859_5_to_koi8_r` | `ISO_8859_5` | `KOI8R` | | `iso_8859_5_to_mic` | `ISO_8859_5` | `MULE_INTERNAL` | | `iso_8859_5_to_utf8` | `ISO_8859_5` | `UTF8` | | `iso_8859_5_to_windows_1251` | `ISO_8859_5` | `WIN1251` | | `iso_8859_5_to_windows_866` | `ISO_8859_5` | `WIN866` | | `iso_8859_6_to_utf8` | `ISO_8859_6` | `UTF8` | | `iso_8859_7_to_utf8` | `ISO_8859_7` | `UTF8` | | `iso_8859_8_to_utf8` | `ISO_8859_8` | `UTF8` | | `iso_8859_9_to_utf8` | `LATIN5` | `UTF8` | | `johab_to_utf8` | `JOHAB` | `UTF8` | | `koi8_r_to_iso_8859_5` | `KOI8R` | `ISO_8859_5` | | `koi8_r_to_mic` | `KOI8R` | `MULE_INTERNAL` | | `koi8_r_to_utf8` | `KOI8R` | `UTF8` | | `koi8_r_to_windows_1251` | `KOI8R` | `WIN1251` | | `koi8_r_to_windows_866` | `KOI8R` | `WIN866` | | `koi8_u_to_utf8` | `KOI8U` | `UTF8` | | `mic_to_ascii` | `MULE_INTERNAL` | `SQL_ASCII` | | `mic_to_big5` | `MULE_INTERNAL` | `BIG5` | | `mic_to_euc_cn` | `MULE_INTERNAL` | `EUC_CN` | | `mic_to_euc_jp` | `MULE_INTERNAL` | `EUC_JP` | | `mic_to_euc_kr` | `MULE_INTERNAL` | `EUC_KR` | | `mic_to_euc_tw` | `MULE_INTERNAL` | `EUC_TW` | | `mic_to_iso_8859_1` | `MULE_INTERNAL` | `LATIN1` | | `mic_to_iso_8859_2` | `MULE_INTERNAL` | `LATIN2` | | `mic_to_iso_8859_3` | `MULE_INTERNAL` | `LATIN3` | | `mic_to_iso_8859_4` | `MULE_INTERNAL` | `LATIN4` | | `mic_to_iso_8859_5` | `MULE_INTERNAL` | `ISO_8859_5` | | `mic_to_koi8_r` | `MULE_INTERNAL` | `KOI8R` | | `mic_to_sjis` | `MULE_INTERNAL` | `SJIS` | | `mic_to_windows_1250` | `MULE_INTERNAL` | `WIN1250` | | `mic_to_windows_1251` | `MULE_INTERNAL` | `WIN1251` | | `mic_to_windows_866` | `MULE_INTERNAL` | `WIN866` | | `sjis_to_euc_jp` | `SJIS` | `EUC_JP` | | `sjis_to_mic` | `SJIS` | `MULE_INTERNAL` | | `sjis_to_utf8` | `SJIS` | `UTF8` | | `tcvn_to_utf8` | `WIN1258` | `UTF8` | | `uhc_to_utf8` | `UHC` | `UTF8` | | `utf8_to_ascii` | `UTF8` | `SQL_ASCII` | | `utf8_to_big5` | `UTF8` | `BIG5` | | `utf8_to_euc_cn` | `UTF8` | `EUC_CN` | | `utf8_to_euc_jp` | `UTF8` | `EUC_JP` | | `utf8_to_euc_kr` | `UTF8` | `EUC_KR` | | `utf8_to_euc_tw` | `UTF8` | `EUC_TW` | | `utf8_to_gb18030` | `UTF8` | `GB18030` | | `utf8_to_gbk` | `UTF8` | `GBK` | | `utf8_to_iso_8859_1` | `UTF8` | `LATIN1` | | `utf8_to_iso_8859_10` | `UTF8` | `LATIN6` | | `utf8_to_iso_8859_13` | `UTF8` | `LATIN7` | | `utf8_to_iso_8859_14` | `UTF8` | `LATIN8` | | `utf8_to_iso_8859_15` | `UTF8` | `LATIN9` | | `utf8_to_iso_8859_16` | `UTF8` | `LATIN10` | | `utf8_to_iso_8859_2` | `UTF8` | `LATIN2` | | `utf8_to_iso_8859_3` | `UTF8` | `LATIN3` | | `utf8_to_iso_8859_4` | `UTF8` | `LATIN4` | | `utf8_to_iso_8859_5` | `UTF8` | `ISO_8859_5` | | `utf8_to_iso_8859_6` | `UTF8` | `ISO_8859_6` | | `utf8_to_iso_8859_7` | `UTF8` | `ISO_8859_7` | | `utf8_to_iso_8859_8` | `UTF8` | `ISO_8859_8` | | `utf8_to_iso_8859_9` | `UTF8` | `LATIN5` | | `utf8_to_johab` | `UTF8` | `JOHAB` | | `utf8_to_koi8_r` | `UTF8` | `KOI8R` | | `utf8_to_koi8_u` | `UTF8` | `KOI8U` | | `utf8_to_sjis` | `UTF8` | `SJIS` | | `utf8_to_tcvn` | `UTF8` | `WIN1258` | | `utf8_to_uhc` | `UTF8` | `UHC` | | `utf8_to_windows_1250` | `UTF8` | `WIN1250` | | `utf8_to_windows_1251` | `UTF8` | `WIN1251` | | `utf8_to_windows_1252` | `UTF8` | `WIN1252` | | `utf8_to_windows_1253` | `UTF8` | `WIN1253` | | `utf8_to_windows_1254` | `UTF8` | `WIN1254` | | `utf8_to_windows_1255` | `UTF8` | `WIN1255` | | `utf8_to_windows_1256` | `UTF8` | `WIN1256` | | `utf8_to_windows_1257` | `UTF8` | `WIN1257` | | `utf8_to_windows_866` | `UTF8` | `WIN866` | | `utf8_to_windows_874` | `UTF8` | `WIN874` | | `windows_1250_to_iso_8859_2` | `WIN1250` | `LATIN2` | | `windows_1250_to_mic` | `WIN1250` | `MULE_INTERNAL` | | `windows_1250_to_utf8` | `WIN1250` | `UTF8` | | `windows_1251_to_iso_8859_5` | `WIN1251` | `ISO_8859_5` | | `windows_1251_to_koi8_r` | `WIN1251` | `KOI8R` | | `windows_1251_to_mic` | `WIN1251` | `MULE_INTERNAL` | | `windows_1251_to_utf8` | `WIN1251` | `UTF8` | | `windows_1251_to_windows_866` | `WIN1251` | `WIN866` | | `windows_1252_to_utf8` | `WIN1252` | `UTF8` | | `windows_1256_to_utf8` | `WIN1256` | `UTF8` | | `windows_866_to_iso_8859_5` | `WIN866` | `ISO_8859_5` | | `windows_866_to_koi8_r` | `WIN866` | `KOI8R` | | `windows_866_to_mic` | `WIN866` | `MULE_INTERNAL` | | `windows_866_to_utf8` | `WIN866` | `UTF8` | | `windows_866_to_windows_1251` | `WIN866` | `WIN` | | `windows_874_to_utf8` | `WIN874` | `UTF8` | | `euc_jis_2004_to_utf8` | `EUC_JIS_2004` | `UTF8` | | `utf8_to_euc_jis_2004` | `UTF8` | `EUC_JIS_2004` | | `shift_jis_2004_to_utf8` | `SHIFT_JIS_2004` | `UTF8` | | `utf8_to_shift_jis_2004` | `UTF8` | `SHIFT_JIS_2004` | | `euc_jis_2004_to_shift_jis_2004` | `EUC_JIS_2004` | `SHIFT_JIS_2004` | | `shift_jis_2004_to_euc_jis_2004` | `SHIFT_JIS_2004` | `EUC_JIS_2004` | | Notes: a. 转换名遵循一个标准的命名模式：将源编码中的所有非字母数字字符用下划线替换，后面跟着`_to_`，然后后面再跟着经过相似处理的目标编码的名字。因此这些名字可能和客户的编码名字不同。 | ## 9.4.1\. `格式化` 函数`format`生成根据格式字符串格式化了的输出，风格类似于C函数`sprintf`。 ``` format(formatstr text [, formatarg "any" [, ...] ]) ``` `_formatstr_`是指定结果如何格式化的格式字符串。格式字符串中的文本直接拷贝到结果中，除非已经使用了_格式说明符_。格式说明符在字符串中作为占位符使用，定义后续函数参数应该格式化并且插入到结果中。每个`_formatarg_` 参数根据这种数据类型的通常输出规则转化为文本，然后根据格式说明符格式化并且插入到结果中。格式说明符由`%`字符引进，格式为 ``` %[_position_][_flags_][_width_]_type_ ``` 组件的字段有： `_position_` (optional) `_n_`$格式的字符串，这里的`_n_` 是要打印的参数的索引。索引为1表示在`_formatstr_` 之后的第一个参数。如果省略了`_formatstr_`，默认使用序列中的下一个参数。 `_flags_` (optional) 附加选项，控制如何格式化格式说明符的输出。当前只支持负号(`-`)，负号导致格式说明符的输出是左对齐的。这是没有影响的，除非指定了 `_width_`字段。 `_width_` (optional) 声明字符数的_minimum_值用来显示格式说明符的输出。需要补充宽度时，空白添加到输出的左侧或右侧（取决于`-`标志）。一个比较小的宽度不会导致输出的截断，只是简单的忽略了。宽度可以用下列方法指定：一个正整数；一个星号(`*`) 表示使用下一个函数参数作为宽度；或一个格式为`*``_n_`$ 的字符串表示使用第`_n_`个函数参数作为宽度。如果宽度来自函数参数，那么这个参数在作为格式说明符的数值之前消耗掉。如果宽度参数是负的，那么结果是左对齐的（就像声明了`-`标志一样），并且字段长度为`abs`(`_width_`)。 `_type_` (required) 格式转换的类型用来产生格式说明符的输出。支持下列的类型： * `s`格式参数值为简单的字符串。空值作为空字符串对待。 * `I`将参数值作为SQL标识符对待，如果需要，双写它。值为空是错误的。 * `L`引用参数值作为SQL文字。空值用字符串`NULL`显示，没有引用。除了上述的格式说明符，特殊的序列`%%`可以用作输出`%`字符。这里有一些基本的格式转换的例子： ``` SELECT format('Hello %s', 'World'); _Result:_ <samp class="literal">Hello World</samp> SELECT format('Testing %s, %s, %s, %%', 'one', 'two', 'three'); _Result:_ <samp class="literal">Testing one, two, three, %</samp> SELECT format('INSERT INTO %I VALUES(%L)', 'Foo bar', E'O\'Reilly'); _Result:_ <samp class="literal">INSERT INTO "Foo bar" VALUES('O''Reilly')</samp> SELECT format('INSERT INTO %I VALUES(%L)', 'locations', E'C:\\Program Files'); _Result:_ <samp class="literal">INSERT INTO locations VALUES(E'C:\\Program Files')</samp> ``` 这里是使用`_width_`字段和`-`标志的例子： ``` SELECT format('|%10s|', 'foo'); _Result:_ <samp class="literal">| foo|</samp> SELECT format('|%-10s|', 'foo'); _Result:_ <samp class="literal">|foo |</samp> SELECT format('|%*s|', 10, 'foo'); _Result:_ <samp class="literal">| foo|</samp> SELECT format('|%*s|', -10, 'foo'); _Result:_ <samp class="literal">|foo |</samp> SELECT format('|%-*s|', 10, 'foo'); _Result:_ <samp class="literal">|foo |</samp> SELECT format('|%-*s|', -10, 'foo'); _Result:_ <samp class="literal">|foo |</samp> ``` 下面是使用`_position_`字段的例子： ``` SELECT format('Testing %3$s, %2$s, %1$s', 'one', 'two', 'three'); _Result:_ <samp class="literal">Testing three, two, one</samp> SELECT format('|%*2$s|', 'foo', 10, 'bar'); _Result:_ <samp class="literal">| bar|</samp> SELECT format('|%1$*2$s|', 'foo', 10, 'bar'); _Result:_ <samp class="literal">| foo|</samp> ``` 和C函数`sprintf`不同，PostgreSQL的`format` 函数允许带有或不带有`_position_`字段的格式说明符在相同的格式字符串中混合使用。没有`_position_`字段的格式说明符总是使用最后消耗参数的下一个参数。另外，`format`函数不要求在格式字符串中使用所有函数参数。例如： ``` SELECT format('Testing %3$s, %2$s, %s', 'one', 'two', 'three'); _Result:_ <samp class="literal">Testing three, two, three</samp> ``` `%I`和`%L`格式说明符对于安全构造动态SQL语句尤其有用。参阅[Example 40-1](#calibre_link-1702)。