mb_strlen() · MySQL SQL

#### strlen()函数和mb_strlen()函数在PHP中，函数strlen()返回字符串的长度。函数原型如下： ~~~ int strlen(string string_input); ~~~ 参数：string_input为要处理的字符串。 strlen()函数返回字符串所占的字节长度，一个英文字母、数字、各种符号均占一个字节，它们的长度均为1。一个中文字符占字节的大小取决于页面编码，所以一个中文字符的长度可能是2也可能是三。 UTF-8的中文字符串是三个字节 ~~~ <?php //编码UTF-8 echo strlen('测试文字a测试文字'); echo '-'; echo mb_strlen('测试文字a测试文字','utf-8'); ?> ~~~ 输出：25-9 GB2312的中文字符串是二个字节 ~~~ <?php //编码GB2312 echo strlen('测试文字a测试文字'); echo '-'; echo mb_strlen('测试文字a测试文字','Gb2312'); ?> ~~~ 输出：17-9 ~~~ <?php echo strlen("www.sunchis.com"); echo strlen("三知开发网"); ?> ~~~ “echo strlen("www.sunchis.com");”的运行结果：15 “echo strlen("三知开发网");”的运行结果：15 这里有个疑问，一个中文字符不是占2个字节吗？“三知开发网”，明明是五个汉字，运行的结果怎么会是15？原因出在这里：strlen()计算时，对于一个UTF-8的中文字符，会把它当做长度为3来处理。当出现中英文混排的情况下，怎么准确的计算字符串的长度呢？这里，得引入另外一个函数mb_strlen()。mb_strlen()函数的用法与strlen()几乎一摸一样，只是多了一个指定字符集编码的参数。函数原型为： ~~~ int mb_strlen(string string_input, string encode); ~~~ PHP内置的字符串长度函数strlen无法正确处理中文字符串，它得到的只是字符串所占的字节数。对于GB2312的中文编码，strlen得到的值是汉字个数的2倍，而对于UTF-8编码的中文，就是3倍的差异了（在UTF-8编码下，一个汉字占3个字节）。而下面的代码能准确计算出中文字符串的长度： ~~~ <?php $str = "三知sunchis开发网"; echo strlen($str)."<br>"; //结果：22 echo mb_strlen($str,"UTF8")."<br>"; //结果：12 $strlen = (strlen($str)+mb_strlen($str,"UTF8"))/2; echo $strlen; //结果：17 ?> ~~~ 原理分析： strlen()计算时，对待UTF-8的中文字符长度是3，所以“三知sunchis开发网”的长度为5×3+7×1=22 在mb_strlen计算时，选定内码为UTF8，则会将一个中文字符当作长度1来计算，所以“三知sunchis开发网”长度为5×1+7×1=12 注意：对于mb_strlen($str,'UTF-8')，如果省略第二个参数，则会使用PHP的内部编码。内部编码可以通过mb_internal_encoding()函数得到。需要注意的是，mb_strlen并不是PHP核心函数，使用前需要确保在php.ini中加载了php_mbstring.dll，即确保“extension=php_mbstring.dll”这一行存在并且没有被注释掉，否则会出现未定义函数的问题。