#### strlen()函数和mb_strlen()函数
在PHP中,函数strlen()返回字符串的长度。函数原型如下:
~~~
int strlen(string string_input);
~~~
参数:string_input为要处理的字符串。
strlen()函数返回字符串所占的字节长度,一个英文字母、数字、各种符号均占一个字节,它们的长度均为1。一个中文字符占字节的大小取决于页面编码,所以一个中文字符的长度可能是2也可能是三。
UTF-8的中文字符串是三个字节
~~~
<?php
//编码UTF-8
echo strlen('测试文字a测试文字');
echo '-';
echo mb_strlen('测试文字a测试文字','utf-8');
?>
~~~
输出:25-9
GB2312的中文字符串是二个字节
~~~
<?php
//编码GB2312
echo strlen('测试文字a测试文字');
echo '-';
echo mb_strlen('测试文字a测试文字','Gb2312');
?>
~~~
输出:17-9
~~~
<?php
echo strlen("www.sunchis.com");
echo strlen("三知开发网");
?>
~~~
“echo strlen("www.sunchis.com");”的运行结果:15
“echo strlen("三知开发网");”的运行结果:15
这里有个疑问,一个中文字符不是占2个字节吗?“三知开发网”,明明是五个汉字,运行的结果怎么会是15?
原因出在这里:strlen()计算时,对于一个UTF-8的中文字符,会把它当做长度为3来处理。当出现中英文混排的情况下,怎么准确的计算字符串的长度呢?
这里,得引入另外一个函数mb_strlen()。mb_strlen()函数的用法与strlen()几乎一摸一样,只是多了一个指定字符集编码的参数。函数原型为:
~~~
int mb_strlen(string string_input, string encode);
~~~
PHP内置的字符串长度函数strlen无法正确处理中文字符串,它得到的只是字符串所占的字节数。对于GB2312的中文编码,strlen得到的值是汉字个数的2倍,而对于UTF-8编码的中文,就是3倍的差异了(在UTF-8编码下,一个汉字占3个字节)。 而下面的代码能准确计算出中文字符串的长度:
~~~
<?php
$str = "三知sunchis开发网";
echo strlen($str)."<br>"; //结果:22
echo mb_strlen($str,"UTF8")."<br>"; //结果:12
$strlen = (strlen($str)+mb_strlen($str,"UTF8"))/2;
echo $strlen; //结果:17
?>
~~~
原理分析:
strlen()计算时,对待UTF-8的中文字符长度是3,所以“三知sunchis开发网”的长度为5×3+7×1=22
在mb_strlen计算时,选定内码为UTF8,则会将一个中文字符当作长度1来计算,所以“三知sunchis开发网”长度为5×1+7×1=12
注意:
对于mb_strlen($str,'UTF-8'),如果省略第二个参数,则会使用PHP的内部编码。内部编码可以通过mb_internal_encoding()函数得到。需要注意的是,mb_strlen并不是PHP核心函数,使用前需要确保在php.ini中加载了php_mbstring.dll,即确保“extension=php_mbstring.dll”这一行存在并且没有被注释掉,否则会出现未定义函数的问题。
- 目录
- 数据库表
- 13.7.5.6 SHOW COLUMNS Syntax
- Mysql生成列
- 表注释
- 默认字符集
- 索引
- 外键约束
- 数据类型
- NULL
- 查询语句
- IF
- CASE
- FIND_IN_SET
- 更新语句
- 复制更新
- 截取更新
- 插入语句
- 从一张表查询一个字段值插入另一个表中
- 统计函数
- COUNT
- 分组统计
- 日期时间字段按照日期分组
- GROUP_CONCAT
- 多字段关联
- LENGTH
- mb_strlen()
- SUM
- 按周,按月,按日分组统计数据
- 日期时间
- MySQL日期时间数据类型使用总结
- 计算日期差
- 插入当前日期时间
- 时间比较
- datetime
- 日期时间取时间段
- 统计
- 整型unix时间戳
- 计算两条相邻记录的时间差
- 日期时间-函数
- 常用函数
- CURDATE
- DATEDIFF
- DATE_ADD
- DATE_SUB
- EXTRACT
- NOW
- TO_DAYS
- UNIX_TIMESTAMP
- 作为时间比较
- FROM_UNIXTIME
- DATE_FORMAT
- TIMESTAMPDIFF
- 触发器
- 存储过程
- MySQL存储过程的基本函数
- 分页存储过程
- 存储过程教程
- 临时表
- 备份表
- CRM
- 客户关系表
- 通讯录
- SQL函数
- ISNULL
- IFNULL
- SUBSTR
- 模糊查询
- JSON
- Json函数
- Json数据类型
- 使用Json
- 使用navicat
- 虚拟列
- CRUD
- 索引设计
- 增加多字段索引
- 共享排他锁