php字符串截取函数mb_substr用法实例分析

这篇文章主要介绍了php字符串截取函数mb_substr用法,结合实例形式分析了php使用mb_substr针对中文字符串截取与编码控制相关操作技巧,需要的朋友可以参考下。

本文实例讲述了php字符串截取函数mb_substr用法,分享给大家供大家参考,具体如下:

string mb_substr ( string $str , int $start [, int $length = NULL [, string $encoding = mb_internal_encoding() ]] )-截取字符串

(PHP 4 >= 4.0.6, PHP 5)

$str 要获取字符串的目标字符串(字符串起始位置为0)

$start,$str中要使用的第一个字符的位置

$length,获取的子字符串的长度(注意不是结束位置)

$encoding,可指定字符编码(一般用于处理中文字符时使用,同时这个问题碰到的非常多)

示例:

  1. <?php
  2. mb_internal_encoding ("UTF-8"); //如果把UTF-8改为编码,下面针对于中文字符串处理的值会改变。
  3. echo mb_internal_encoding().""; //获取字符编码为ISO-8859-1
  4. echo mb_substr('abcdefghijk',0,9).""; //abcdefghi
  5. echo mb_substr('abcdefghijk',1,5).""; //bcdef
  6. echo mb_substr('我们都是中国人',0,9).""; //我们都是中国人
  7. echo mb_substr('我们都是中国人',0,9,'gb2312').""; //我们都是中
  8. echo mb_substr('我们都是中国人',0,9,'utf-8'); //我们都是中国人
  9. ?>

总结:

1、在处理英文字符串的时候,该函数的第四个参数($encoding)可以忽略。

2、在处理中文字符串的时候,就要小心了,一定要考虑编码问题,编码不同,中文的值也不同。

3、在中文字符串导入数据库时,就显得更为重要了。

4、处理字符串或文本的编码能力,是衡量程序员功力的一项标准。

补充:substr和mb_substr的区别

异同点:

两个函数都是截取字符串的长度,不同的是mb_substr可以针对多字节编码的汉字进行截取,从而防止乱码的出现

实例说明:

示例1:

  1. <?php
  2. $chuan="我是中国人!";
  3. echo substr($chuan,0,3);
  4. echo '<br />';
  5. echo mb_substr($chuan,0,3,'utf8');
  6. ?>

运行结果:

我是中

在utf8编码下,由于一个汉字占3个字节,所以第一个输出的是: 我

第二个输出的是: 我是中

示例2:

  1. <?php
  2. $chuan="我是中国人!";
  3. echo substr($chuan,0,-4);
  4. echo '<br />';
  5. echo mb_substr($chuan,0,-2,'utf8');
  6. ?>

运行结果:

我是中国

我是中国

两个输出的都是: 我是中国

第一个长度为负4,就会省略掉!和人,从零开始,就会包括我是中国

第二个同理