PHP-中英文混合-安全截取-截取等长UFT8中英文混合字串

时鹏亮

13 years ago

请知悉：本文最近一次更新为 13年前，文中内容可能已经过时。

做网页发现有个问题就是截取字符串无论用mb_substr()还是substr()，对中文的支持都不太好，都不能实现登场的截取，经过百度，找到一个博客些的函数能解决此问题，故记录下来以备日后使用。
源码如下：

/*utf8编码时截取等长中英文字串*/ //英文标点[.," !:_']  
<?  
function substr_utf8($string,$start,$length)  
{       //by aiou  
     $chars = $string;  
     //echo $string[0].$string[1].$string[2];  
     $i=0;  
     do{  
        if (preg_match ("/[0-9a-zA-Z]/", $chars[$i])){//纯英文  
            $m++;  
        }  
    else {$n++;     }//非英文字节,  
        $k = $n/3+$m/2;  
        $l = $n/3+$m;//最终截取长度；$l = $n/3+$m*2？  
        $i++;  
    } while($k < $length);  
     $str1 = mb_substr($string,$start,$l,'utf-8');//保证不会出现乱码  
     return $str1;  
}

长度都以汉字数为基准。
基本上每两个英文字母、数字、英文标点算作一个汉字长度。看上去效果还不错。

以上主题部分内容全部来着：http://aiou.iteye.com/blog/371094

如您从本文得到了有价值的信息或帮助，请考虑扫描下方二维码捐赠和鼓励。

如本文对您有用，捐赠和留言 将是对我最好的支持~
如愿意，请向朋友推荐本站，谢谢。

尊重他人劳动成果。转载请务必附上原文链接，我将感激不尽。

与《PHP-中英文混合-安全截取-截取等长UFT8中英文混合字串》相关的博文：