mysql 字符串长度计算实现代码(gb2312+utf8)

MySQLl 2019-04-04

PHP对中文字符串的处理一直困扰于刚刚接触PHP开发的新手程序员。下面简要的剖析一下PHP对中文字符串长度的处理：

PHP自带的函数如strlen()、mb_strlen()都是通过计算字符串所占字节数来统计字符串长度的，一个英文字符占1字节。例：

$enStr = 'Hello,China!';
echo strlen($enStr); // 输出：12

而中文则不然，做中文网站一般会选择两种编码：gbk/gb2312或是utf-8。utf-8能兼容更多的字符，所以受到很多站长的喜爱。gbk与utf-8对中文的编码不同，导致中文在gbk与utf-8编码下所占字节也有差异。

gbk编码下每个中文字符所占字节为2，例：

$zhStr = '您好，中国！';
echo strlen($zhStr); // 输出：12

utf-8编码下每个中文字符所占字节为3，例：

$zhStr = '您好，中国！';
echo strlen($zhStr); // 输出：18

那么如何计算这组中文字符串的长度呢？有人可能会说gbk下获取中文字符串长度除以2，utf-8编码下除以3不就行了吗？但是您要考虑字符串并不老实，99%的情况会以中英混合的情况出现。

这是WordPress中的一段代码，主要思想就是先用正则将字符串分解为个体单元，然后再计算单元的个数即字符串的长度，代码如下（只能处理utf-8编码下的字符串）：

代码如下：

$zhStr = '您好，中国！'; 
$str = 'Hello,中国！'; 

// 计算中文字符串长度 
function utf8_strlen($string = null) { 
// 将字符串分解为单元 
preg_match_all("/./us", $string, $match); 
// 返回单元个数 
return count($match[0]); 
} 
echo utf8_strlen($zhStr); // 输出：6 
echo utf8_strlen($str); // 输出：9

utf8_strlen C 获得UTF8编码的字符串的长度

代码如下：

/* 
* 用于UTF8编码的程序 
* 获得字符串的长度，一个中文表示3个长度 
* itlearner注释 
*/ 
function utf8_strlen($str) { 
$count = 0; 
for($i = 0; $i < strlen($str); $i++){ 
$value = ord($str[$i]); 
if($value > 127) { 
$count++; 
if($value >= 192 && $value <= 223) $i++; 
elseif($value >= 224 && $value <= 239) $i = $i + 2; 
elseif($value >= 240 && $value <= 247) $i = $i + 3; 
else die('Not a UTF-8 compatible string'); 
} 
$count++; 
} 
return $count; 
}

: MySQLl

相关推荐

嵌入式软件必学知识总结！

　　2.strlen和sizeof区别。　　sizeof是算符，strlen是函数。　　strlen指字符的长度，char a[20]="you are a",strlen=9,sizeof=20;sizeof指文件或者数据占的内存(字

lightindark 0喜欢 / 0评论 2020-06-03

嵌入式软件必学知识总结！

　　2.strlen和sizeof区别。　　sizeof是算符，strlen是函数。　　strlen指字符的长度，char a[20]="you are a",strlen=9,sizeof=20;sizeof指文件或者数据占的内存(字

baishuwei 0喜欢 / 0评论 2020-06-03

Linux下编译C++出现的错误

2.error: size_t has not been declared据说这是因为在Linux系统下g++没有C++的size_t方案：需要在需要到size_t的文件中加入头文件 stdlib.h问题就解决了

zmjzhangmj 0喜欢 / 0评论 2020-04-20

C语言：二十三不用库函数/局部or全局变量写测字符串长度的函数

= NULL); //注释①ifreturn 0;else //注释②return ;}注释①：assert是个宏，不是库函数，仅在debug版本中起作用，在release版本中会被编译器优化掉不起任何作用，如果assert后跟的表达式为False，将终止

KilluaZoldyck 0喜欢 / 0评论 2020-01-29

Redis(三)

Hash（哈希），键值对结构。sort set，集合值有序不可重复。string 是 redis 最基本的类型，你可以理解成与 Memcached 一模一样的类型，一个 key 对应一个 value。string 类型是二进制安全的。意思是 redis 的

rongxionga 0喜欢 / 0评论 2020-01-20

Linux下的lcx

#include <sys/time.h>#include <signal.h>#include <stdlib.h>#include <sys/types.h>#include <sys/socket

playlinuxxx 0喜欢 / 0评论 2010-02-22

GCC在Linux编译时的简单用法

使用gcc的 -E选项告诉编译器进行预编译操作。# 1 "string.c"# 1 "<built-in>"# 1 "<command-line>"# 1 "st

过儿古墓 0喜欢 / 0评论 2011-01-12

php常用字符串长度函数strlen()与mb_strlen()用法实例分析

本文实例讲述了php常用字符串长度函数strlen()与mb_strlen()用法。分享给大家供大家参考，具体如下：。int strlen 获取给定字符串的[字节]长度成功则返回字符串$string的长度，如果$string为空，则返回 0。echo

Crazyshark 0喜欢 / 0评论 2019-06-25

PHP对程序员的要求更高

首先,大家都知道,PHP也是一种编译型脚本语言,和其他的预编译型语言不同,它不是编译成中间代码,然后发布..而是每次运行都需要编译..为此,也就有了一些OpcodeCacche,比如开源的APC,eacc.还有商业的ZendO+等.另外,编译直接分离,并不

amberom 0喜欢 / 0评论 2015-07-01

php字符串截取问题与解决方法大全

介绍下php中有关字符串截取的一些问题与解决方法。那么，echo$str的输出应该是"这是一个字…$str="这是1个字符串"；由于原字符串$str的第10、11个字符构成了汉字“符”；执行串分割后会将该汉字一分为二，这样被截

zhangkala 0喜欢 / 0评论 2013-06-08

PHP 把字符串转换为数组支持中文

<?php. $strlen = mb_strlen($string);$array[] = mb_substr($string, 0, 1, "utf8");$string = mb_substr($string, 1, $st

技术渣 0喜欢 / 0评论 2016-11-07

PHP学习记录（字符串函数）

echo strlen($a),"\n", strlen($b), strlen($c), "\n";大小写转换函数。* string ucwords：将字符串中每个单词的首字母大写，其他字母不变。* str_rep

cxymds 0喜欢 / 0评论 2019-06-27

php截取字符串

/*** @@Description 截取字符串* @param String(字符串) $key* @param Int $length* @param String $postfix* @param Int $start* @param String(

静心斋 0喜欢 / 0评论 2013-08-23

PHP字符串操作-正则表达式和替换函数

一般字符串的验证或多或少都会用到正则表达式。PHP对正则表达式的支持相当丰富，有POSIX和PEAR两种格式的正则表达式语法支持。下面就PEAR格式的常用正则表达式进行一些实例展示。看一个最简单的例子：';?[a-zA-Z0-9_]表示包含小写、大写字母以

dabian 0喜欢 / 0评论 2012-07-06

strcpy和strlen的C语言实现

=‘\0’);//当没有遇到字符‘\0’时，把数组strSrc中的元素一次赋值到strDest数组的响应位置。=NULL);//断言字符串地址非0

gmmargin 0喜欢 / 0评论 2012-12-26

C语言 sizeof和strlen之间的那些事 C/C++软件开发求职面试题必备考点（一）

找工作在即，以后决定每天至少写一个知识点，主要是记录，逼迫自己动手、总结加深印象。当然如果能有一言半语让他人收益，后学幸运之至也。如有错误，还希望大家帮忙指出来。第一课，就来搞sizeof和strlen吧。sizeof是一个单目操作符，而不是函数。作用是计

张金乙 0喜欢 / 0评论 2012-08-07

PHP性能优化的5大技巧，你用了几个？

对于一个php开发刚刚入门的程序员来说，经常会碰到学习方向的疑惑。如果没有人知道，php新手很难明确自己应该从哪里开始学习。今天w3cschool就给亲爱的小伙伴们分析php语言学习的方向性问题。而这样项目式的学习方式，恰恰也是每个php开发程序员所要具备

WasteLand 0喜欢 / 0评论 2017-09-22

常见的Python爬虫面试题，叫面试官唱征服

使用string时，redis**大多数情况下**并不会理解或者解析其含义，无论使用json、xml还是纯文本在redis看来都是一样的，只是一个字符串，只能进行strlen、append等对字符串通用的操作，无法针对其内容进一步操作。其基本操作命令有se

小小时光 0喜欢 / 0评论 2018-04-13

细说PHP中strlen和mb_strlen的区别

在PHP中，strlen与mb_strlen是求字符串长度的函数，但是对于一些初学者来说，如果不看手册，也许不太清楚其中的区别。下面通过例子，讲解这两者之间的区别。$str='中文a字1符';对于GB2312的中文编码，strlen得到的值是汉字个数的2倍

doupoo 0喜欢 / 0评论 2011-05-19

WebSocket 实现原理

之前我们将 CocoaAsyncSocket 作为底层实现，在其上面封装了一套 Socket 通信机制以及业务接口，最近我们开始研究 WebSocket ，并用来替换掉原先的 CocoaAsyncSocket ，简单来说一下两者的关系，WebSocket

Taicyzhang 0喜欢 / 0评论 2017-07-03

jQuery编写textarea输入字数限制代码

$.bind(bind_name, function () {//给textarea绑定事件。var strlen = $.val().replace.length;//读取转换得到长度，中文转换成2个长度，英文空格忽视算1个长度。$.text(funct

81971235 0喜欢 / 0评论 2017-03-23

PHP基础面试题

不能输出数组和对象，只能打印简单类型;需要注意的是，mb_strlen并不是PHP核心函数，使用前需要确保在php.ini中加载了php_mbstring.dll，即确保“extension=php_mbstring.dll”这一行存在并且没

lbcmail 0喜欢 / 0评论 2016-07-22

基于Css3和JQuery实现打字机效果

最近做项目的时候需要实现一个字符逐个出现的打字效果，用css的clip+css的动画实现的，与自己写的打字机效果相结合，整。理一起，效果很赞。先来说说这个线条，我们会看到它是条，实际上就是个四周border有规律的显示隐藏，那么这里必定会想到after，b

courseware 0喜欢 / 0评论 2019-04-29

[C/C++基础] C语言常用函数strlen的使用方法

函数strlen比较容易理解，其功能和sizeof很容易混淆。其中sizeof指的是字符串声明后占用的内存长度，它就是一个操作符，不是函数；而strlen则是一个函数，它从第一个字节开始往后数，直到遇见了’\0’，则停止。

一亩半分地 0喜欢 / 0评论 2015-05-01

PHP字符串mbstring处理中文字符串的具体方法解析

大家通过对PHP的学习，可以运用这一高级语言创建一个性能较高的网站。对于初学者来说，对于PHP字符串mbstring还是比较陌生的，下面我们就来介绍一下PHP字符串mbstring的具体应用。多国语言并存就意味着多字节，PHP内置的字符串长度函数strle

kentxyli 0喜欢 / 0评论 2009-11-26

javascript限制用户只能输汉字中文的方法

本文实例讲述了javascript限制用户只能输汉字中文的方法。分享给大家供大家参考。具体实现方法如下：。要验证函数时我们必须明白,如果是汉字，则字符串长度加2，如果用正则我们直接使用\\u4E00-\\u9FA5 即可解决。　　　　var strlen

宋军帅 0喜欢 / 0评论 2019-04-25

js判断字符是否是汉字的两种方法小结

有时需要判断一个字符是不是汉字，比如在用户输入含有中英文的内容时，需要判断是否超过规定长度就要用到。用 Javascript 判断通常有两种方法。<div>测试字符：<input id="test" type=&quo

黄玮鹏 0喜欢 / 0评论 2014-01-03

C语言变量类型隐式转换小陷阱

int型变量可以直接和unsigned int 比较大小吗？这个问题是我在写kmp算法时遇到的。int Index_KMP{ int next[strlen]; get_next; int len = strlen; int i =

lundongcai 0喜欢 / 0评论 2013-10-01

C语言需要注意的问题

/*****************/2、sizeof与strlen的区别sizeof是运算符strlen是函数，在驱动开发中不可用/*********test strlen()*******/int _tmain{ char s[]="abcd

xcxvbf 0喜欢 / 0评论 2013-05-14

记一次Centos服务器被挂马的抓马经历

今天早上五点，收到监控宝的警告短信，说是网站M无法访问了。睡的正香，再说网站所在系统是centos，重要数据每天都备份，应该很安全，也没有在意。倒头接着睡觉去了。早上九点，机房负责人直接给我打来电话，说是全机房网络巨慢，单位的所有网站都打不开或打开的很慢。

ljl 0喜欢 / 0评论 2017-01-20

标准C语言<string.h>中的strlen() 与 VC++ 6.0 中的strlen()

size_t strlen;//p 的长度不计结束符。typedef unsigned int size_t; 也就是说size_t 就是unsigned int 类型。用VC++ 6.0 编程时，如果加了#include<string.h>则

ddsdevgroup 0喜欢 / 0评论 2013-03-08

C语言中的无符号数与有符号数混合运算时隐含转换问题

void main(){char *s = "d";char *t = "Id";int strLonger{return strlen - strlen > 0; }//输出结果为 1. //当把一个有符号数

kunkun 0喜欢 / 0评论 2013-03-08

jQuery计算textarea中文字数(剩余个数)的小程序

$b = $.parents.find; //获取当前的数字

zhaoxinglei00 0喜欢 / 0评论 2013-11-28

php 截取utf-8格式的字符串实例代码

英文字符占用一个字节，中文字符占用两个字节，但中文字符占用两个字节是相对于GBK编码而言但是在时下国际流行的UTF8编码中，一个中文字符占用3个字节。本文章向大家介绍一个php 截取utf-8格式字符串的函数。>感谢阅读，希望能帮助到大家，谢谢大家对

iamlazyphper 0喜欢 / 0评论 2019-04-16

PHP发送AT指令实例代码

查阅发现, AT质量发送需要对信息进行多重编码, 而且发送超时, 但实际发送成功, 问题还未完全解决。dio_write; //发送信息长度

展翅飞翔phpBoy00 0喜欢 / 0评论 2016-05-26

PHP判断字符串长度的两种方法很实用

php程序中字符串长度判断，可以使用strlen。}以上两种方法，第二种效率更高些。在PHP中，所有的变量都是用一个结构-zval来保存的，strlen虽然是直接获取其中的len，但是仍然有一次函数调用，而isset是PHP的语法结构，所以更快！所以在判断

KUNPHP 0喜欢 / 0评论 2019-04-12

支持中文的PHP按字符串长度分割成数组代码

$str = '我爱北京3我爱上海-我爱xianggang';//Array 以上所述就是本文的全部内容了，希望大家能够喜欢。

weixuejunphp 0喜欢 / 0评论 2019-04-11

自己写的php中文截取函数mb_strlen和mb_substr

众所周知，php 自带的 strlen 与 substr 函数没法处理中文字符，于是，我们会用 mb_ 系列函数替代。但是，没有 mbstring 库怎么办？这就需要我们自己写一个来替代了，废话不多说，先上代码:

phpsir 0喜欢 / 0评论 2019-04-11

php格式化金额函数分享

最近的项目在处理资金这一块的功能，对人民币金额的格式化输出是必不可少的功能。这个功能比较独立而且还比较大众化，所以封装成了函数就发上去也算是方便大家。}以上就是本文的全部内容，希望大家能够喜欢。

phptyong 0喜欢 / 0评论 2019-04-11

浅析PHP中strlen和mb_strlen的区别

在PHP中，strlen与mb_strlen是求字符串长度的函数，但是对于一些初学者来说，如果不看手册，也许不太清楚其中的区别。下面通过例子，讲解这两者之间的区别。$str='中文a字1符';采用mb_strlen函数可以较好地解决这个问题。mb_strl

KUNPHP 0喜欢 / 0评论 2019-04-09

可以保证单词完整性的PHP英文字符串截取代码分享

// 先正常截取一遍.$next_len = $next_start + 6 <= $strlen ?$prev_start = $start - 6 > 0 ?// 如果第1字节就不是完整字符的首字节, 再往后截取大约6字节.// 往后截取

weixuejunphp 0喜欢 / 0评论 2019-04-09

基于jquery的页面划词搜索JS

= "INPUT" && obj == GLS.startObj && !

nnj 0喜欢 / 0评论 2010-09-14

PHP中strlen()和mb_strlen()的区别浅析

在php中常见的计算字符串长度的函数有：strlen和mb_strlen.当字符全是英文字符的时候，两者是一样。这里主要比较一下，中英文混排的时候，两个计算结果。$str='中文a字1符';PHP内置的字符串长度函数strlen无法正确处理中文字符串，它得

weixuejunphp 0喜欢 / 0评论 2019-04-08

javascript FormatNumber函数实现方法

由于javascript里没有这个函数，那么我们该如何实现呢？下面我就给出这个函数，大家可以把：<script language=javascript src="formatnumber.js"></script>

wujimiao 0喜欢 / 0评论 2008-12-30

详解PHP中strlen和mb_strlen函数的区别

在PHP里有两个计算字符串个数的函数一个是 strlen,一个是mb_strlen;先来看看手册中的定义strlenstrlen ― 获取字符串长度int strlen 返回给定的字符串 string 的长度。如果省略，则使用内部字符编码。这么看除了mb_

weixuejunphp 0喜欢 / 0评论 2014-03-07

Linux静态/动态链接库的创建和使用

，相关命令如下：ar –rc libstr.a Strlen.o Strnlen.o命令执行成功以后，对应的静态库libstr.a已经成功生成。/**************************************Filename : get st

zhenyaqi 0喜欢 / 0评论 2008-10-30

多个PHP中文字符串截取函数

$string = "简明现代魔法 ―― 专注于互联网主流的各种技术";// 简明现代魔法 ―― 专...>截取utf8编码的多字节字符串：。>UTF-8、GB2312都支持的汉字截取函数：

KUNPHP 0喜欢 / 0评论 2013-11-12

PHP不用第三变量交换2个变量的值的解决方法

一般都是借助第三个中间变量来实现原来两个变量的值交换，但是这道题却要求不能使用中间变量，这对于初学者来说也算是一个难题了。网上找到的几种方法总结如下：代码如下：

weixuejunphp 0喜欢 / 0评论 2013-06-02

使用php重新实现PHP脚本引擎内置函数

=NULL) { $count++; continue; } else break; } return$count; } //}}} //{{{substr() /** *Getsubstring * *@paramstring$strneedgetsub

phptyong 0喜欢 / 0评论 2007-03-05