码迷,mamicode.com
首页 > 其他好文 > 详细

[正则表达式]匹配Unicode

时间:2018-07-08 00:30:29      阅读:216      评论:0      收藏:0      [点我收藏+]

标签:原因   class   正则表达式   str   div   var   字符   示例   regexp   

一、PHP[PCRE]之Unicode

PCRE支持的16进制字符编码转义符有

\x00-\xFF,或\x{num},num为任意位16进制数

但并不支持\u0000-\uFFFF这的形式

PCRE运用/u模式去处理UTF-8编码字符,这是PCRE特有的,示例代码

$str = ‘中asfdsf个业上‘;
$pattern = ‘/[\x{4E10}-\x{4E2F}\x{4E0A}]/u‘;
$matchs = array();
$result = preg_match_all($pattern, $str, $matchs);
var_dump($result, $matchs);

示例中“中个业上”将会被匹配,因为字符组中\x{4E10}-\x{4E2F}匹配了“中个业”所在的Unicode区间,\x{4E0A}对应的是“上”;

 

二、JavaScript

JavaScript支持的16进制字符编码转义符有

\x00-\xFF, \u0000-\uFFFF

示例代码

var str = "中asfdsf个业上";
var regExp = /[\u4E10-\u4E2F\u4E0A]/g;
console.log(str.match(regExp));

示例中“中个业上”将会被匹配,原因同上;

[正则表达式]匹配Unicode

标签:原因   class   正则表达式   str   div   var   字符   示例   regexp   

原文地址:https://www.cnblogs.com/yiyide266/p/9278882.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!