我编写了这个函数来创建一个由UTF-8字符组成的随机字符串。它工作得很好,但是正则表达式[^\p{L}]
似乎没有过滤所有非字母字符。我想不出一种更好的方法来生成没有非字母字符的全系列unicode。不需要手动搜索和定义介于65和65533之间的十进制字母范围。
function rand_str($max_length, $min_length = 1, $utf8 = true) {
static $utf8_chars = array();
if ($utf8 && !$utf8_chars) {
for ($i = 1; $i <= 65533; $i++) {
$utf8_chars[] = mb_convert_encoding("&#$i;", 'UTF-8', 'HTML-ENTITIES');
}
$utf8_chars = preg_replace('/[^\p{L}]/u', '', $utf8_chars);
foreach ($utf8_chars as $i => $char) {
if (trim($utf8_chars[$i])) {
$chars[] = $char;
}
}
$utf8_chars = $chars;
}
$chars = $utf8 ? $utf8_chars : str_split('abcdefghijklmnopqrstuvwxyz');
$num_chars = count($chars);
$string = '';
$length = mt_rand($min_length, $max_length);
for ($i = 0; $i < $length; $i++) {
$string .= $chars[mt_rand(1, $num_chars) - 1];
}
return $string;
}
发布于 2012-05-29 14:30:18
\p{L}
可能抓得太多了。尝试限制为{Ll}和{LU} -- {L}包括{Lo} --其他。
发布于 2017-03-01 23:21:35
对于PHP7和IntlChar,现在有了一种更好的方法:
function utf8_random_string(int $length) : string {
$r = "";
for ($i = 0; $i < $length; $i++) {
$codePoint = mt_rand(0x80, 0xffff);
$char = \IntlChar::chr($codePoint);
if ($char !== null && \IntlChar::isprint($char)) {
$r .= $char;
} else {
$i--;
}
}
return $r;
}
https://stackoverflow.com/questions/10793582
复制相似问题