Score
0
Watch 74 Star 186 Fork 49

mz / php-pinyinPHP

Join us
Explore and code with more than 2 million developers,Free private repositories !:)
Sign up
php 汉字转拼音单元(支持生僻字) spread retract

Clone or download
pinyin.class.php 111.05 KB
Copy Edit Web IDE Raw Blame History
mz authored 2016-10-09 01:01 . fix make tool bug
<?php
/*
* @desc 汉字转拼音单元
* @author Djunny <mozhua@gmail.com>
*/
class pinyin {
static $data = NULL;
public static function init_data() {
static $init_data = 0;
if ($init_data == 0) {
$init_data = 1;

}
}
/**
*
* main method for pinyin
*
* @param string $str
* @param int $first_char
* @param string $split_char
* @param string $except_char
*
* @return string
*/
public static function get($str, $first_char = 0, $split_char = '', $except_char = '') {
self::init_data();
// 返回结果
$result = '';
// 中文字符标记
$is_ch = 0;
// 按中文长度遍历字符串
for ($i = 0, $j = mb_strlen($str, 'utf-8'); $i < $j; $i++) {
$res = '';
// 是否添加分隔符
$add_split = 0;
// 取出当前字符
$char = mb_substr($str, $i, 1, 'utf-8');
// 判断是否多字节字符(是否是中文或者中文符号)
if (strlen($char) > 1) {
// 将字符串转为 GBK 编码(双字节)
$gbk = mb_convert_encoding($char, 'GBK', 'utf-8');
// 取出字符串,将第一个字符的ASCII * 256 + 第二个字符的 ASCII - 65535 得到表中的 code 索引下标
$code = ord($gbk[0]) * 256 + ord($gbk[1]) - 65536;
// 找到表中 code 下标对应的字符
$res = self::find($code, self::$data);
// 判断如果没有找到对应的 code 下标,则在生辟字字典中查找
if (!$res && array_key_exists($char, self::$data['word']) && $res = self::$data['word'][$char]) {
$res = self::$data['pinyin'][$res];
}
// 标记中文
$is_ch = 1;
// 中文字符需要加分隔符
$add_split = 1;
} else {
// 为数字或者英文字符
$res = $char;
// 如果之前有中文标记,则在前边添加分隔符
if ($is_ch) {
$add_split = 1;
}
$is_ch = 0;
}
// 如果找到拼音或者是数字或英文字符,或者当字符串 === '0'
if ($res || $res === '0') {
// 如果当前字符不是第一个,而且需要添加分隔符
if ($i > 0 && $split_char && $add_split) {
// 添加分隔符至结果
$result .= $split_char;
}
// 添加当前结果
$result .= $first_char ? $res[0] : $res;
}
}
// 分隔符和保留字符加正则转义
$preg_char = preg_quote($split_char);
$except_char = preg_quote($except_char);
// 替换掉所有不相关的字符或英文标点
$result = preg_replace("/([^\w{$except_char}" . $preg_char . "]" . ($preg_char ? $preg_char . '?' : '') . ")*/i", '', $result);
// 返回结果
return $result;
}
/**
* find word in table
*
* @param $num
* @param $data
*
* @return string
*/
static function find($num, &$data) {
if ($num < -20319 || $num > -10247) {
return '';
}
$num += 20319;
foreach ($data['code'] as $k => $v) {
if ($k > $num) {
return $data['pinyin'][$v - 1];
}
}
}
}
?>

Comment ( 0 )

Sign in for post a comment

PHP
1
https://gitee.com/mz/php-pinyin.git
git@gitee.com:mz/php-pinyin.git
mz
php-pinyin
php-pinyin
master

Help Search