日本国产亚洲-日本国产一区-日本国产一区二区三区-日本韩国欧美一区-日本韩国欧美在线-日本韩国欧美在线观看

當前位置:雨林木風下載站 > 技術開發教程 > 詳細頁面

GD輸出漢字的函數的區分(函數代碼系轉帖)

GD輸出漢字的函數的區分(函數代碼系轉帖)

更新時間:2022-05-06 文章作者:未知 信息來源:網絡 閱讀次數:

很早以前找到一個把GB碼轉化為UTF-8的函數,配合一個GB到UNICODE的對照表(gb2312.txt),用于在GD中輸出漢字。后來發現在欲輸出的內容中含有西文字符時,會出現混亂。后來找到了修改后的代碼,解決了問題。現將兩個函數做一對比分析如下。

首先,這是一個UNICODE到UTF-8編碼轉換的函數,這一部分修改前后沒有變化:
function u2utf8($c)
{
for($i=0;$i<count($c);$i++)
$str="";
if ($c < 0x80) {
$str.=$c;
}
else if ($c < 0x800) {
$str.=(0xC0 | $c>>6);
$str.=(0x80 | $c & 0x3F);
}
else if ($c < 0x10000) {
$str.=(0xE0 | $c>>12);
$str.=(0x80 | $c>>6 & 0x3F);
$str.=(0x80 | $c & 0x3F);
}
else if ($c < 0x200000) {
$str.=(0xF0 | $c>>18);
$str.=(0x80 | $c>>12 & 0x3F);
$str.=(0x80 | $c>>6 & 0x3F);
$str.=(0x80 | $c & 0x3F);
}
return $str;
}

這里完全是按照UTF-8編碼的規則,通過判斷字符屬于不同的UNICODE編碼段范圍,進行不同的移位和位與操作,以轉化為UTF-8編碼。關于該規則可參考http://www.utf8.org/上的說明。

這是修改前的GB轉化為UTF-8編碼的函數,其中調用了上面的u2utf8函數。
function gb2utf8($gb) /* Program writen by sadly www.phpx.com*/
{
if(!trim($gb))
return $gb;
$filename="gb2312.txt";
$tmp=file($filename);
$codetable=array();
while(list($key,$value)=each($tmp))
$codetable[hexdec(substr($value,0,6))]=substr($value,7,6);
$utf8="";
while($gb)
{
if (ord(substr($gb,0,1))>127)
{
$this=substr($gb,0,2);
$gb=substr($gb,2,strlen($gb));
$utf8.=u2utf8(hexdec($codetable[hexdec(bin2hex($this))-0x8080]));
}
else
{
$gb=substr($gb,1,strlen($gb));
$utf8.=u2utf8(substr($gb,0,1));
}
}

$ret="";
for($i=0;$i<strlen($utf8);$i+=3)
$ret.=chr(substr($utf8,$i,3));

return $ret;
}
函數中while循環部分,把漢字逐個按照“對照表”轉化為UNICODE,再通過u2utf8函數轉化為UTF-8。但從中可以看出,while循環結束后,又用一個for循環,把每三個字節合成了一個UTF-8字符(見http://www.utf8.org/上的規則說明,每個漢字的UTF-8編碼為三字節),沒有考慮到其中的西文字符(西文字符的UTF-8編碼為一字節)。所以,如果欲輸出的內容中不論是開始時出現西文字符,或是漢字當中穿插西文字符,轉化為UTF-8后,都會被按照“每三個字節截取”的方式截開,導致亂碼。


以下是修改后的函數:
function gb2utf8($gb)/* Program writen by sadly modified by agun */
{
if(!trim($gb))
return $gb;
$filename="gb2312.txt";
$tmp=file($filename);
$codetable=array();
while(list($key,$value)=each($tmp))
$codetable[hexdec(substr($value,0,6))]=substr($value,7,6);

$ret="";
$utf8="";
while($gb)
{
if (ord(substr($gb,0,1))>127)
{
$this=substr($gb,0,2);
$gb=substr($gb,2,strlen($gb));
$utf8=u2utf8(hexdec($codetable[hexdec(bin2hex($this))-0x8080]));
for($i=0;$i<strlen($utf8);$i+=3)
$ret.=chr(substr($utf8,$i,3));
}
else
{
$ret.=substr($gb,0,1);
$gb=substr($gb,1,strlen($gb));
}
}
return $ret;
}

修改后的函數將 GB轉化為UNICODE、UNICODE轉化為UTF-8、幾個字節合成一個UTF-8字符,這三個步驟在一個循環里完成,尤其是幾個字節合成一個UTF-8字符這一步驟,放在判斷了字符屬于西文還是屬于漢字的條件分支里,據此決定截取一個字節還是三個字節。于是結果正確了!

溫馨提示:喜歡本站的話,請收藏一下本站!

本類教程下載

系統下載排行

主站蜘蛛池模板: 中文字幕一区精品欧美 | 欧美日韩专区 | 日本丰满大乳乳乳 | 国产一区二区在线观看免费 | 青青草国产免费久久久91 | 成人午夜小视频手机在线看 | 欧美成人午夜片一一在线观看 | 飘花国产午夜精品不卡 | 555夜色666夜色精品站 | 久久久久久国产精品免费免费 | 中文字幕热久久久久久久 | 青娱乐激情视频 | 狠狠大日本亚洲香蕉亚洲 | 日韩一区二区三区免费体验 | 在线免费国产视频 | 狠狠做久久深爱婷婷97动漫 | 午夜在线观看视频 | 日韩视频在线播放 | 国产日韩美国成人 | 狠狠干狠狠干狠狠干 | 欧美性第一页 | 久久综合九色综合精品 | 波多野结衣3女同在线观看 波多野结衣aⅴ在线 | 天天舔日日干 | 成人羞羞视频在线看网址 | 亚洲综合色区图片区 | 男人视频网站 | 69视频免费| 欧美性乱视频 | 特黄特级a级黄毛片免费观看多人 | 狠狠狠狠干 | 欧美精品亚洲 | 蜜桃在线视频 | 精品久久久久国产 | 精品综合久久久久久蜜月 | 九色最新 | 日本大尺度叫床戏做爰有声音 | 欧美成人免费毛片 | 久久久久久久亚洲精品 | 米奇精品一区二区三区 | 又大又黄又粗又爽视频 |