四種常見文本文件編碼方式ANSI編碼:無文件頭(文件編碼開頭標志性)

2023-12-01    分類: 網站建設

php字符編碼轉換類,支持ANSI、big、UTF-8、UTF-8+bom相互轉換。

四種常見的文本文件編碼方式

ANSI 編碼:

無文件頭(文件編碼開頭的有效字節)

ANSI編碼的字母數字占一個字節,漢字占兩個字節

回車換行,單字節,十六進制表示為0d 0a

編碼:

文件頭,十六進制表示為FF FE

每個字符用兩個字節編碼

回車,換行,雙字節,十六進制表示為000d 000a

大編碼:

文件頭的十六進制表示為FE FF

后面的編碼就是把字符的高位放在前面,低位放在后面,正好是編碼的逆過程

回車,換行php轉unicode編碼,雙字節php轉unicode編碼,十六進制表示為 0d00 0a00

UTF-8 編碼:

文件頭,十六進制表示為EF bb bF

UTF-8 是一種可變長度的字符編碼。數字、字母、回車、換行都用1個字節表示,漢字占3個字節。

回車換行,單字節,十六進制表示為0d 0a

轉換原則:先將字符編碼轉換為UTF-8,再由UTF-8轉換為對應的字符編碼。

..php

_allow_charset)){
            $this->_in_charset = $in_charset;
        }
        // 檢查輸出編碼
        if(in_array($out_charset, $this->_allow_charset)){
            $this->_out_charset = $out_charset;
        }
    }
    /** 轉換
    * @param  String $str 要轉換的字符串
    * @return String      轉換后的字符串
    */
    public function convert($str){
        $str = $this->convToUtf8($str);   // 先轉為utf8
        $str = $this->convFromUtf8($str); // 從utf8轉為對應的編碼
        return $str;
    }
    /** 把編碼轉為UTF-8編碼
    * @param  String $str 
    * @return String
    */
    private function convToUtf8($str){
        if($this->_in_charset=='utf-8'){ // 編碼已經是utf-8,不用轉
            return $str;
        }
        switch($this->_in_charset){
            case 'utf-8bom':
                $str = substr($str, 3);
                break;
            case 'ansi':
                $str = iconv('GbK', 'UTF-8//IGNORE', $str);
                break;
            case 'unicode':
                $str = iconv('UTF-16le', 'UTF-8//IGNORE', substr($str, 2));
                break;
            case 'unicodebe':
                $str = iconv('UTF-16be', 'UTF-8//IGNORE', substr($str, 2));
                break;
            default:
                break;
        }
        return $str;
    }
    /** 把UTF-8編碼轉換為輸出編碼
    * @param  String $str
    * @return String
    */
    private function convFromUtf8($str){
        if($this->_out_charset=='utf-8'){ // 輸出編碼已經是utf-8,不用轉
            return $str;
        }
        switch($this->_out_charset){
            case 'utf-8bom':
                $str = "\xef\xbb\xbf".$str;
                break;
            case 'ansi':
                $str = iconv('UTF-8', 'GbK//IGNORE', $str);
                break;
            case 'unicode':
                $str = "\xff\xfe".iconv('UTF-8', 'UTF-16le//IGNORE', $str);
                break;
            case 'unicodebe':
                $str = "\xfe\xff".iconv('UTF-8', 'UTF-16be//IGNORE', $str);
                break;
            default:
                break;
        }
        return $str;
    }
} // class end
?>

演示:將 big 轉換為 utf-8+bom

convert($str);
file_put_contents('response/utf-8bom.txt', $response, true);
?>

源碼下載地址:點擊查看

以上介紹了pHp字符編碼轉換類,支持ANSI、big、UTF-8、UTF-8+bom之間的轉換,包括內容,希望對pHp教程感興趣的朋友有所幫助.

免責聲明:本文首發于php中文網。轉載請注明出處。感謝您的尊重!如果您有任何問題,請聯系我們

網頁題目:四種常見文本文件編碼方式ANSI編碼:無文件頭(文件編碼開頭標志性)
當前地址:http://m.kartarina.com/news48/297848.html

成都網站建設公司_創新互聯,為您提供小程序開發Google網站建設電子商務面包屑導航移動網站建設

廣告

聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯

商城網站建設
主站蜘蛛池模板: 国产精品99精品无码视亚 | 久久亚洲AV成人无码国产| 日本无码小泬粉嫩精品图| 一本加勒比hezyo无码专区| 午夜不卡无码中文字幕影院| 无码人妻精品一二三区免费 | 一本大道无码日韩精品影视_| 国产在线拍偷自揄拍无码| 人妻少妇偷人精品无码| 亚洲中文字幕无码专区| 亚洲精品无码久久久久久| 亚洲精品无码永久中文字幕| 无码丰满熟妇一区二区| 亚洲午夜国产精品无码老牛影视| 亚洲精品无码永久在线观看男男| 国产亚洲精品a在线无码| 人妻少妇无码视频在线| 亚洲youwu永久无码精品| 亚洲熟妇无码爱v在线观看| 国产成人无码综合亚洲日韩| 岛国无码av不卡一区二区| 国产嫖妓一区二区三区无码| 本道久久综合无码中文字幕| 亚洲无码一区二区三区| 无码av人妻一区二区三区四区| 无码国产精品一区二区免费式芒果| 亚洲成A人片在线观看无码3D| 内射中出无码护士在线| 日韩免费无码一区二区视频| 国产精品va无码免费麻豆| 国产成年无码久久久久下载| 免费无码黄动漫在线观看| 亚洲av无码av在线播放| 亚洲heyzo专区无码综合| 亚洲AV成人无码久久WWW| 无码中文字幕乱码一区 | 国产精品无码久久久久| 18禁无遮挡无码网站免费| 国产成人无码AV片在线观看| 国产成人无码精品一区不卡| 久久久久久国产精品无码下载|