PHP頂部有BOM空白行 \ufeff字符的處理方法

今天在弄集合短網址的時候發現總是處理不了一個站的數據,一直以為姿勢不對,換了很多姿勢。

研究了兩個鐘頭,json_decode死活解析不出數據,

在一次json_encode測試意外中 發現了\ufeff\ufeff\ufeff 三個轉碼字符,百度了一下,發現這是BOM頭的數據

于是想辦法去過濾他,我正則測試了半天沒有問題,可是一上PHP 代碼就不行,于是繼續百度。

我將最終的方法貼出來給大家



function DoBOM($text){
    if(substr($text, 0, 3) == pack("CCC", 0xEF, 0xBB, 0xBF)) $text = substr($text, 9);
    return $text;
}


這個可以過濾掉BOM 頭,下面分享一個批量的

<?php
header('content-Type: text/html; charset=utf-8');
$auto=1;/*設置為1標示檢測BOM并去除,設置為0標示只進行BOM檢測,不去除*/
$basedir='.';
$loop=true;//www.phpernote.com
echo '當前查找的目錄為:'.$basedir.'當前的設置是:';
echo '(1)',$loop?'檢查當前目錄以及當前目錄的子目錄':'只針對當前目錄進行檢測';
echo '(2)',$auto?'檢測文件BOM同時去除檢測到BOM文件的BOM<br />':'只檢測文件BOM不執行去除BOM操作<br />';

checkdir($basedir,$loop);
function checkdir($basedir='',$loop=true){
	$basedir=empty($basedir)?'.':$basedir;
	if($dh=opendir($basedir)){
		while (($file=readdir($dh))!==false){
			if($file!='.'&&$file!='..'){
				if(!is_dir($basedir.'/'.$file)){
					echo '文件: '.$basedir.'/'.$file .checkBOM($basedir.'/'.$file).' <br>';
				}else{
					if(!$loop) continue;
					$dirname=$basedir.'/'.$file;
					checkdir($dirname);
				}
			}
		}
		closedir($dh);
	}
}
function checkBOM($filename){
	global $auto;
	$contents=file_get_contents($filename);
	$charset[1]=substr($contents,0,1);
	$charset[2]=substr($contents,1,1);
	$charset[3]=substr($contents,2,1);
	if(ord($charset[1])==239&&ord($charset[2])==187&&ord($charset[3])==191){
		if($auto==1){
			$rest=substr($contents,3);
			rewrite($filename,$rest);
			return (' <font color=red>找到BOM并已自動去除</font>');
		}else{
			return (' <font color=red>找到BOM</font>');
		}
	}else{
		return (' 沒有找到BOM');
	}
}
function rewrite($filename,$data){
	$filenum=fopen($filename,'w');
	flock($filenum,LOCK_EX);
	fwrite($filenum,$data);
	fclose($filenum);
}

轉載請注明出處 AE博客|墨淵 ? PHP頂部有BOM空白行 \ufeff字符的處理方法

發表評論

路人甲

網友評論(0)