encguess - 猜測檔案的字元編碼
$Id: encguess,v 0.3 2020/12/02 01:28:17 dankogai Exp $
encguess [switches] filename...
猜測名為 test.txt
檔案的編碼,僅使用預設的可疑類型。
encguess test.txt
猜測名為 test.txt
檔案的編碼類型,使用可疑類型 euc-jp,shiftjis,7bit-jis
。
encguess -s euc-jp,shiftjis,7bit-jis test.txt
encguess -s euc-jp:shiftjis:7bit-jis test.txt
猜測多個檔案的編碼類型,不要顯示未識別檔案的結果。
encguess -us euc-jp,shiftjis,7bit-jis test*.txt
編碼識別是透過一次檢查一種編碼類型來完成,直到所有類型都被淘汰,只剩下正確的類型。要嘗試的編碼類型集合由 -s 參數定義,預設為 ascii、utf8 和帶 BOM 的 UTF-16/32。這可以用 -s 參數傳遞一個或多個編碼類型來覆寫。如果您需要傳入多個可疑編碼類型,請使用帶有空格分隔每個值的引號字串。
版權所有 2015 Michael LaGrasta 和 Dan Kogai。
此程式為自由軟體;您可以在 Artistic License (2.0) 的條款下重新散布或修改它。您可以在下列網址取得完整授權副本