2016年7月15日

記事本存檔時出現奇怪的訊息

2019/9/21 更新
通常記事本編輯文字後都會存檔,Windows 10 以前的記事本偶而在存檔時會出現一個訊息,內容是提醒要儲存的內容包含 Unicode 字元,若以 ANSI 編碼方式儲存將會遺失 Unicode 字元,你可能很錯愕發生了什麼事,再熟悉不過的存檔動作竟然會出問題。

電腦上顯示和輸入的每個文字都有對應的字元編碼,早期電腦的字元編碼是採用 ANSI 格式,此格式能夠包含的文字數量有限,並無法容納全世界如此眾多的語言文字,因而有了 Unicode 格式的誕生,而 Windows 作業系統從 Windows 2000 以後採用的字元編碼為 Unicode 格式,該格式已歷經多個版本的更新,幾乎已囊擴了所有語言文字。
早期繁體中文採用的 BIG-5 編碼架構在 ANSI 格式下,但包含的字數有限,像「堃」這個字就不在 BIG-5 編碼中而是屬於 Unicode 編碼,記事本預設的存檔字元編碼為 ANSI,當編輯的文字內容其編碼皆落在 BIG-5 編碼的範圍,存檔時就不會出現如前所述的提醒訊息,換言之若有出現該訊息就表示所編輯的文字內容有包含Unicode 編碼的文字,以預設的 ANSI 編碼方式儲存後再打開來看,將會發現 Unicode 的文字變成亂碼或消失,無法達到完整儲存的目的。

在記事本中輸入或貼上 Unicode 編碼的繁體中文、特殊符號、emoji 表情符號或簡體中文等其它語言文字,想要完整保留內容不遺失任何文字,就不能以 ANSI 編碼存檔,而要改以 Unicode 編碼存檔,在記事本 [另存新檔] 對話方塊中,按 Tab 鍵可找到 [編碼] 下拉式方塊,有多個編碼方式可選擇,基於通用性的考量,建議採「UTF-8」編碼方式存檔。

自 Windows 10 版本 1903 之後,記事本存檔時的預設文字編碼已經改為 UTF-8,存檔時不會再出現前述的提醒訊息。不過這裡的 UTF-8 與以往的 UTF-8 有些不同,在 [編碼] 的選擇中有一項為「具有 BOM 的 UTF-8」即為以往的 UTF-8,無特殊需求不必以該編碼方式存檔。

了解事情的原委之後,下次再遇到此狀況就能輕鬆應付不會再心慌慌了。

延伸閱讀