[FC8]linux下的正簡(繁簡)中文轉換

因為兩岸中文系統的不一樣,以致於現在電腦系統的中文系統出現了正體中文和簡體中文的差異。有些檔案或是網頁是用簡體中文寫的,有些使用正體中文的朋友看
起來相當吃力。反之亦然。在linux下這只要下個指令就可以做好轉換,只是在做轉換前必須先弄清楚目前的資料是使用什麼編碼方式。

在這裡將採用iconv這個指令來達成這個動作。iconv是linux底下用來轉換編碼方式的指令,在這裡介紹使用iconv達成正體中文和簡體中文互換的方法。現在大部份的系統預設採用的是Unicode(UTF8)編碼方式,如果現在有個檔案text.txt內容是採用UTF8編碼的正體中文,透過以下的幾個指令可以將檔案內容改成UTF8編碼的簡體中文。
第一步,先將UTF8編碼轉換成Big5編碼並存成temp_big5.txt
# iconv text.txt -f utf8 -t big5 -o temp_big5.txt

第二步,再將temp_big5.txt由Big5編碼轉換到gb2312編碼並存成temp_gb2312.txt
# iconv text_big5.txt -f big5 -t gb2312 -o temp_gb2312.txt

第三步,再將temp_gb2312.txt由gb2312編碼轉換回UTF8編碼並存成target.txt
# iconv temp_gb2312.txt -f gb2312 -t utf8 -o target.txt

這樣就完成了將text.txt中的繁體中文轉換到簡體中文了。

但是每次執行都這麼麻煩的執行那麼多次嗎?當然不用囉!以上那麼多的指令可以濃縮成一步,但是有點長就是了!
# iconv text.txt -f utf8 -t big5 | iconv -f big5 -t gb2312 | iconv -f gb2312 -t utf8 -o target.txt
這樣就可以直接將text.txt檔案中的繁體中文轉換到target.txt的簡體中文了

當然還有更省事的方法,就是將指令存shell檔案,要用時就可以省下很多打字的時間了。將以下的內容存成tc2sc_file.sh
#Translate txt file from Traditional Chinese to Simply Chinese
iconv $1 -f utf8 -t big5 | iconv -f big5 -t gb2312 | iconv -f gb2312 -t utf8 -o $2

再用chmod指令讓tc2sc.sh具有執行的權限
# chmod 755 tc2sc_file.sh

完成後就可以直接使用tc2sc_file.sh來做轉檔的工作,EX: tc2sc_file.sh 來源檔案 目的檔案

如果是要把簡體中文轉成正體中文的話,只要將編碼的順序整個反過來就可以了,如下。
# iconv text.txt -f utf8 -t gb2312 | iconv -f gb2312 -t big5 | iconv -f big5 -t utf8 -o target.txt

sc2tc_file.sh
#Translate txt file from Simply Chinese to Traditional Chinese
iconv $1 -f utf8 -t gb2312 | iconv -f gb2312 -t big5 | iconv -f big5 -t utf8 -o $2


1 則留言:

  1. 這幾天真得頗冷的,別忘了做好保暖工作,以免感冒著涼了~
    先跟大家拜個早年,祝大家2008年有 "鼠" 不盡的快樂 !日誌這一年來推出了許多新功能 http://blog.xuite.net/blog/baby/12851898想知道有哪些人來拜訪過你嗎?
    "誰來我家"讓你一目瞭然 http://blog.xuite.net/blog/baby/8759947 Xuite上的推薦日誌達人你還不認識嗎?
    新版推薦日誌頁面,讓你認識更多的人氣部落客 http://blog.xuite.net/blog/baby/12851898 還不知到你的受歡迎的文章有哪些嗎?
    "我的哈燒文",絕對是你不能錯過的好工具 http://blog.xuite.net/blog/baby/8761155 腦子總是擠不出詞彙來寫文章嗎?
    "相簿Slideshow"讓你輕輕鬆鬆完成能以言喻的食記與遊記.http://blog.xuite.net/blog/baby/8761177還有....還有很多的功能說不完囉,有勞大家動手體驗一下!http://blog.xuite.net/blog/baby/12851898 過年期間一定有許多溫馨的回憶
    不妨將好吃好玩的生活紀錄po上來,留住美麗難忘的記憶,也讓你的日誌動起來 Xuite日誌小組 祝你新年快樂~

    回覆刪除

在 Fedora 31 下讓 Python 多版本共存的方法

在 Fedora 31 下每個版本的 Python 有各自獨立的套件名稱,可以簡單的直接透過套件管理工具 dnf 來簡易安裝各版本的 Python。 安裝 Python 3.7 可用以下指令 $ sudo dnf install  python-unversione...