倉頡碼表集(倉頡平台2022 、倉五代補完、倉三補完) #341
rocka
started this conversation in
Table Dict | 码表词典
Replies: 0 comments
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
倉頡碼表集(倉頡平台2022、倉五代補完、倉三補完)_V0_1.zip
来源: https://t.me/fcitx5_android_group/102521
本碼表集所含碼表/方案適用於fcitx5-android,源自於下面幾大系列的倉頡碼表:
上述幾大系列碼表的介紹(從各自官網摘錄):
倉頡平台2022:
《倉頡平台2022》提供十二種倉頡版本,取碼及收字如下:
《五倉通用》:第五代倉頡通用版,支持Unicode CJK/規範漢字表/Big5/GBK 21000餘個簡繁漢字。
《五倉世紀》:第五代倉頡世紀版,支持Unicode CJK/Ext-A/B/C/D/E/F/G 90000餘個中日韓越漢字。
《五倉繁體》:第五代倉頡繁體版,支持Unicode CJK/Big5 13053個繁體漢字。
《五倉簡體》:第五代倉頡簡體版,支持Unicode CJK/GB/規範漢字表/通用漢字表 8300餘個簡化漢字。
《三倉通用》:第三代倉頡通用版,支持Unicode CJK/Big5/GBK 21000餘個簡繁漢字。
《三倉世紀》:第三代倉頡世紀版,支持Unicode CJK/Ext-A/B/C/D/E/F/G 90000餘個中日韓越漢字。
《三倉繁體》:第三代倉頡繁體版,支持Unicode CJK/Big5 13053個繁體漢字。
《三倉簡體》:第三代倉頡簡體版,支持Unicode CJK/GB 6763個簡化漢字。
《三五倉繁》:三五代倉頡繁體版,三及五代倉頡取碼,支持Unicode CJK/Big5 13053個繁體漢字。
《二倉簡體》:第二代倉頡簡體版,支持Unicode CJK/GB 6763個簡化漢字。
《五速通用》:第五代速成通用版,支持Unicode CJK/規範漢字表/Big5/GBK 21000餘個簡繁漢字。
《五速世紀》:第五代速成世紀版,支持Unicode CJK/Ext-A/B/C/D/E/F/G 90000餘個中日韓越漢字。
感謝朱邦復先生發明倉頡輸入法及讓所有人免费使用倉頡輸入法。使用本《倉頡平台2022》完全免費,歡迎大家齊來推廣倉頡。
倉頡三代補完計畫
緣由
市面上如今已經有許多倉頡三代的碼表,為何還要費心力開展「倉頡三代補完計畫」?這張碼表有什麼獨特之處?
倉頡三代之前有的許多碼表中往往存在以下問題:其一,取碼存在混亂的情況,許多非Big-5漢字的取碼,包括簡體字有大量錯碼,而Big-5部分的漢字,由於歷史原因也存在一些奇怪的取碼。其二,對大陸字形不友好,很多簡體字以大陸字形取碼打不出來,導致了倉頡三代背上了「無法打簡」、「規則不適合打簡」的罵名。但實際上倉頡三代與倉頡五代的輔助字形差異很小,完全可以用來拆解簡體字。其三,對官方規則有較大的改動,以官方規則及輔助字形對漢字取碼後打不出來字。其四,長時間未有更新,在字集上遠遠落後,又或是掛羊頭賣狗肉,擴充字集中的編碼實為五代編碼,又或者是有缺字現象。
作為一個由三代入門的用戶,自然無法忍受這種狀況,因此我便從2017年開始,開展了「倉頡三代補完計畫」
倉頡五代補完計劃
內容
Cangjie5.txt
碼表。一般排序,綜合考慮字頻及繁簡(部份常用的簡化字可能排列於傳統漢字前)。
收錄中日韓統一表意文字(基本區至擴展G區)字符、中日韓兼容表意文字區中未見於統一漢字區的十二個字符,以及官方碼表中收錄的符號。
同時收錄以下 Unicode 區域的字符:中日韓兼容表意文字(除十二個視作統一漢字的字符)、中日韓兼容表意文字補充、康熙部首、中日韓部首補充、中日韓筆畫、表意文字描述字符、算籌符號(部分)、中日韓符號和標點(部分)及中日韓兼容標點(部分)。此部分字符,編碼以「z」開頭(兼容漢字「zc」,部首「zr」,筆畫「zs」,表意文字描述字符「zi」,算籌符號「zn」,其他符號「zf」)。
Cangjie5_TC.txt
碼表。傳統漢字優先(限《常用國字標準字體表》、《次常用國字標準字體表》及《常用字字形表》範圍)。
收字範圍與 Cangjie5.txt 相同。
Cangjie5_SC.txt
碼表。簡化字優先(限《通用規範漢字表》範圍)。
收字範圍與 Cangjie5.txt 相同。
Cangjie5_supplement.txt
碼表。收錄以下 Unicode 區域的字符:中日韓兼容表意文字(除十二個視作統一漢字的字符)、中日韓兼容表意文字補充、康熙部首、中日韓部首補充、中日韓筆畫、表意文字描述字符、算籌符號(部分)、中日韓符號和標點(部分)及中日韓兼容標點(部分)。此表按原始編碼收錄,編碼不以「z」開頭。
change_summary.md ※請首先閱讀此文檔。
取碼爭議、字形兼容、重碼字排序調整說明(僅記錄 Cangjie5.txt 的排序調整)。
change_details.log
碼表的詳細編輯記錄。
Cangjie5_special.txt
碼表。特別版本,收錄以下字符:Unicode 中日韓統一表意文字基本區(除去 U+9FD1 至 U+9FFF)、擴展A區(除去 U+4DB6 至 U+4DBF)、中日韓兼容表意文字(其中十二個視作統一漢字的字符)、《通用規範漢字表》、《香港增補字符集—2016》(HKSCS)。
另外,Change_summary.md#字形問題 中列出的多種字形,此表會盡數收錄。
此碼表與前面幾份碼表更新可能不同步。
碼表集文件夾內容結構:
(點擊展開)
Beta Was this translation helpful? Give feedback.
All reactions