Skip to content

Commit

Permalink
Update
Browse files Browse the repository at this point in the history
  • Loading branch information
DreamAfar committed Feb 25, 2022
1 parent eaa6975 commit 320bad1
Show file tree
Hide file tree
Showing 194 changed files with 6,279,253 additions and 774,697 deletions.
46 changes: 46 additions & 0 deletions Dict詳解.dict.yaml
Original file line number Diff line number Diff line change
@@ -0,0 +1,46 @@
# Rime dict
# encoding: utf-8
#〔你還可以在這註釋字典來源、變動記錄等〕
name: "cangjie6.extended" #引用的字典名,確保與文件名相一致
version: "0.1" #請確保每次改動陞版本號
sort: by_weight #字典初始排序,可選original或by_weight
use_preset_vocabulary: false #是否引入「八股文」〔含字詞頻、詞庫〕
# max_phrase_length: 配合use_preset_vocabulary:,設定導入詞條最大詞長
# min_phrase_weight: 配合use_preset_vocabulary:,設定導入詞條最小詞頻

import_tables: #加載其它外部碼表
- cangjie6 #單字碼表由cangjie6.dict.yaml導入
columns: #此字典爲純詞典,無單字編碼,僅有字和詞頻 以Tab分隔各列,各列依columns:定義排列。
- text #第一列:字/詞【文本】
- code #第二列:code【碼】
- weight #第三列:字/詞頻【權重】
- stem #第四列:【造詞碼】
encoder: #形碼造詞規則
exclude_patterns: #取消某編碼的造詞資格
- '^z.*$'
rules: #可用length_equal:和length_in_range:定義。大寫字母表示字序,小寫字母表示其所跟隨的大寫字母所以表的字中的編碼序
- length_equal: 2 #對於二字詞
formula: "AaAzBaBbBz" #取第一字首尾碼、第二字首次尾碼
- length_equal: 3 #對於三字詞
formula: "AaAzBaYzZz" #取第一字首尾碼、第二字首尾碼、第三字尾碼
- length_in_range: [4, 5] #對於四至五字詞
formula: "AaBzCaYzZz" #取第一字首碼,第二字尾碼、第三字首碼、倒數第二字尾碼、最後一字尾碼
tail_anchor: "'" #造詞碼包含結構分割符〔僅用於倉頡〕


# cangjie6.dict.yaml
...
個 owjr 246268 ow'jr
看 hqbu 245668
中 l 243881
呢 rsp 242970
來 doo 235101
嗎 rsqf 221092
爲 bhnf 211340
會 owfa 209844
她 vpd 204725
與 xyc 203975
給 vfor 193007
等 hgdi 183340
這 yymr 181787
用 bq 168934 b'q
25 changes: 19 additions & 6 deletions Qiao.extended.dict.yaml
Original file line number Diff line number Diff line change
Expand Up @@ -3,10 +3,10 @@

---
name: Qiao.extended
version: "2020.12.30"
version: "2021.8.24"
sort: by_weight
vocabulary: essay-zh-hans
use_preset_vocabulary: true
vocabulary: essay-zh-hans #启用八股文简体字词汇表essay-zh-hans.txt,可用于简化字为主的输入方案。
use_preset_vocabulary: true #是否使用预设的词汇

# clover.base 这是单字的字库,包含所有字的拼音、字频,对应文件 clover.base.dict.yaml
# clover.phrase 这是词组的词库,包含所有基本词汇的拼音、词频,对应文件 clover.phrase.dict.yaml
Expand All @@ -16,10 +16,19 @@ use_preset_vocabulary: true
# clover.base 是不可以删除的,否则四叶草方案会失去所有文字的拼音导致导入任何词库都无效。

import_tables:
- pinyin_simp #袖珍简体字词库
# - pinyin_simp #袖珍简体字词库
# - pinyin_simp_8105 #袖珍简体字词库8105单字
- pinyin_8105_danzi #8105单字
- pinyin_simp_cihui #袖珍简体字词组
# - placeless_punct
# - clover #四叶草的单字字库
# - clover.base #四叶草的单字字库
# - clover.phrase #四叶草的词组词库

# - sys_ext # 自己平时随手偶尔添加的词汇 会导致打字有问题
# - ext # 偶尔整合的一些扩展词库 会导致打字有问题
- av # 著名表演艺术家

# 清华大学开源词库
- THUOCL_animal #动物相关词汇
- THUOCL_caijing #财经相关词汇
- THUOCL_car #车相关词汇
Expand All @@ -31,4 +40,8 @@ import_tables:
- THUOCL_lishimingren #历史名人词汇
- THUOCL_medical #医学词汇
- THUOCL_poem #诗歌词汇
# - sogou_new_words #搜狗的词汇
# - zhwiki #zhwiki词汇
- sogou_liuxing #搜狗流行词汇
- Qiao_user #个人词汇

# - sogou_new_words #搜狗的词汇
Loading

0 comments on commit 320bad1

Please sign in to comment.