Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

大佬可否阐释一下小鹤双拼挂载第三方扩展词库的思路 #2

Open
controlledentropy opened this issue Oct 10, 2023 · 5 comments

Comments

@controlledentropy
Copy link

大佬是如何做到让小鹤双拼像全拼连打一样可以调用dict_extended字典并可逐字候选的。目前尝试在二进制小鹤双拼方案上根本没路子扩展第三方词库的样子。

@DreamAfar
Copy link
Owner

DreamAfar commented Oct 11, 2023

你说的小鹤双拼是指小鹤纯双拼的吗?
如果是的话,可以参考Qiao.extended.dict.yaml这个文件,

import_tables:
  - pinyin_8105_danzi          #要加的词典文件

image

- pinyin_8105_danzi #8105单字

可逐字候选,不就是用Tab健可以切分拼音嘛
image

在手机上可以用符号绑定按键模拟Tab的效果

key_binder:
  import_preset: default
  bindings:
    - {accept: "~", send: "tab", when: always}  #手机上用~代替tab键来切分拼音

@controlledentropy
Copy link
Author

controlledentropy commented Oct 12, 2023

你说的小鹤双拼是指小鹤纯双拼的吗? 如果是的话,可以参考Qiao.extended.dict.yaml这个文件,
#手机上用~代替tab键来切分拼音

首先感谢大佬细心回复XD

我在小狼毫上小改套用了大佬的配置,使用体验良好。但是或许是同文对lua的支持有限或opencc部分文件兼容性的问题(3.2.12-14),符号表情繁简生僻字过滤中英简译功能及开关均无效,后来发现历史词汇无法持久化,一个月后切到了这个 配置配置 尝试像您的方案一样给小鹤双拼扩展清华和热词词库,发现该pure方案用的是小鹤官方的方案文件,照着您方案的配置折腾了半天结果是词库没出来,翻译器也炸了。故而想知道如果双拼要使用第三方词库,只能字定义拼写和翻译格式么?

另外,上面另一大佬的方案,我看了下双拼和音形的配置基本差别只在是否开启了四码上屏,无法tab选单字,仅仅能修改是否单字优先(所以为了保证有太极标的用户词固化正常,我甚至没有单字优先,以音形辅助的姿势使用着双拼方案,不能tab但又有候选,但又是音形的使用方式,没有您的双拼方案用起来畅快,好在反查正常且候选列有辅码,目前将就用)

虽然自然是计划完全转入音形,但生产环境决定了纯双拼无法抛弃XDrz

@DreamAfar
Copy link
Owner

你说的小鹤双拼是指小鹤纯双拼的吗? 如果是的话,可以参考Qiao.extended.dict.yaml这个文件,
#手机上用~代替tab键来切分拼音

首先感谢大佬细心回复XD

我在小狼毫上小改套用了大佬的配置,使用体验不错。不过可能是同文对lua的支持有限或opencc部分文件兼容的问题(3.2.12-14),符号表情繁简生国外字过滤中英文简译功能及开关均无效,后来发现历史词汇无法持久化,一个月后切到了这个配置配置尝试您的方案一样给小鹤双拼扩展清华和热词库,找到该纯方案用是小鹤官方的方案文件,照着您方案的配置折腾了半天结果是词库没出来,翻译器也炸了。故而想知道双拼是否要使用第三方词库,只能字定义拼写和翻译格式么?

另外,上面另一个大佬的方案,我考察了下双拼和音形的配置基本差别只在是否开启了四码上屏,无法制表选单字,只能修改单字优先(所以为了保证有太极标的用户词固化正常,我什至没有单字优先,以音形辅助的姿势使用着双拼方案,不能tab但又候选,但又是音形的使用方式,没有您的双拼方案用起来畅快,好在反查正常且候选列有辅码,目前就用)

虽然自然是计划完全转入音形,但制作环境决定了纯双拼无法抛弃XDrz

符号表情、繁简、中英文简译功能无效估计是opencc升级了,opencc文件里面不允许出现重复的行,之前小狼毫升级librime遇到过,把重复的去掉就好了。(我这个仓库的好久没更新了)

小鹤音形官方方案文件,没法像纯双拼那样扩展清华和热门词库,被写死的,跟小鹤纯双拼不一样的。

小鹤音形是以打单字为主的,我没有使用,恐怕帮不了你,以前在qq群里面好像见到过有人用音形和双拼同时用的方案,你可以网上找找看。

@controlledentropy
Copy link
Author

官方方案文件,没法像纯双拼那样扩展清华和热门词库,被写死的,跟小鹤纯双拼不一样

感谢解答,我抽空会研究以下opencc。最后一问:大佬的方案中,用户词历史是仅保存在方案数据库内么。除了读数据库手动编辑到词库内,还有其他路径能实现用户词条固化么?之前看过一个love fly方案不过没搞懂,给了两套方案互切来实现词条自动写入词库。自有词库自动固化实现的话,地三方词库其实也不关键了,大不了牺牲一些性能,把词库词条全部拷自己的字典里XDrz

@DreamAfar
Copy link
Owner

DreamAfar commented Oct 13, 2023

官方方案文件,没法像纯双拼那样扩展清华和热门词库,被写死的,跟小鹤纯双拼不一样

感谢解答,我抽空会研究以下opencc。最后一问:大佬的方案中,用户词历史是仅保存在方案数据库内么。除了读数据库手动编辑到词库内,还有其他路径能实现用户词条固化么?之前看过一个love fly方案不过没搞懂,给了两套方案互切来实现词条自动写入词库。自有词库自动固化实现的话,地三方词库其实也不关键了,大不了牺牲一些性能,把词库词条全部拷自己的字典里XDrz

rime拼音类的方案用户词默认都是保存在二进制的xxxx.userdb文件夹里面的(xxxx为方案对应词库文件名),点了用户资料同步会输出用户词的txt文件可以打开查看。

有些方案增加副翻译器来配合,可以手动造词类似五笔等的就是这样,你可以网上找一下来参考。
这有个开源的小鹤音形方案你可以看看https://github.com/amorphobia/openfly

小鹤固定原码表+自动造词调频.zip

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants