向Fcitx中导入搜狗词库文件

更新日期:2019年07月10日
@IGNORECHANGE

#1 下载搜狗词库文件(.scel)

到搜狗官网下载词库文件

下载词库以后得到一个扩展名为scel的文件。比如:demo.secl

#2 将.scel文件转化为.org文件

#!/bin/bash

# 将scel文件转化为org文件
scel2org -o tmp.org demo.scel

# 执行结束以后会得到一个tmp.org文件

#3 将.org词库与原有的.org词库进行合并

#!/bin/bash

cat pyPhrase.org tmp.org > final.org

# pyPhrase.org文件位于源码/build/src/im/pinyin/data/pyPhrase.org
# build目录是构建的时候,我们自己创建的。
# 而pyPhrase.org的源文件为源码目录/src/im/pinyin/data/pinyin.tar.gz解压所得

#4 对生成的新的.org文件进行合并去重

可以对final.org文件先执行sort命令,后执行uniq命令进行去重。

这里略过,不再详述。

#5 将.org文件转化为.mb文件

#!/bin/bash

# 将ORG文件转化为MB文件
createPYMB gbkpy.org final.org

# 注意:gbkpy.org文件位与fcitx的源码目录/src/im/pinyin/data/gbkpy.org

#6 复制.mb文件到特定位置

将生成的.mb文件复制到/usr/share/fcitx/pinyin下,但这会覆盖目录下原有的pybase.mb和pyphrase.mb文件。

也可以将其生成的.mb文件复制到~/.config/fcitx/pinyin下,但是这样就不会再读取/usr/share/fcitx/pinyin/*.mb文件了。所以和合并新词库和旧词库是十分重要的。

#7 重启FCITX

执行:fcitx -d -r

按理说重启是不应该重启系统的,但是重启FCITX会使我的桌面系统卡死,还要重启桌面,为了方便我就直接重启了。

注意事项

文中部分内容属于个人推断,并未研究过,请以文档为准。

参考文献

更新日志

  • 09/09/2017 创建文章
  • 06/30/2018 修改文章内容


ToC

#1 下载搜狗词库文件(.scel)

#2 将.scel文件转化为.org文件

#3 将.org词库与原有的.org词库进行合并

#4 对生成的新的.org文件进行合并去重

#5 将.org文件转化为.mb文件

#6 复制.mb文件到特定位置

#7 重启FCITX

注意事项

参考文献

更新日志