跳转至

📚 个性化词库与同步:打造独属于你的输入大脑

从快捷短语到几十万条的行业专属语料,再到多设备的数据漫游,万象为你提供了全套的词库接管方案。

万象的词库系统分为三个完全独立的层级。请根据你的具体需求,选择最合适的自定义方式:


⚡ 1. 自定义短语 (Custom Phrase):快捷上屏的置顶外挂

这是最简单、最轻量的自定义方式。主要用于短编码触发长短语、特殊符号串、邮箱地址等需要绝对“置顶”的内容

工作原理与配置规范

系统会读取根目录下的文本文件(如 custom_phrase.txt)并直接挂载。

  • 数据格式你想上屏的文本\t拼音编码\t组内排序权重 (注意:\t 代表制表符 Tab 键,绝对不能用空格代替!)。

  • 排序:数字仅仅是代表此文件内如果编码相同哪个靠前,数字越大越靠前。整体的排序本文件设计都是置顶**。

  • 编辑器警告:强烈建议使用 VS Code、Sublime 等现代代码编辑器,绝对不要使用 Windows 自带的记事本

⚠️ 防覆盖指南 (Patch)

为了避免万象后续更新时覆盖你的自定义短语文件,请务必在 wanxiang.custom.yaml 中将短语文件重命名挂载:

patch:
  # 将自定义短语源文件指向你新建的 my_phrase.txt
  "custom_phrase/dictionary": my_phrase

🗄️ 2. 固定词库自定义:构建你的专属行业语料

如果你手里有一份几十万条的医学、法律或二次元词库,希望它像主词库一样参与输入法的长句转写,你需要将其制作为固定词库 (Dict)

🔨 核心门槛:词库格式预处理 (刷拼音)

万象的底层数据约束

普通的开源词库(纯拼音)不能直接塞进万象!因为万象的底层模型是基于“带调拼音”甚至“声调+辅助码”构建的。

你必须先利用专用工具,将你的外部词库“刷”成与万象主词库完全一致的编码形态,保证每个字的编码与 chars 一致。

Pro版本需先刷新拼音,产物再次刷辅助码,下载下面的工具一看就懂。

👉 点击获取:万象词库刷拼音/辅助码专属工具

🧩 挂载固定词库的两种 Patch 战术

预处理完成后,你有两种安全挂载的方式(均通过 wanxiang.custom.yaml 实现):

方法 A:Packs 扩展法 (推荐,灵活解耦)

将你的词库命名为 userxx.dict.yaml(内部必须包含 name: userxx 表头)。

内部表头解析
# rime dictionary
---
name: userxx
version: "LTS"
sort: by_weight
...
patch方法
patch:
  translator/packs/+:
    - userxx  # 这里写词库名称,不要带dict.yaml

方法 B:主词库重命名法 (适合魔改级玩家)

将根目录下的 wanxiang.dict.yaml 复制并重命名为 wanxianguser.dict.yaml,在里面尽情添加你的数据。然后在 Patch 中全面接管:

patch:
  # 将所有调用主词库的节点,全部指向你的魔改版,如果不能看懂方案整体设计,则不适合使用
  translator/dictionary: wanxianguser
  user_dict_set/dictionary: wanxianguser
  add_user_dict/dictionary: wanxianguser

☁️ 3. 用户词库漫游与同步:多端无缝闭环

你在日常打字时积累的造词,会被实时记录在动态数据库中(Base为 wanxiang.userdb,Pro版为 zc.userdb)。

rime通过时序合并算法,实现跨设备的造词数据漫游。

致命警告:千万别把 Rime 整个用户目录文件夹放进坚果云/OneDrive!

直接使用网盘同步整个 Rime 工作目录,会导致动态数据库文件(UserDB)被网盘程序强制锁定,这会导致无法使用用户词,不能被输入法读取报错。

正确的做法是:利用 Rime 原生的同步机制,将数据导出(点击同步按钮)为纯文本后再进行网盘同步。只同步同步目录

📌 步骤 1:配置专属同步目录与设备 DNA

打开用户根目录下的 installation.yaml,定义你的网盘同步路径(最高级目录务必命名为 /sync)以及当前设备 ID:

# installation.yaml 配置示例
distribution_name: Rime
installation_id: "windows"  # 修改为极具辨识度的设备名称 (如 windows, mac, linux)

设定同步目录 (指向你的网盘路径) linux\mac\android这样写:

sync_dir: "/home/amz/sync"

windows这样写:

sync_dir: "D:\\home\\amz\\sync"  #双引号
sync_dir: 'D:\home\amz\sync'     #单引号

📌 步骤 2:理解数据流转与合并逻辑

执行同步后,系统会在你的网盘 /sync 目录下生成以 installation_id 命名的文件夹(如 /sync/windows/),并在里面释放出一个 wanxiang.userdb.txt 纯文本文件。

该文件的表头记录了极其严格的设备校验信息:

# Rime user dictionary
#@/db_name  zc             <-- 必须与当前方案调用的数据库名称绝对一致
#@/db_type  userdb
#@/rime_version 1.13.1
#@/tick 793
#@/user_id  windows        <-- 必须与文件夹名称、installation_id 绝对一致

📌 步骤 3:单设备强行导入或多端合并操作

  • 手动导入旧数据:如果你只有一台设备,你可以清空本地的 .userdb 文件夹,然后在 /sync/windows/wanxiang.userdb.txt 中手动添加你的历史词汇(注意:编码必须经过万象工具预处理过!)。保存后再次点击“同步”,数据就会被完美吸入并重建为本地数据库。

  • 多端完美漫游:你甚至可以伪造其他设备的数据(例如把表头的 user_id 改成 linux,放进 /sync/linux/ 文件夹下)。点击同步时,Rime 底层引擎会读取 /sync 下所有设备的数据,并按时间戳执行一次完美的冲突去重与合并!


掌控了数据,你就真正掌控了万象。