From 4665d6914b97e804021fb007fa799b550b01f6c3 Mon Sep 17 00:00:00 2001 From: "Yuhao Zhu, PhD, FRM" Date: Wed, 20 Dec 2023 19:44:28 +0100 Subject: [PATCH] Update tutorial --- docs/learn.md | 28 ++++++++++++++++++++++------ 1 file changed, 22 insertions(+), 6 deletions(-) diff --git a/docs/learn.md b/docs/learn.md index d26c871..e148ce0 100644 --- a/docs/learn.md +++ b/docs/learn.md @@ -9,6 +9,7 @@ language: zh # 宇浩输入法详细教程和规则细节 + {: .no_toc }
@@ -33,6 +34,7 @@ language: zh 本教程中的「输入法」,特别指代上文中提到的第一阶段,亦即:用户将汉字,用一定规则,编成一串字母、数字、符号的组合,输入电脑中,并获得想要的汉字。 #### 输入法种类 + {: .no_toc } 输入法,根据其特点,一般分为三类 @@ -51,6 +53,7 @@ language: zh >因此,「宇浩」繁简通打输入法,是一种形码输入法。 #### 形码和音码的对比 + {: .no_toc } 形码输入法和拼音最大的区别,在于拼音输入法,知道读音,便能输入汉字。而形码输入法,知道写法,便能输入汉字。 @@ -155,6 +158,7 @@ language: zh [![宇浩输入法宋体字根图](../image/yulight.png)](../image/yulight.png) #### 字根大码 + {: .no_toc } 光华方案中,字根大码是按照字根第一笔的笔画来制定的。同五笔一样,字根按照笔画分区。 @@ -199,6 +203,7 @@ language: zh >P 文门亦米走之底(辶chuò),病头(疒)麻穴衣字旁(衤)。 #### 字根小码 + {: .no_toc } 字根的小码,都是尽量从它汉语拼音包含的字母中选取。有以下规律: @@ -224,6 +229,7 @@ language: zh [![yustar](../image/yustar.png)](../image/yustar.png) #### 字根大码 + {: .no_toc } 星陳方案中,拥有相似字形的字根会抱团出现,如郑码、徐码等。 @@ -241,26 +247,27 @@ language: zh | E | 亻𠂇隹 几殳風 乚彑母 | | F | 一 未末 手扌龵 尤尢 | | G | 丿不竹气𧘇艮 乃廴 十黑黽 | -| H | 土士壴走 匚臣牙 寸𬺰 犬丂户 | +| H | 土士壴走 匚臣牙 犬丂户 | | I | 宀穴 小尚 二亍 火灬业 | -| J | 日曰 早古 上丄下丅丁 目且見貝 缶矢 王示 | -| K | 丶乀 了子予 立辛 弋戈戊 八食 卯纟 | +| J | 日曰早古 上丄下丅丁 目且見貝 缶矢 王示 | +| K | 丶乀八食 寸𬺰 了子予 立辛 弋戈戊 卯纟 | | L | 兀丌耳 口舌 巛川三 | | M | 广疒麻鹿 千壬禾夭毛豸 乌鸟 刀刂 辰{畏下} | | N | 水氵 厶幺 长匕 干甫 | | O | 己已巳巴 大夫𡗗龶 也乜 辶之 糸钅 | -| P | 止龰足齒 酉西 生牛工 阝 | +| P | 止龰足齒 酉西 生牛工 | | Q | 丷丬羊米 自身 虫 | | R | 心忄 人合僉 咼骨 九瓦 | | S | 艹卅世革 而面 用力乂 | | T | 方文夂亦亡亥豕 金门 | | U | 爪瓜 罒皿 長镸髟 丨卜虎鹵〢非其 山巾 舟 | -| V | 田甲里禺魚(田不出头或下出头) 石厂 豸习 | +| V | 田甲里禺魚(田不出头或下出头) 石厂丆 豸习 | | W | 月勹 囗凵丩屮(上框) 馬儿 | | X | 冖𠂊夕饣欠鱼 车七 衤 | -| Y | 乙飛 | +| Y | 乙飛阝 | #### 字根小码 + {: .no_toc } 星陈方案使用强音托,字根小码 85% 以上情况下都是汉语拼音的第一个字母(yi 取 y,yu 取 v)。故而大部分的字根小码不用特别记忆,可以猜出来。 @@ -776,6 +783,7 @@ for div_i, div_j in permutation(divs, 2): # 俩俩取候选拆分比较 >- 「中华人民共和国」:这是一个七字词,所以我们只看前三字和最后一字「中」、「华」、「人」、「国」。「中」的编码为`〔口丨・LMsv〕`,「华」的编码为`〔亻匕十・ERDi〕`,「人」的编码为`〔人・Te〕`,「国」的编码为`〔囗王丶・NGOd〕`。因此,「中华人民共和国」的编码为`〔口亻禾囗・LERN〕`。 ### 词语输入的优缺点 + {: .no_toc } 用词语的方式进行输入,优点在于降低了每个字的平均码长。 @@ -830,6 +838,7 @@ for div_i, div_j in permutation(divs, 2): # 俩俩取候选拆分比较 #### 散件不分割 + {: .no_toc } 有一部分字根,本身存在离散的部件,比如「戈」字右上的点、「犬」字的右上的点、「三」字的三个横等等。为了保证拆字的直观,保证检字(尤其是大字集下)的便捷性,我们需要对字根的连续性做出要求,并将它认定为字根的内在属性。 @@ -846,6 +855,7 @@ for div_i, div_j in permutation(divs, 2): # 俩俩取候选拆分比较 #### 竖向不包夹 + {: .no_toc } 不少字根中存在若干分散的部件,比如: @@ -867,6 +877,7 @@ for div_i, div_j in permutation(divs, 2): # 俩俩取候选拆分比较 #### 横间不穿心 + {: .no_toc } 为了使拆分更加直观,符合笔顺,防止字根交叉粘连,我们规定: @@ -883,6 +894,7 @@ for div_i, div_j in permutation(divs, 2): # 俩俩取候选拆分比较 #### 口中无整画 + {: .no_toc } 口(音`kǒu`),囗(音`wéi`)。这两个根如何区分? @@ -907,6 +919,7 @@ for div_i, div_j in permutation(divs, 2): # 俩俩取候选拆分比较 #### 日曰之辨 + {: .no_toc } 不少输入法对与「日」「曰」两字的区分,比较复杂。大概有两种情况: @@ -922,12 +935,14 @@ for div_i, div_j in permutation(divs, 2): # 俩俩取候选拆分比较 #### 勹𠂊之辨 + {: .no_toc } 「旬」的外框「勹」,同「敖」左下的「𠂊」都是撇加横折钩。宇浩输入法不做区分。 #### 点 + {: .no_toc } 这里对「点」的拆分作出解释: @@ -944,6 +959,7 @@ for div_i, div_j in permutation(divs, 2): # 俩俩取候选拆分比较 #### 人八入之辨 + {: .no_toc } 「人」「八」「入」三字易混,这里做出区分: