Skip to content

Commit

Permalink
Update tutorial
Browse files Browse the repository at this point in the history
  • Loading branch information
forFudan committed Dec 20, 2023
1 parent 9f39fb1 commit 4665d69
Showing 1 changed file with 22 additions and 6 deletions.
28 changes: 22 additions & 6 deletions docs/learn.md
Original file line number Diff line number Diff line change
Expand Up @@ -9,6 +9,7 @@ language: zh

<!-- omit in toc -->
# 宇浩输入法详细教程和规则细节

{: .no_toc }

<details open markdown="block">
Expand All @@ -33,6 +34,7 @@ language: zh
本教程中的「输入法」,特别指代上文中提到的第一阶段,亦即:用户将汉字,用一定规则,编成一串字母、数字、符号的组合,输入电脑中,并获得想要的汉字。

#### 输入法种类

{: .no_toc }

输入法,根据其特点,一般分为三类
Expand All @@ -51,6 +53,7 @@ language: zh
>因此,「宇浩」繁简通打输入法,是一种形码输入法。
#### 形码和音码的对比

{: .no_toc }

形码输入法和拼音最大的区别,在于拼音输入法,知道读音,便能输入汉字。而形码输入法,知道写法,便能输入汉字。
Expand Down Expand Up @@ -155,6 +158,7 @@ language: zh
[![宇浩输入法宋体字根图](../image/yulight.png)](../image/yulight.png)

#### 字根大码

{: .no_toc }

光华方案中,字根大码是按照字根第一笔的笔画来制定的。同五笔一样,字根按照笔画分区。
Expand Down Expand Up @@ -199,6 +203,7 @@ language: zh
>P 文门亦米走之底(辶chuò),病头(疒)麻穴衣字旁(衤)。
#### 字根小码

{: .no_toc }

字根的小码,都是尽量从它汉语拼音包含的字母中选取。有以下规律:
Expand All @@ -224,6 +229,7 @@ language: zh
[![yustar](../image/yustar.png)](../image/yustar.png)

#### 字根大码

{: .no_toc }

星陳方案中,拥有相似字形的字根会抱团出现,如郑码、徐码等。
Expand All @@ -241,26 +247,27 @@ language: zh
| E | 亻𠂇隹 几殳風 乚彑母 |
| F | 一 未末 手扌龵 尤尢 |
| G | 丿不竹气𧘇艮 乃廴 十黑黽 |
| H | 土士壴走 匚臣牙 寸𬺰 犬丂户 |
| H | 土士壴走 匚臣牙 犬丂户 |
| I | 宀穴 小尚 二亍 火灬业 |
| J | 日曰 早古 上丄下丅丁 目且見貝 缶矢 王示 |
| K | 丶乀 了子予 立辛 弋戈戊 八食 卯纟 |
| J | 日曰早古 上丄下丅丁 目且見貝 缶矢 王示 |
| K | 丶乀八食 寸𬺰 了子予 立辛 弋戈戊 卯纟 |
| L | 兀丌耳 口舌 巛川三 |
| M | 广疒麻鹿 千壬禾夭毛豸 乌鸟 刀刂 辰{畏下} |
| N | 水氵 厶幺 长匕 干甫 |
| O | 己已巳巴 大夫𡗗龶 也乜 辶之 糸钅 |
| P | 止龰足齒 酉西 生牛工 阝 |
| P | 止龰足齒 酉西 生牛工 |
| Q | 丷丬羊米 自身 虫 |
| R | 心忄 人合僉 咼骨 九瓦 |
| S | 艹卅世革 而面 用力乂 |
| T | 方文夂亦亡亥豕 金门 |
| U | 爪瓜 罒皿 長镸髟 丨卜虎鹵〢非其 山巾 舟 |
| V | 田甲里禺魚(田不出头或下出头) 石厂 豸习 |
| V | 田甲里禺魚(田不出头或下出头) 石厂丆 豸习 |
| W | 月勹 囗凵丩屮(上框) 馬儿 |
| X | 冖𠂊夕饣欠鱼 车七 衤 |
| Y | 乙飛 |
| Y | 乙飛阝 |

#### 字根小码

{: .no_toc }

星陈方案使用强音托,字根小码 85% 以上情况下都是汉语拼音的第一个字母(yi 取 y,yu 取 v)。故而大部分的字根小码不用特别记忆,可以猜出来。
Expand Down Expand Up @@ -776,6 +783,7 @@ for div_i, div_j in permutation(divs, 2): # 俩俩取候选拆分比较
>- 「中华人民共和国」:这是一个七字词,所以我们只看前三字和最后一字「中」、「华」、「人」、「国」。「中」的编码为`〔口丨・LMsv〕`,「华」的编码为`〔亻匕十・ERDi〕`,「人」的编码为`〔人・Te〕`,「国」的编码为`〔囗王丶・NGOd〕`。因此,「中华人民共和国」的编码为`〔口亻禾囗・LERN〕`
### 词语输入的优缺点

{: .no_toc }

用词语的方式进行输入,优点在于降低了每个字的平均码长。
Expand Down Expand Up @@ -830,6 +838,7 @@ for div_i, div_j in permutation(divs, 2): # 俩俩取候选拆分比较

<!-- omit in toc -->
#### 散件不分割

{: .no_toc }

有一部分字根,本身存在离散的部件,比如「戈」字右上的点、「犬」字的右上的点、「三」字的三个横等等。为了保证拆字的直观,保证检字(尤其是大字集下)的便捷性,我们需要对字根的连续性做出要求,并将它认定为字根的内在属性。
Expand All @@ -846,6 +855,7 @@ for div_i, div_j in permutation(divs, 2): # 俩俩取候选拆分比较
<!-- omit in toc -->
#### 竖向不包夹

{: .no_toc }

不少字根中存在若干分散的部件,比如:
Expand All @@ -867,6 +877,7 @@ for div_i, div_j in permutation(divs, 2): # 俩俩取候选拆分比较

<!-- omit in toc -->
#### 横间不穿心

{: .no_toc }

为了使拆分更加直观,符合笔顺,防止字根交叉粘连,我们规定:
Expand All @@ -883,6 +894,7 @@ for div_i, div_j in permutation(divs, 2): # 俩俩取候选拆分比较

<!-- omit in toc -->
#### 口中无整画

{: .no_toc }

口(音`kǒu`),囗(音`wéi`)。这两个根如何区分?
Expand All @@ -907,6 +919,7 @@ for div_i, div_j in permutation(divs, 2): # 俩俩取候选拆分比较

<!-- omit in toc -->
#### 日曰之辨

{: .no_toc }

不少输入法对与「日」「曰」两字的区分,比较复杂。大概有两种情况:
Expand All @@ -922,12 +935,14 @@ for div_i, div_j in permutation(divs, 2): # 俩俩取候选拆分比较

<!-- omit in toc -->
#### 勹𠂊之辨

{: .no_toc }

「旬」的外框「勹」,同「敖」左下的「𠂊」都是撇加横折钩。宇浩输入法不做区分。

<!-- omit in toc -->
####

{: .no_toc }

这里对「点」的拆分作出解释:
Expand All @@ -944,6 +959,7 @@ for div_i, div_j in permutation(divs, 2): # 俩俩取候选拆分比较

<!-- omit in toc -->
#### 人八入之辨

{: .no_toc }

「人」「八」「入」三字易混,这里做出区分:
Expand Down

0 comments on commit 4665d69

Please sign in to comment.