第2節 特殊文節 【目次】 【前文書】 【次文書】 【HOME】
特殊文節 ─── 区切記号・開記号・閉記号・他の記号・スペース
各種の記号やスペースを、本システムでは文節として扱い、特殊文節に分類している。形態的には、これら特殊文節は独立した文節ではなく、一般文節の一部を構成するにすぎないと考える方が自然である。しかし、検討の結果、特殊文節を独立した文節とし、他の文節との間にマス空け規則を設定する方がシステム的に簡明になるとの結論に達した。マス空け規則については、文節の分類の章を参照されたい。
本システムが区切記号として処理するのは、以下のものである。
@ 墨文の文字を無変換で分かち書きに出力するもの
句点「。」 読点「、」 感嘆符「!」 疑問符「?」
A 句読点の代用記号と見なし、句読点に変換するもの
ピリオド「.」 → 句点「。」に変換する。
コンマ「,」 セミコロン「;」 → 読点「、」に変換する。
これらは英文中では独自の意味を持つが、邦文中に現れた場合は句読点と見なして変換する。ただし、ピリオド、コンマが前後を数字に挟まれている場合は、小数点、位取り点に変換される。
ピリオドは、無変換でピリオドのまま出力することもできる(優先順位は低い)。これは、項目記号の後ろに使われる場合や、省略符として使われる場合を考慮したものである。
B 前後の文字によって処理方法が変わるもの …… 中点「・」
中点は、前後を数字(算用数字および漢数字)で挟まれている場合は、読点「、」への変換を優先し、前後を片仮名で挟まれている場合は、スペース「 」への変換を優先し、それ以外の場合は無変換を優先する。また、前後を数字で挟まれている場合で、後ろに単位が付くような場合には、中点は小数点に優先変換される。
例 2・3の例 → 2、3ノ□レイ
※「2、3」は、BASEファイルに出力されるときは、「#2#3」と変換される。(#は数符)
トーマス・エジソン → トーマス□エジソン
東京・大阪 → トーキョー・□オオサカ
1・5% → 1.5%
開記号・閉記号については、以下の15種類をサポートし、分かち書きおよびBASEファイルに出力する。
| 墨文 | 分かち書き | BASE | 点字 | 備 考 | ||||
| 「 | 」 | 「 | 」 | - | - | 第一カギ | ||
| < | > | < | > | ;' | ,2 | 第二カギ | ||
| 〈 | 〉 | |||||||
| ‘ | ’ | |||||||
| 『 | 』 | 『 | 』 | ;- | -2 | 二重カギ | ||
| “ | ” | |||||||
| ( | ) | ( | ) | 7 | 7 | 第一カッコ | ||
| 〔 | 〕 | 〔 | 〕 | "7 | 71 | 第二カッコ | ||
| 【 | 】 | |||||||
| { | } | |||||||
| ≪ | ≫ | 《 | 》 | ;7 | 72 | 二重カッコ | ||
| (( | )) | (( | )) | 77 | 77 | 点訳者挿入符 | ||
| ((□ | □)) | ((□ | □)) | 77 | 77 | 第一段落挿入符 | ||
| ≪□ | □≫ | ≪□ | □≫ | ;7 | 72 | 第二段落挿入符 | ||
この表に載っていない、次の2種類の開記号・閉記号が墨文に現れた場合は特殊な処理をするので、注意を要する。
@ 《 》で囲まれた部分はルビ(振り仮名)と見なし、分かち書きには変換されない。ルビ対象語の開始位置が明確でないときに記号「|」を墨文中に挿入しておく。
例 記号が墨文《すみぶん》に現れた → キゴーガ□スミブンニ□アラワレタ
開始|位置《いち》が明確 → カイシ□イチガ□メイカク
本システムではルビを単純に読み飛ばすのではなく、辞書中の読みの中でルビに一致するものがあれば、その優先度を高くしている。例えば「上手」という語はウワテ、ジョーズ、カミテ、ウマい、などの読み方があるが、辞書の中ではジョーズが最も優先度が高くなっている。したがって、ルビが付いていなければ、
舞台の上手の方向 → ブタイノ□ジョーズノ□ホーコー
という変換がされる。しかし、ルビが付いていると、
舞台の上手《かみて》の方向 → ブタイノ□カミテノ□ホーコー
と、正しく変換される。
※舞台の上手から現れた は、ルビなしでも ブタイノ□カミテカラ□アラワレタ と変換される。
A [ ]で囲まれた部分は入力者注と見なし、単純に読み飛ばされる。
ただし、[[ ]]で囲まれている場合は、番号付き注釈記号として扱われる。(次節参照)
他の記号として、下表に示すものをサポートする。
| 墨文 | 分かち書き | BASE | 点字 | 備 考 | |
| 〜 | 〜 | -- | 波線 | ||
| − | ー | 3 | ハイフンを長音記号と見なす場合 | ||
| − | 〜 | -- | ハイフンを波線と見なす場合 | ||
| † | ※ | ;2 | 単独注釈記号 | ||
| ‡ | |||||
| ¶ | |||||
| [[ | [ | ; | 番号付注釈記号の開始 | ||
| ]] | ] | 2 | 番号付注釈記号の終了 | ||
| . | . | 4 | ピリオド | 英文中にのみ用いる記号 | |
| , | , | 1 | コンマ | ||
| : | : | 3 | コロン | ||
| ; | ; | 2 | セミコロン | ||
| ’ | ’ | ' | アポストロフィ | ||
| ´ | ´ | @ | アクセント符 | ||
| ` | ` | ||||
| “ | “ | 8 | 引用開始 | ||
| ” | ” | 0 | 引用終了 | ||
英文中にのみ用いる記号は、邦文中に現れた場合と異なる変換をするものがある。この場合、邦文中の変換の仕方が優先される。
スペース(空白文字)については、文節の分類の章(5)に述べていること以外には、特別の処理は行わない。