2009-02-16

'タイ語の"辞書'式順序"

タイ語の辞書をいくつか持っているが、いちばん頻繁に使っているのは

冨田竹次郎 編「タイ日大辞典」
発行 日本タイクラブ, 発売 めこん, 1997.
ISBN978-4-8396-0114-3

だ。とても良い辞書だと思う。なんだか楽しくなる、そんな感じがする辞書だ。

ただ、部数が出ないから仕方がないが、とっても高価だ。もう、編者は故人なので改訂版が出ることはおそらくない。少し、細かいところがいろいろ…それが残念だ。

---

タイ文字に関していろいろ書いたが、辞書だけではなく、ネット上にある情報も参照してみた。

そうしたら、タイ語の情報処理を行う研究をしている人が居られるのを見つけた。で、言語固有の問題点として、

(誤)タイプライタの打鍵順のコーディング (TIS-620 とそれの上位互換で定められた Unicode) は辞書式順序のコード化ではないので、ソートの際などに、将来問題が生じる可能性がある

と書いてあった。

違うよ

タイプライタの打鍵順でコーディングされていても、「文字として書かれている情報」は全く落ちていない。なぜなら、コーディングされた情報でタイプライタで印刷して文字にできるわけだから、当然のことだ。

言語固有の、正しい問題点(?)は、TIS-620 とは無関係の次の2つだ:

(正)1. タイ語の辞書の配列順は発音と関係が薄い。とくに母音符号系の内部構造は無視されている。
(正)2. タイ語の辞書の配列順は 声調記号/黙音記号/短音記号 の違いを同一視すれば "辞書式順序" である。

1 はタイ語の文字体系の問題だ。一般に、文字体系にそういう問題があり得ることは日本語を考えてみればすぐ分かる:日本語を例えば漢字でソートしても結果として得られる順にほとんど意味がない。日本語は極端すぎるが、タイ語もそういう問題がある、ということ。だからこれを解決するには、日本語で「読み」がソートキーとして必要なように、タイ語も「潜在母音の有無/一字再読」などの付加情報が必須だ。

[おまけ. タイ語の辞書の配列順(後述)が母音符号系の構造を無視しているのは、ある意味当然で、「読み方が分からないから辞書を引く」という要求に応えるためだ。綴字のシステムを知らなくても字づらだけで引けて、発音や意味は辞書から分かる方がはるかに役に立つ。逆に、綴字に関する知識があったとしても、その知識は使わないようにして機械になったつもりで辞書は引けるから、何の問題も起きない。]

2. はタイ語の辞書の説明自身が混乱している。上であげた冨田辞書の該当ページに私は落書きしてある(下の写真)。



辞書だからといって、その配列順は必ずしも数学的にいう "辞書式順序" とは限らない:例えば漢和辞典は部首や画数の順に並べてある。1つの "全順序" で項目を並べて説明を記述したもの、これが一般的にいう「辞書」である。"辞書式順序" ならば "全順序" だが逆は成り立たない。

冨田辞書をはじめとするタイ語辞書の配列順に関する正しい説明が次の画像だ(クリックすると大きくなるよ):


---

情報処理の関係での結論:敵は本能字

この下を閉じる このページを印刷

Comments 0