2009-05-25

恐怖の Unicode 降臨?

かなり古いオピニオン(2009-02-27)だが CNET Japan "絵文字が開いてしまった『パンドラの箱』" を今日見つけて、読んでしまって、笑った。

上のリンク先の記事は、勝手に要約すると、
携帯キャリア各社が絵文字の変換表をキャリア毎に用意してしまった現状を憂い、 Google が主導で行っている「絵文字の Unicode 化」がそれのブレークスルーになる

と論じている。

これを読んでの私の感想を一言でいえば、

杞憂

天は落っこってこないってば。

内容と関係のない細かいところにまずつっこむと、 Πανδώραさん{が | の} πίθος を開けたら ἐλπίς だけが出て行かなかったって話と、このオピニオンでの「パンドラの箱」という比喩と何か関係あるの?用法、完全に間違ってない?



IT 関連のオピニオンを書こうとする記者なら、ギリシア神話はともかくとして、ほんの少しの「集合・写像」と「グラフ理論」の知識が欲しいと思う。記者だけでなく、リンク先のオピニオンの本文中に出てくる大学の教授も… えーとなんと言えばいいのか、兎に角、「かんべんしてくださいよ〜」。

と、こんな辺鄙な blog で私がつぶやいても聞こえないか。

以下、簡単に。分からない単語が出て来た人の為に、その語を説明したりはしない:「勉強してね」の一言。めちゃめちゃ基本的なので、どんな参考書で勉強しても同じだから。

---

各キャリアの絵文字を「節点」、絵文字の変換表での対応を「枝」と考えるとグラフができる。キーポイントは2つ。

1. このグラフは無向。
2. 任意の1つの連結成分は完全部分グラフであり、1つのキャリアの節点は高々1つ。

1, 2 が成り立つ理由は明らかだが、念のために:まず、変換表は可逆なので 1。次に、変換表たちは矛盾しないように作られているので 2。2 で「高々1つ」と言っている理由は、ある1つのキャリアのある1つの絵文字に対応するものが、別のキャリアには「無い」場合があるから。

だから、既存の変換表たちから Unicode を制定すると言っても全く大層なことではない:

Unicode のコードポイントと連結成分の間に全単射を1つ作れば良い

たったそれだけのこと。その際、なにか情報が付け加わるとか、大変革が起こるとか、そんなことないのさ。

新規参入のキャリアが変換表を用意する手間が云々とも上記のオピニオンは言っているが、用意する手間のオーダーの見積もり、間違ってるよ。バカバカしいから説明しないが、既存部分は整合的なのだから、共通コード表に対して用意する手間ともちろん同じオーダーで済む。記者さん、教授に何を吹き込まれたか知らないけど、いつも自分の頭で考えるようにしてね。

---

いいなあ、あっちはエキスパートとしての原稿料貰えてるんだよね。しかも超長文。ページ単価いくらなんだろう。こっちは書いてもな〜んにも貰えないし、文もあたりまえのことしか書いてないので必然的に短い。

私は原稿料ないどころか、むしろ、あちこちで恨みをかってたりして。大学の教授高枝ばさみで刺されるとかね。(笑)
この下を閉じる このページを印刷

Comments 0