Tuesday, November 07, 2006

文字

仕事で一日、文字と格闘した。伝統的な日本語コードで扱いにくい
旧字体や人名漢字の画像があって、その一つ一つの文字のコードを
ちまちま探す作業。見たことあるようで微妙に違う文字のパレード。

最初は何も考えずに一文字一文字を取り出して眺めては総画を数え、
部首を佐賀市 もとい 探し、読みを考えて、無駄な苦労を味わった。
途中で Google 先生に訊いてみたところ、いい資料を出してくれた。

それでも作業の本質は変わらない。目視。目 grep。目 sed。目 tr。
文字って拾うものなんだ。写植の職人さんは偉いな。字がバラけて
意味の無い記号に見えてくる。ゲシュタルト崩壊キター。やっほー。

やや壊れな状態を自覚しつつも、なんとか作業は完了。脳内麻薬に
半ばラリって作業したので、ダブルチェックしてみる。…何てこと。
対象の文字を拾いきってから、法則性に気づいた。遅いよ…>自分

5 Comments:

At 05:43, Anonymous Anonymous said...

力作業、乙です。(^ ^;
でも日本語(っていうか漢字)ってなんであんなに種類があるんでしょう。
英語だったらアルファベットだけじゃないですか。
奥深いって言ったらそれまでですけどね。

 
At 08:21, Anonymous Anonymous said...

日本に限らず、書く事以外に、
発音ってやつも厄介ですよね。
特に地方に行くと、イントネーションとかが
・・・・・・お爺ちゃんお婆ちゃんに
突っ込まれまくった記憶が何処かにあります。

 
At 11:18, Blogger sempreff said...

>ばる

表は埋めたので、各種実験用のネタにできるよ♪
最近停滞気味な例の案件も、これでちょっとは前に進むかな…

字の数については、漢字の数とアルファベットの数を比較するのはフェアじゃないんだって。比較するなら、アルファベットの「組合せの数」と比較するべきなんだってさ。2 へぇ。

>ノブ氏

我が家ではアクセント戦争が勃発するので、「アクセント辞典」を常備しています。が、あんまり役に立ちません…

 
At 12:49, Anonymous Anonymous said...

コメントのコメントのコメント
アクセント辞典なんてあるんですね。私もアクセントがおかしいとよくいわれます。。東京育ちなのになぁ。
到底全ての漢字は書けませんが、でもある程度は書ける。日本人てば、すごいですよ~!!

 
At 23:30, Blogger sempreff said...

>takako 殿

アクセントは、親とか小さい頃の友達とかに影響されるらしいっすね。今時の東京は日本全国から生まれも育ちも違うコたちが集まってるから、いい具合にミックスされてきてると思うですよ。

 

Post a Comment

<< Home