ようこそゲストさん

したっぱプログラマーの日記(The diary of a minor programmer)

2007/06/27(水) 方言による情報の圧縮

雑談

うちのチームには、地方出身者が多い。
先日、会社で方言の話になった。

話している内に、方言のなかには、圧縮率の高い言葉があることに気づいた。

例えば、ある地方では、
「これは、かかるのですか?」
「かー、かかーか?」
と言うらしい。

これだと、「ー」をカウントしなければ、圧縮率は40%にもなる。

これを利用して、日本各地の圧縮率の高い方言を部分的に抜き出して、あらたな方言を作り出せば、
1音あたりの情報量が多い最強の方言を作り出すことが可能なのではないかと思った。


P.S その1
実は、
「これは、かかるのですか?」
は、
「これ、かかるの?」とも言えます。

ただ、個人的な思いこみかもしれませんが、丁寧語を使わなくても、とがった表現になりにくいのも、方言の利点だと考えます。
「かー、かかーか?」は、丁寧な「これは、かかるのですか?」の代わりになりうるとして、計算してみました。


P.S その2
調べていたら、方言コンバータなるものを見つけた。
参考までに:http://www.netricoh.com/contents/variety/hougen/
(ただし「言葉遊び」の目的で、正確な変換を目的としたものではないそうです。)

1: Ackey 2007年06月28日(木) 午後4時38分

寒い地方に行くほど圧縮率は高くなる傾向にあるようです。
津軽弁とか、「私」は「わ」、「あなた」は「な」になります。
大きく口を開けて冗長にしゃべると奥歯に雪が積もるからだといなかっぺいが昔言っていました。

北海道は明治以降の人工的な物であんまり関係ないようですが・・・

2: ぴかにぃ 2007年06月28日(木) 午後6時15分

圧縮率が高くなるのは,互いの認識の共通部分が大きいということもあるよね.

ファイルの圧縮/展開も,その作法が互いに共通認識としてあるからこそ,転送する(伝える)量が少なくて済むところとか.

# 前のコメントにてお祝いの言葉をいただき,
# どうもありがとうございました.
# 遅くなってしまいすみません.

3: わけん 2007年06月28日(木) 深夜0時00分

> Ackeyさん
僕も、それ聞いたことがあります!
いろいろな東北弁を組み合わせたら最強方言が作れそうですね。

> ぴかにぃさん
>互いの認識の共通部分が大きい
そうですね。「わ」とか、「な」と言われても、共通認識がないと、なんのことだかわかりませんからね。

># 遅くなってしまいすみません.
全然です。こちらこそ、変なところでお祝いの言葉を伝えて申し訳ありませんでした。


名前:  非公開コメント   

  • TB-URL  http://wkpn.net/blog/adiary.cgi/0528/tb/