メタマス！ - Conceptual Contexture

むっちゃ面白い。何度も書いた気がするが。
理解は圧縮。というのを読んで、ＲＤＢの正規化と圧縮と規則性の関係とか関数をデータであらわすか値であらわすか、とかについて考えてたことを連想したので、ちょっと考えてみたい。
というか、理解は圧縮、そうはっきりと言ってもらって、非常にすっきりした。
パターンとかモデルも、理解＝圧縮と、同じだ！と言ってしまっていいと思う。
えーと、例として、なにかの商品の種類と値段、というデータについて考えてみたい。まず、データとしては、

　色は赤、サイズは大、値段は１０００円。
　色は赤、サイズは小、値段は６００円。
　色は青、サイズは大、値段は１０００円。
　色は青、サイズは小、値段は６００円。

では、このデータをまず、ＲＤＢ流で整理してみたい。
まず、４つの行とも、
（色はＸ、サイズはＹ、値段はＺ円）
という形になっている。（面倒なので値段はＺ００円とはしない。）ということで非常に素直に、「表」としてみることで、情報を整理、つまり圧縮できる。

｛（色はＸ、サイズはＹ、値段はＺ）｝
　　　　　　×
｛（赤、大、１０００）、
　（赤、小、　６００）、
　（青、大、１０００）、
　（青、小、　６００）｝

で、これを見て、リレーショナルモデラーは叫ぶ。「正規化しなきゃ！」
つまり、つまりもなにも一目瞭然だが、色に関係なく、サイズが大なら１０００円、
サイズが小なら６００円という、規則性がみられる。相関関係といってもいいし、パターンといってもいい。
で、正規化をはじめるまえに、お客さんに聞いてみるかもしれない。
「いただいたデータを見ると、サイズが決まれば、値段が決まるようだし、色の違いは値段とは関係無さそうに思えます。
これは、たまたまこうなっているだけですか？それとも、今後ともサイズの違いが値段を決定すると考えて設計してもいいですか？」
と。
「サイズが値段を決める」のではなく、「値段がサイズを決める」のかもしれない。（ちょっと想像しにくいが。）

眠くなってしまったのでまた今度。