Googleって世界のコンテンツDB作ってるんじゃないだろうか? それなら検索エンジンでのオリジナリティ判定もできそうだ

以前からGoogleは世界のコンテンツのDB化にご執心だ。
歴史的な建物や美術館、そして美術品そのものをどんどんDB化しているのだ。
つい最近も「Made in Japan: 日本の匠」を公開したところだ

Google Cultural Institute

GoogleのコンテンツDBは思っているよりも巨大で複雑なのだろうと思う

考えてみても世界中のあらゆるコンテンツを集めているGoogleは巨大なDBを構築しているはずだ。
その中には写真で見る美術品や工芸品、建築やその他多数のコンテンツが格納されている。

文字であらわされたものよりもこうした形や色彩で表現されているコンテンツのほうが管理が難しいことはすぐに分かる事だ。
こうした管理の難しいコンテンツを納めたGoogleのコンテンツDBは我々が思っているモノよりも複雑なのだろうと思う。

さらに文字情報では無いコンテンツをDBに納めるとなると手間が掛かるのも確かだ。
コンテンツをデータ化する手法もGoogleは確立しているという事だ。

美術品もそうだがあらゆる書籍も格納されている?

前述のようにデータ化するのが難しいコンテンツをDB化しているという事はデータ化の簡単な文字情報はすでにかなりの蓄積があると見るのが自然だろう。

つまり世界中のあらゆる書籍、楽曲の歌詞、Web上の文字情報等々の蓄積があるのだろう。
我々の想像を絶するコンテンツDBが構築されていると思ってよいと思うのだ。

世界中のあらゆるコンテンツを飲み込んでしまうGoogleのコンテンツDBはそういうモノなのではないだろうか。
どんどん想像が膨らんでしまうのだった。

文字文化は全て入っていると思ったほうが良いだろう

これでどうなるのか?
あくまで管理人の想像だが・・・。

こうして管理人がブログで書いた記事はクローラーにより取得されてDBに格納され世界中のコンテンツと比較されるのだ。
そしてこの記事が他のあらゆるコンテンツと比較されることによりコンテンツのオリジナリティー度が判定される。
さらにこの記事がユーザーに役に立つかどうかという判定もされたうえでインデックス登録されるという仕組みになっているのではなかろうかと想像する。

きっと気の遠くなるようなこうした作業をしているに違いない。
世界のあらゆるコンテンツを飲み込むGoogleのコンテンツDBは凄いことになっていると想像を巡らせるのだった。

今回はこのへんで
では