初音ミク問題の真相は、日本支社の単なる自主規制。

たぶん。以下はネットやその技術に全く無知なシロートの戯言です。
 
「初音ミク」の画像検索結果消滅について各検索エンジンに電話してみた - GIGAZINE

まとめると、とにもかくにも今回の件はどこかの企業や利権団体とかが圧力をかけて「初音ミク」をたたきつぶそうと画策して動いたわけではなく、どちらかというと「画像検索エンジンの技術力」の差が出てきただけ、ということです。今まではあらゆる検索について「Googleが一番」だと思っていましたが、どうやら認識を改める必要があるようです。

以前からあった、反電通・反TBS感情(亀田問題、アッコにおまかせ報道など)でネットユーザーの不満が溜まってたところに、タイミング良く、って感じで盛り上がった陰謀論でしたが。
 
ホントにそうかいな、って思うのね。むしろ、そうした技術力というのは、今や「ノイズをどう除去するか」という問題なんじゃないの?
 
いやさ、画像そのものに「初音ミク」という情報が張り付けられている例はごく稀だろし、結局はその画像の周辺に書かれているテキストを読み取るしか方法は無いでしょ。でも、ウェブ検索ではごく普通に200万件近くヒットするし、グーグルの画像検索技術だけがそんな低い事あっかよ、と思う。
 
以下は2ちゃんで見掛けたコピペ。
 

特定ワード(初音ミク等)に関するページのサムネイルを意図的に置き換えか?
 
検索から除外されている画像=唐沢さんが描いた初音ミク絵、が掲載されているページ
http://www.yomiuri.co.jp/net/column/yougo/20071012nt0c.htm
 
初音ミク 唐沢なをき でGoogleイメージ検索を実行
http://images.google.co.jp/images?svnum=10&um=1&hl=ja&rlz=1B3GGGL_jaJP221JP221&q=%22%E5%88%9D%E9%9F%B3%E3%83%9F%E3%82%AF%22+%22%E5%94%90%E6%B2%A2%E3%81%AA%E3%82%92%E3%81%8D%22+site%3Awww.yomiuri.co.jp
 
で、検索結果を「次へ」々とやっていくと、最後のページに一応該当ページはヒットする(クロールされていることが分かる)が、 肝心の画像は出ずにサイトのコーナー「ネット&デジタル」のバナーに置き換わってしまっている。
 
特定のNGワード初音ミク)があるページだけ、ターゲットであるべき画像を他の画像のサムネイルに置き換えられてしまってるようだ。

手動で設定(NGワードの)をやっている可能性もあるわけだが、むしろこういうのは逆に技術があるから出来る事なんじゃねーの?もろに「初音ミク」を描いている画像を避けて、関連性の無い画像を表示するなんて余程の事じゃないかね。
 
そもそもウェブ検索だって、純粋にヒット数で見るなら、クリプトンの公式サイトよりも大手サイトやブログの方が上位に来るはず。「初音ミク」のような商品なら特に。昔、あるワードをググると、はてなダイアリーの日記ばかりヒットしていた時期もあったが、いつの間にかそんな事も無くなった。これも一種のフィルタリングを掛けているのだろう。ブログなんて所詮、シロートのノイズに過ぎない。
 
じゃあ、そんなフィルタリングを掛けて、一体誰が得するのよ?って話。電通やTBSの話は忘れるとして。
 
犯人は販売元のクリプトンか?まさか、シロート様のおかげでこれだけ美味しく盛り上がった「初音ミク」ブームをみすみすドブに捨てるような事するわけもない。これを潰そうとする陰謀論とやらが事実であったとしても、ウェブ検索で大量に引っ掛かるのだから、何の意味も無い。直接画像がヒットしなくとも、そのページに飛んで、保存出来るわけだから。
 
 
以上の点を踏まえて、少し視点を変えよう。
 
それじゃあ、「画像検索を必要とする人間って誰?」という事を考えてみる。コンテンツの内容なんてお構いなしにひたすら画像を探そうとする理由なんて、

  1. エロ画像の発見用
  2. 資料作成用
  3. ブログのネタになる画像探し用
  4. 埋もれてる絵師発見用

のどれかなんじゃないか?ハッキリ言って、検索サービスの提供側からとってみれば、商売的に何の得にもならない。
 
1.のエロに関して言えば、既に知れ渡っている話だけど、日本語版のグーグルにはデフォルトでフィルタリングが掛けられている。
 
◆「Googleでエロ画像検索する際の裏ワザ
 
詳細はリンク先で見て貰うとして、例えば「エロ」というワードで画像検索を掛けてもたいしたものは表示されないけど、一度言語設定を変えてから「フィルタリングをしない」という設定変更を加えた後(日本語版のみが、この設定そのものを表示していない)、再び同じ事を行なうと……ほら、あられも無い画像がわんさかゲット出来ちゃいます。
 
ネットのどこかで読んだけど、陰謀論を批判する論拠として「グーグルの日本支社が本社に断りもなく、勝手に検索システムの仕様を変えるなんて出来るわけが無い」という意見に対しては、断り云々はさておき、これで否定は出来るんじゃないのかな。2.3.なんてのはまさに単なる2次使用だよね。
 
最近ではどの検索サービスでも「画像は縮小されていることや、著作権で保護されている場合があります。」という断り書きが付けられている。ブログサービスにおいても、大手のFC2 BLOGなどは「イメージを最大化」をクリックして保存しようとすると「このページの表示は許可されていません。」とメッセージが出て、撥ねられてしまう。だが、一度当該ページ(その画像があるURL)に飛んでからだと可能になるけど。
 
以上の事から、辿り着いた結論としては、これらのネットサービス会社は「倫理的や著作権上の問題があるから、画像を直接検索して表示するのはこっち側(サービス提供側)がヤバいんで、ユーザーにはウェブ検索で探して貰って、自己責任で画像を取得させるというスタンス」を採っているのではないかと。しかも、それは日本の各社(支社)のみが、後々のトラブルを恐れてこっそりやってるんじゃないかと。
 
そんな感じです。あんまり言い切る程の自信は無いけど。まあ、技術的な話になると、こんなのもあるようだし。↓
 
「初音ミク」の画像実は無かった 削除「陰謀説」は「カラ騒ぎ?

「検索結果に出ない組の画像検索のインデックスは2007年8月31日(『初音ミク』の発売日)以前に収集した画像を検索対象にしているからでしょう(無いものは検索できない)」

 
その引用先として紹介されているサイト。↓
 
「検索比較: 画像検索における「初音ミク」問題の正解となる答え」

6. 小さいところにできて何故大手ができないのかの理由
 
ちなみに、ここで、何故大手ウェブ検索の方が、gooとかlivedoorのようなとこと異なり、それが出来ていないのかというと、ウェブ検索用にクロール(世界中だから1サイクルに時間がかかる)

そこから画像検索用の文章を抽出という、画像検索に集中していない集め方をしているからじゃないかな、と思います(画像検索は中の人じゃないから推測)。
 
ウェブサイトを集めてから、imgタグを分析して画像を引っこ抜きます。ウェブ検索用文章収集ついで(派生して)に、画像検索用のインデックスを作らせてもらうというのは、大量のアクセスをウェブサイトにしかける検索エンジンとしては、合理的な選択だと思います。なので、一般的に、ウェブ検索のインデックス更新サイクルよりも画像検索のインデックス更新サイクルの方が時間がかかるでしょう。
 
ただ、それに加えて、画像共有サイトも検索対象にして(そこはタグ付けがされているので簡単に画像検索対象にできるし取得に無駄がない)、そこは別サイクルで回して結果に混ぜて出せるような小型パーティッションを作っていたりしたら、最新の結果が出ないことで、規制されていると誤解されるような問題は起きなかったのでしょうが。要するに、ウェブ検索と同じで、メインインデックスとは別に、小型の高速更新インデックスも混ぜておけば、対象が巨大なウェブ検索会社でも解決できる問題です。
 
技術的には簡単に解決策が思いつくわけですが、やっていないのは、単にウェブ検索と異なりそこまでチューニングする対象ではない(ユーザー集めには必要だけど、金が儲かるわけではない)からでしょうね。

長文ダラダラ書いてそんなオチでした*1。ただ「初音ミク」潰し云々はさておき、画像検索そのものに関してはダラダラ書いてきた理由も含めて、さほど進化は進まないと思う。エロ方面に関しても、むしろ退化するだろう。
 
追記:こんなエントリーも見つけた。↓
 
◆「初音ミク」の画像検索問題 J-CASTがいい加減な記事を書く
(id:qwqw:20071020#1192806613)

http://images.google.co.jp/images?gbv=2&svnum=10&hl=ja&q=%E7%A6%8F%E7%94%B0%E9%A6%96%E7%9B%B8&btnG=%E3%82%A4%E3%83%A1%E3%83%BC%E3%82%B8%E6%A4%9C%E7%B4%A2
 

  • 時津風(9/30付けの個人サイトもヒット)

http://images.google.co.jp/images?gbv=2&svnum=10&hl=ja&q=%E6%99%82%E6%B4%A5%E9%A2%A8&btnG=%E3%82%A4%E3%83%A1%E3%83%BC%E3%82%B8%E6%A4%9C%E7%B4%A2
 
余裕で出まくるヽ(´ー`)ノ(画像は間違いなく8月31日以降)
 
大手ニュースサイトは優先的に検索してるだけかもしれませんがミクのサムネイルだけがピンポイントで消えているsite:www.youtube.com ニコニコ - Google 検索

一般的には「初音ミク」が「福田首相」「時津風」以上にニュースバリューがあるとは思えないし、当然クロールする優先度はそれぞれ異なってるだろう。よくよく考えてみたら、ウン万枚もネット上に存在する画像の「インデックス更新」をいっぺんにやる必要も無いわけで。
 
つまりは、「ロボット検索」などという言葉が少し前にあって、それを引き摺る形で「誰の介入も受けない完全中立・第三者的世界がネットにはある!」という幻想があるんじゃないのかな。だから、既存のマスメディアである電通やTBSの介入があったのだ、という陰謀論の方に“リアル”を感じてしまう。新聞にしろTVにしろネットにしろ、我々は誰かによって取捨選択された情報の断片しか見て、感じる事しか出来ない。
 
もっとも露骨な例。↓
 
グーグル、中国で新サイトを公開へ--検閲導入ではやくも波紋
 
結論を述べると、どこかの組織が情報を独占する事が無いように、その情報の取捨選択の過程と決定に透明性を持たせて、俺が快適に資料集めとエロ画像収集が可能になるようにもっと努力しろよ!
 
そういう事です。

*1:しかし日本版の「百度」では1件も引っ掛からないのに、中国版で引っ掛かるのは何故だろう?