スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。


“真相は” 「なぜかNGワードに初音ミクが入った」可能性?…ヤフーとGoogleは「意図的削除はしてない」と発表

Yahoo!JAPANとGoogleの画像検索で、「初音ミク」を検索した際に適切な結果を表示できない問題で、両社は22日、「『初音ミク』というキーワードについて、検索からの削除依頼はなく、意図的に落としたわけではない」と説明した。両社とも原因は調査中。検索サーバは米国にあり、両社とも米国のスタッフと協力して対策を進めているため、解決までにはまだしばらく時間がかかりそうだ。



 国内の検索エンジンは現在、Yahoo!JAPANとGoogleが8割以上のシェアを両社が握っているが、この騒動を受けてネット上では、適切な検索結果が出るMSN「Live Search」やライブドア、gooなどの画像検索への評価が高まっている。

 Yahoo!JAPANやGoogleで、「初音ミク」で画像検索しても適切な結果が出ないことが騒がれ始めたのは10月17日。Yahoo!JAPANは検索結果がゼロ件、Googleは、初音ミクとは関係ない画像が大量にヒットするという状態だった。
ヤフーの画像検索では21日ごろから、タイミングによっては検索結果が表示されるようになったがまだ不安定な状態だ。

 「初音ミク」発売元で画像などの権利を持つクリプトン・フューチャー・メディアは「削除依頼などは一切行っていない」としており、ヤフーも「『初音ミク』というキーワードへの削除依頼は受けておらず、意図的に落としたわけではない」と説明。
Googleも「削除依頼があって落としたということは100%ない」とコメントしている。

 「2ちゃんねる」にはこの問題に関するスレッドが乱立。「本スレ」は異例のスピードで進行し、22日までに74まで伸びた。ネット上では検索から“消えた”理由についてもさまざまな指摘が出ており、「Yahoo!JAPANとGoogleは、画像のクローリング頻度がMSNなどより少ないため、検索結果インデックスに反映されるタイミングが他社よりも遅いのでは」という可能性も指摘されている。

 ただ、Google日本法人によると画像検索のクロール頻度は「公称」で約4週間に1回。初音ミクが発表された8月31日から今回の騒ぎまで1カ月半以上経っている(ちなみに9月半ばには、初音ミクのイラストを描くことがネット上でブームになり始めている)。

検索に詳しいある技術者も「クローリングが遅いせい」という見方に対して懐疑的だ。「Yahoo!JAPANやGoogleの能力から考えると、インデックスのデータが古いというのはちょっとありえないのでは」と彼は言う。

 クローリングの問題ではないとすれば例えば、「初音ミク」というキーワードが、検索が難しい特殊な単語だったという可能性はあるだろうか。前出の技術者はこの見方も否定する。「『初音ミク』という言葉に検索 特性として特殊なことは一切ないし、あったとしても、『画像検索以外ではヒットしている』という事実の説明が付かない。何らかの恣意的な操作が働いていることは間違いないのでは」

 この技術者は「あくまで憶測だが」と断った上でこんな可能性を示唆する。
 「画像検索用のNGワードフィルタに、何らかの事情で『初音ミク』というキーワードが入ったのでは。
 フィルタが存在するというのは周知の事実で、Yahoo! JAPANとGoogleが、同じ会社が提供するデータを部分的にでも使ってフィルタを構成しているならば、両者が同期しているというのも不思議ではない」

 もしそれが真相だとして、なぜNGワードに初音ミクが入ったかはやはり不明だ。「担当者の入力ミスかもしれないし、突発的理由で入ったり外れたりするようなアルゴリズムなのかもしれないが……」。彼の指摘もあくまで憶測の範囲を出ず、真相は不明だ。

 適切な検索結果が表示されるgooの画像検索について、運営元のNTTレゾナントは「画像検索はNTT研究所の独自技術を採用している。『初音ミク』に関しては、検索結果に手を加えておらず、そのまま結果が表示されている」と説明する。
 ライブドアの場合は、ブログを中心に検索する仕組みを採用しているといい、「初音ミク」の画像検索結果は現在、前日までの画像がインデックスに反映されている状態だという。

MSNは9月末に検索精度を高めるリニューアルを行ったばかり。広報担当者は「他社よりも適切な結果が出るとすれば、精度を上げた結果が出ているかと認識している」とコメントした上で、「この件に関して問い合わせが多くって驚いている。同じ言葉を複数の検索エンジンで検索し、その結果を比較するということがここまで大規模に行われたのは、今回が初めてでは」と話す。

 検索技術がネット上の情報は“宝の山”に変えた一方、「Google八分」という言葉が示すように、「検索結果は恣意的に操作されているのでは」という疑いや不安をネットユーザーは抱えてきた。
 今回の騒動で、ユーザーが漠然と抱いていた不信感に、「初音ミク」という分かりやすいアイコンを介して「やっぱり」という心情的な根拠を与えてしまった面がある。ネットで話題のキャラクターの画像が大手2社の検索で同時にヒットしないという光景は、ネットユーザーの目の前で、誰でも分かる形で起きた“事件の現場”だ。1人1人が目撃者として参加した議論は白熱し、「初音ミクのヒットを脅威に思ったオールド企業などが圧力をかけて検索結果から外したのだろう」―といった、現時点では証拠らしきものがない「陰謀説」まで語られた。

 無敵で鳴らしてきたYahoo!やGoogleの画像検索の精度が実は他社に劣っていたのか、それとも別に理由があるのか―真相が分かるまでにはまだ時間がかかりそうだが、「Yahoo!やGoogleの検索が最も精度が高くて多くの検索結果がヒットするはず」と利用してきたユーザーの不信感はぬぐえない。「初音ミク ゼロ件」という結果を表示するWebページの白さには、ネットがよって立って
 いる土台と「正しい検索結果」というものについて、ユーザー1人1人に再考を迫る衝撃があった。
 (以上、一部略)
http://www.itmedia.co.jp/news/articles/0710/22/news088.html


事実が確認されたことと、検証中のものをまとめ。 ver.23

●否定派も陰謀派も全てを合理的に説明できた人はいない。
・TBS偏向報道。→10/23「謝罪する気はない」とコメント
・Wikipedia初音ミク削除騒動→交通新聞社のDEN助 。伊達杏子編集保護。
・Yahoo、Google、百度などでミクが見つからない。Yahoo中国、百度中国は正常。
・9月25日、10月2日、5日「ミクは見つからなかった」とブログでの報告がある。
・2ch内では以前は検索できたという報告が多数あり。証拠はない。
・クリプトン(ミクの会社)公式コメント「削除の依頼はしてない」
・Google公式コメント「たまたま結果から落ちている」「必ず復帰させる」。
・J-cast憶測記事「MSNにミクの画像が出るのは、10月に更新したからなのだという。」
 →MSN公式コメントで、テキストは強化したが、画像は従来通り。
・Yahoo ミク画像復活(手動またはフィルタ解除)。
 AltavistaはYahooからミク画像を参照している。つまり元からキャッシュはある。
・「伊達杏子 復活」の検索結果が騒動前後で変わった←都合の悪い内容
・「初音ミク 唐沢なをき」の検索結果が騒動前後で変わった←都合の悪い内容
・Ask.jp「Vocaloid」でAtsune Mikuが見つかる
・現在Googleの画像キャッシュは2ヶ月くらい前の古いデータ(一部最新)を表示している。
・画像とテキストのクロール結果を同期もさせずにデタラメに関連付けている。←重大なバグ
・最近のネタは見つかりにくい。ニュースサイトなどは見つかる傾向にある。
・10月10日のGoogleニュースはミクのサムネ付(J-CASTニュース)→キャッシュはあるはず。
・「史上最強のイメージ検索」の看板は景品表示法に触れる。
・Youtubeのサムネの件は最近のデータがない+説明文が長いとサムネ非表示で解決済み
・Googleニュースのトップページに来た記事が優先されるのではないか?→検証中
・なぜか「亀田 反則」の画像がクロールされ始める→検証中
・Mixiキーワードランキング操作→ほぼ確定 
http://www.nicovideo.jp/watch/sm1318761
・Colorsの工作員→ぐるっぽ経由かもしれないため検証中
・楽天ブックスで買えない→商品在庫が少ないせいかも。検証中
スポンサーサイト

この記事に対するコメント

この記事に対するコメントの投稿



管理者にだけ表示を許可する


上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。