最近twitter界隈で、食べログのアルゴリズム、旅行予約サイトの価格矛盾、現在サイトを見ている人の数の嘘?が露わになってきています。
ちょっと探ってみよう。
(調査した人を基に)
まずは誰もが知っている「食べログ」
これを知ったのは田端大学の田端さんのツイートを見てから。
食べログ3.8問題を検証 - 食べログの評価は「3.8を超えると3.6に下げられる」という話の真実性を、
— 田端信太郎 @田端大学塾長である! (@tabbata) October 8, 2019
食べログの評価の分布の偏りを調べることで調査しました。 https://t.co/1GQa9Ep0v5
まじかよ食べログ、、、
ここからはリンク先の「食べログ3.8問題を検証」を参考に
評価点に操作が加えられているなら、
特定の評価点に偏りが現れるはずです。そこで、評価点がどのように分布しているかを調べます。
下の図は横軸を評価点、縦軸のその評価を獲得した店舗数として、
ヒストグラムを示したものです。
このグラフで注目したい特徴は以下の二つです。
- 評価3.8の前後で大きく傾向が変わる
- 評価3.6付近が異常に多い
評価3.8の壁
グラフを見ると、評価3.8までは、
その評価が付けられる店舗数が徐々に増えていますが、
3.8の直前でピークを迎えた後、
3.8を超える店舗は極めて稀になります。評価3.8が壁として一つの天井になっていると言えます。
確かに、3.8以上を強制的に引き下げるという操作をしていれば、
このグラフに矛盾しませんね。食べログの評価は「3.8を超えると3.6に下げられる」という話の真実性を、
食べログの評価の分布の偏りを調べることで調査しました。結果としては、
- 3.8 を超える評価は極端に少ない
- 3.6 付近の評価は異常に多い
という話に矛盾しないような分布の偏りが認められることが分かりました。もちろん、これだけでは真相は分かりませんが、
他にこの奇妙な偏りを説明することは難しいように思います。仮に本当に操作が行われていれば、
ユーザーからのリアルな評価が知れるという
口コミサイトの特徴を大きく損なってしまうため、
今後の利用方法を考え直す必要があるかもしれません。出典〜食べログ3.8問題を検証
他にもありましたが、調べたい方は是非調べてみて下さい。
ここで言える事は「食べログ」は信用できない、という事です。
そして、この問題に対して食べログの運営会社「カカクコム」のHPのプレスリリースにて以下のような回答をしています。
「食べログ」に関する一部報道について
株式会社カカクコム(本社:東京都渋谷区 代表取締役社長:畑 彰之介)が運営するレストラン検索・予約サイト「食べログ(https://tabelog.com/)」について、点数・ランキングや飲食店向け集客サービス等に関する一部報道がなされております。食べログのサービスと取り組みについて、改めてお知らせいたします。
飲食店に対して提供しているサービスについて
食べログでは、お店からの情報発信機能や予約の受付機能を充実させ集客にお役立ていただくための店舗会員向け集客サービス(有料)をご提供しております。この店舗会員向け集客サービス(有料)をご契約いただいたお店は、食べログ内にある店舗情報ページでのPRや、「標準(会員店舗優先)」検索結果における優先表示などの食べログサイト内での露出機会をさらに増やすことができるほか、店舗情報ページにネット予約機能を搭載するといったサービスをご利用いただけます。なお、「標準(会員店舗優先)」検索結果は、ユーザーによる評価(点数)によって並び順が決まる「ランキング」ではございません。点数・ランキングの算出方法については後述いたします。店舗会員向け集客サービスの詳細については、店舗会員のご案内ページにてご確認いただけます。
https://owner.tabelog.com/owner_info/
口コミについて食べログは、ユーザーの皆様のお店探しをより便利にする、というポリシーのもと、ユーザーの皆様に参考にしていただける口コミが掲載された健全なサイトを運営するためのルールとして、口コミガイドラインやサイト利用規約を設け、ユーザーの皆様に遵守をお願いするとともに、口コミの取扱いに関して以下の取り組みを継続して行っております。
口コミを専任チームによって監視投稿された口コミの全件を、システムチェックはもちろん、専任スタッフ(数十名単位の専任チーム)による目視で投稿後24時間以内に確認しております。規約やガイドラインに則って一定の条件を満たしていないものや表現に問題のある口コミについては、レビュアー(口コミ投稿者)に対する修正依頼、内容や表現に問題が多い場合には弊社による口コミ削除などを行なっております。
問題のある口コミを報告できる窓口の設置
また、上記の方法による確認に加え、各口コミには、飲食店やユーザーから問題のある口コミを食べログに報告できるページへのリンクを記載しております。いただいたご報告の内容に応じて、食べログにてユーザー・飲食店に対して、どのような問題があるのか、またその問題が生じている背景など、詳細をヒアリングの上、適切に対応をさせていただいております。
・口コミガイドライン:http://user-help.tabelog.com/review_guide/
・利用規約:http://user-help.tabelog.com/rules/
・食べログの取り組みについて:http://tabelog.com/help/policy/
点数・ランキングの算出方法について
食べログでは、各ユーザーの影響度によって重み付けされた評価をベースとして、お店ごとの点数を算出しております。各ユーザーの影響度は、食べログでの各種実績等から算出しております。
点数・ランキングの算出方法については、以下のページにてご案内しております。https://tabelog.com/help/score
なお、点数の算出方法については、ユーザーの皆様にとってよりご利用いただきやすくなるよう、サービス開始当初から課題を見つける度に見直しを行っておりますが、不正な点数操作を防ぐため、詳細は非公開とさせていただいております。また、食べログでは公正さを保つため、点数の不正操作防止対策として、定期的にお店の点数を更新しております。更新にあたっては、新たに行われた口コミの投稿、ユーザーごとの影響度の変更および全体的な算出方法の改善などをふまえて、お店ごとの点数が再計算されます。このため、更新のタイミングで点数が変動することがあります。
点数・ランキングと飲食店向けサービスの関係について
飲食店向け有料サービスを含む食べログとの何らかのお取引によって、お店の点数やランキングが変動するということは一切ございません。飲食店向け有料サービスはあくまでお店からの情報発信機能を充実させ集客にお役立ていただくためのものであり、そのご利用の有無が、ユーザーの声を集約した点数・ランキングに影響を生じさせることは一切ございません。食べログは、様々な取り組みを通じて公正・健全なメディアとして運営を行っております。今後も、ユーザー・飲食店双方のニーズに対応すべく利便性の更なる向上とサービス拡充に努めながら、何よりも皆様の信頼にお応えできるよう、尽力してまいります。
出典〜カカクコムHP
本当はどうなのか、、、、
それに今の時代twitterなどのSNSの方が信ぴょう性があるとも言える。
次に、旅行予約サイトの「今あなた以外に○○人が見ています」は嘘だったという事について調べました。
あるツイートでこれを知りました。
[1/4] Ok this is really funny, check this out.
— Ophir Harpaz (@OphirHarpaz) October 16, 2019
I was in the process of booking a flight via @OneTravel. Trying to make me book ASAP, they claimed: "38 people are looking at this flight".
Whoa, 38 is a lot, I have to hurry up. But first I have to check how they came up with 38 >> pic.twitter.com/UaGhaiCQrR
海外の旅行予約サイトOneTravelが問題となっているサイトです。
宿泊予約サイトやフライト予約サイトなどで宿泊先や飛行機の搭乗券を検索している時、検索候補の横に小さく「今あなた以外の○○人が同じページを見ています」といったメッセージが表示されることがあります。海外の旅行予約サイトであるOneTravelでは、表示されているこの人数がページへのリアルタイムな同時接続数ではなく、実は単なるランダムの数字だったことをセキュリティ研究者のOphir Harpaz氏が発見しました。
Harpaz氏がOneTravelで飛行機の搭乗券を予約しようとした時、予約購入を急がせるためか、「38人がこの搭乗券をチェックしています」と表示されたとのこと。「38人もチェックしているの?!」とHarpaz氏は焦ってしまったものの、38人もの人がこの搭乗券をチェックしていることに逆に疑問を抱いたそうです。そこで、この人数はどうやって取得されているのかをHarpaz氏が確認したところ、「38」に当たる要素のクラス名が「view_notification_random」になっていることが判明。
[1/4] Ok this is really funny, check this out.
— Ophir Harpaz (@OphirHarpaz) October 16, 2019
I was in the process of booking a flight via @OneTravel. Trying to make me book ASAP, they claimed: "38 people are looking at this flight".
Whoa, 38 is a lot, I have to hurry up. But first I have to check how they came up with 38 >> pic.twitter.com/UaGhaiCQrR
そこで、この人数はどうやって取得されているのかをHarpaz氏が確認したところ、「38」に当たる要素のクラス名が「view_notification_random」になっていることが判明。
[2/4] Right click and a quick "inspect" on the number, I found out the element's class name is "view_notification_random".
— Ophir Harpaz (@OphirHarpaz) October 16, 2019
Awesome variable naming guys.
So you're _randomly_ trying to freak me out. Alright >> pic.twitter.com/xnL3hsZLP5
さらにHarpaz氏がChromeのデベロッパーツールを使ってソースコードをチェックすると、JavaScriptで以下のような部分を発見。完全に28から44までの数字がランダムに生成され、それが表示されているだけだったことが判明しました。つまり、One Travelの「○○人がこの搭乗券をチェックしています」という部分は全くのウソであり、ユーザーにフライトの予約を急がせるためのものだったというわけです。
[3/4] So what's your sophisticated pseudo-random algorithm?
— Ophir Harpaz (@OphirHarpaz) October 16, 2019
Apparently, OneTravel are choosing a number between 28 and 45.
Because as you all know, based on serious psychological research, these numbers tend to make people book their flights fast #sarcasm #not42 >> pic.twitter.com/r2IrYhxr28
出典〜GIigaZINE
この様に私達は常に心理的なトリックと隣り合わせで生きており、アメリカのウェブサイトでこれだけの疑惑があるとすると、日本はどれだけあるのか、、、、
ですが日本人はこれだけのソースコードをチェックしたりする技術を持っている人も少なく、疑う力が足りていない。
そもそも、会社がある程度大きい=信用出来ると思い込んでしまう。
この様に最近DATAサイエンスの矛盾が露わになっています。
他にも国籍により、航空チケットを取る時の値段が違ったり、、、、
為替の影響などの価格変動ならわかりますが、「嘘」をついたり、「心理的」に誘導や行動させたりする事はやっぱよくないかなと。
今回は簡単にまとめましたが、今度時間がある時ももっとまとめようかな。