NewsPicks : 有能なピッカーが 増えない理由

kato

前回、[NP] コメントランキングで 「1位」を取った方法を 完全公開! という文章を書き、賛否両論、いろいろなコメントをいただきました。

その文章は、「新規ユーザの参入障壁が高くなっている」という問題意識から書いたのですが、本当に参入障壁は高くなっているのでしょうか? これを検証してみたいとます。

「100」フォロワーを持つピッカーは、何人いるのか?

少し前、フォロワーが「100」を超えまして、その時に「フォロワー100以上のピッカーは、何人いるのだろう?」という疑問を持ちました。

どのようにすれば調べられるかを考えていたところ、「ユーザー」のリストにフォロワー数が記載されていることを発見。しかも、下にスクロールすれば どんどん表示されます。そのHTMLコードからデータを抜き出して集計してみました。(下はPCからの画面。なお、表示しているのは妻のアカウントです。)

aa010

そのように取得した約8千件のデータ。なぜ、8千件かというと、下にスクロールするのが面倒になってきたから。 あと、フォロワー数がゼロのピッカーも表示されてきたので、要らないと思ったからです。

8月段階で会員登録が60万人ということなので、 8千/60万 = 1.3% です。ちょっと少ないかもしれませんが、多くのフォロワーを持つピッカーが上位に表示されているのようなので、私の目的には十分なデータであると考えました。

さて、それらのデータを集計したグラフが下図。

  • X軸(フォロワー数が多いピッカー から 少ないピッカー の順に並べた)
  • Y軸(フォロワー数)
  • 青丸は、一般ピッカー
  • オレンジの×は、現役&元PROピッカー
np110

X軸とY軸に張りついていて、よく分かりません。 しょうがないので、Y軸を「底が10の対数グラフ」にしてみました。(図をクリックすると拡大)

対数グラフ

np120

理系の人はご存知でしょうが、分からない人が多いかもしれないので、ちょっとだけ説明。 Y軸方向に1目盛上がると、10倍になります。だから、2目盛だと100倍、3目盛だと1000倍になります。

グラフの右端が変な形になっていますが、これはデータを8千件(1.3%)で切っているから。 全データで出せば、長い裾野(すその)で下がっていくグラフになるでしょう。

図中に書いてある数はピッカー数です。10万人以上のフォロワーを持つピッカーは16人、1万フォロワー以上は133人、1000フォロワー以上は約380人、100フォロワー以上は約1,100人、10フォロワー以上は約5,300人 ということです。

np130

なお、対数グラフについて補足しますが、「10」と「100」の 真ん中は「約30」になります。なぜ そうなるか。。。簡単に言うと罫線の間隔が違うから、なのですが。。。詳しくは他で調べてください。一応、数字を上げておきます。30フォロワー以上を持つピッカーは約2,600人です。

発言力

NPにおいて、「フォロワー数は発言力の源泉」です。 前回の文章で、「likeは気にしないで、気軽にコメントする」というコメントを多くいただきましたが、それはフォロワーが居るから可能なのです。

さて、どれくらいのフォロワーが居れば、NPを楽しめるでしょうか? フォロワーのタイプ(アクティブ/休眠)にも寄るでしょうが、100人くらい居れば良いでしょうか? 今、100人くらいですが、これくらい居ると普通のコメントをして likeゼロ ということは、あまり無いですね(なくはない)。

では、フォロワー10人くらいは、どうでしょうか? 経験上、10人だと、けっこう寂しいですね。 コメントしても「シーン」って感じで。

会員登録が60万人の内、10フォロワー以上は約5,300人。全体の1%です。 つまり、全体の99%は10フォロワー以下。。。みんな、楽しんでる?

データ分析の続き

とりあえず、データ分析の続けます。

取得したデータにはピッカーの番号(以降、ピッカー番号)が付与されていました。 下図のように、ピッカーのプロフィールを見るときなどに使われる番号です。

aa020

ピッカー番号は、100,000以上の番号であり、古参のピッカーは小さい番号、新しいピッカーほど大きい番号のようです。 8月段階で会員登録が60万人ということなので、ピッカー番号は700,000くらいになっていたのでしょう。私は9月下旬に登録したので、838,433という番号は妥当な気がします。

この8千件のデータを取得した日は2015年11月7日です。 一番大きなピッカー番号は「971,XXX」です (後ろ3桁は伏せました)。 よって、971XXX – 100,000 = 871,000。 つまり、11月段階で会員登録が87万人なのでしょうか?。 データは、そのうちの8千件なので、ちょうど1%くらいです。 なお、現在、1,000,000以上のピッカー番号を持つピッカーさんもいます。

さて、ピッカー番号とフォロワー数をプロットしたグラフを作成しました(対数グラフ)。 なお、青丸は一般ピッカーで、オレンジの×は現役&元PROピッカー です。(図をクリックすると拡大)

aa030

オレンジの×はPROピッカーなので、これらを無視した場合、青丸(一般ピッカー)は右に行くにつれて、()になります。 「古参のピッカーほど、多くのフォロワーを持っている」ということです。

ピッカー番号上位1%に入ったピッカー数 (現役&元PROピッカーを除く)上位1%に入る割合
100,000~199,9994323人23人に一人
200,000~299,9991758人57人に一人
300,000~399,999881人114人に一人
400,000~499,999441人227人に一人
500,000~599,999315人317人に一人
600,000~699,999170人588人に一人
700,000~799,999117人855人に一人
800,000~899,99976人1316人に一人

上の表では、「ピッカー番号」と「上位1%に入ったピッカー数」の関係を調べました。 「100,000~199,999」のピッカー番号を持つ10万人の内、上位1%(8千件)に入った人は、4,323人。23人に一人の割合です。 ところが、「800,000~899,999」のピッカー番号を持つ人の場合、10万人の内 たったの76人、1,316人に一人しか上位1%に入っていないのです。 なお、PROピッカーは特別待遇を受けているので、上記表と下の円グラフの集計から外しています。

8千件を構成するピッカー番号をグラフにすると、こんな感じ。(図をクリックすると拡大)

aa220

仮説

上記の結果は「新規ユーザの参入障壁が高くなっている」という仮説を支持するものと考えますが、他の仮説も考えられます。

  • 仮説1:古参のピッカーは利用している期間も長いので、フォロワーを多く獲得できるチャンスがあっただけ。
  • 仮説2:ピッカー番号の採番方法が、連番ではなく、とびとびの値を取るように変更された。
  • 仮説3:「ユーザー」に表示されるピッカーの並び順が、古参のピッカーが優先されるようになっている。
  • 仮説4:無意味なアカウントを大量に作られている(たとえば、外部からロボットなどで攻撃を受けている)。

仮説1は、大いにあり得ますね。 また、コメントを読むと、フォローすることが流行した期間もあったようで、その頃に獲得したフォロワーかもしれません。 それを否定するつもりはありませんし、当初からNPを盛り上げるのに貢献した方々であることを評価しています。 しかし、私には仮説1「だけ」が原因だとは思えません。

仮説2~4は、運営側しか分かりませんので、なんとも言えません。

やはり、「新規ユーザの参入障壁が高くなっている」ことが、一番の原因だと思います。

このデータの公開について

公開されているHTMLから手動で取得したデータを集計しただけであり、利用規約に抵触しているとは思っていません。 しかしながら、NP運営側が公開を好まない情報かもしれないので、当初は公開するつもりはありませんでした。

初めは、自分のフォロワー数の順位を知りたいと思っていただけですが、いろいろデータをいじっている内に、上記のような思いがけない、かつ重要な傾向が見えてきたため、公開した次第です。上記のグラフを公開せずに、「問題だー」と言っても、だれにも信じてもらえないでしょうから。

なお、コメントランキングで 「1位」を取った方法を 完全公開! を書いた時には、既に この傾向は ちょっと見えていました。 しかし、それを説明しないで「コメントランキングで1位を取る」点にフォーカスしたので、理解いただけずに否定的なコメントを戴くことになったこともあると思います。

なお、この集計について、だれか追試していただければ幸いです。 IT系の人であれば、別に難しいことはありません。 できるだけ多くの「ユーザー」を表示させ、そのHTMLを保存して、Perlとかでデータを抜き出して、EXCELで集計するだけです。

「お前、ひまだなー」

って、コメントされると思うで、先に書いておきます。別にひまではないが(娘の「塗り絵の手伝い」もしないと いけないし)、IT系として こういうデータを見ると、いじってみないでは いられない。。。

続き。。。

次に、主観的な見方の例として、私のNPでの体験談を書きます。 新しいピッカーの心情です。