特定のキーワードで流行している国を調べたい!!
海外進出先を探したい、または、自社で新しく取り組む事業のビジネスモデルの参考先を探したいとき、やろうとしていることが流行している国の目星をつけ、その国の企業について調べることから始める方が多いのではないでしょうか。
その際、どうやってその国を定めますか?
該当企業が多い国を探すのは1つの手ですが、結局企業数が多いアメリカや中国に収まってしまい、欲しいのはそれじゃないんだ…という感想を抱いた方も少なくないはず。
そこで、情報検索で最も基本的な手法の1つを用いて、Security分野が強い国を見ていこうと思います!
情報検索ではその文章における単語の重要さを1つの指標とする
情報検索で大事な指標の1つが、文章中に出てくる単語の重要さです。スタートアップという単語がその文章で重要な要素であると分かれば、スタートアップと検索したときに上位に出すことができたり、スタートアップという単語が重要だとする文章がもう1つ存在すれば、関連文章として示すこともできます。
直感的には、文章の中で出てくる回数が多いほど重要度を高くすればいいです。
ところが、この方法では、「が」「である」など、文章内容とは関係のない単語がかなり高い重要度になってしまいます。
珍しさを考慮する
ここで、単語の「珍しさ」を考慮した考え方がtf-idfという手法です。つまり、どの文章にも出てくるような単語はその文章にとって価値が低いと考え、逆に、その文章にだけ見られるような単語は価値が高いと考えるのです。
参考程度に載せておきますが、実際の計算式は以下のようになります。
このアイデアをスタートアップのデータに適用する
このアイデアをスタートアップの国とカテゴリーの関係に適応します。カテゴリーが文章、単語が国に対応させると、「どのカテゴリーにも出てくるわけではないが、このカテゴリーには特に多く出現した国」が大きな値となるはずです。
逆に、アメリカを代表とする、「企業数自体は多いが、どのカテゴリーにも存在する」ような国は比較的抑えられた値となります。
このやり方で「セキュリティ」のカテゴリーの重要国を調べてみましょう。
実際に計算してみた
手元にあるスタートアップの一覧データに上で紹介した計算をしてみました。
スイス | 0.0446 |
イスラエル | 0.0445 |
スペイン | 0.027 |
カナダ | 0.025 |
ブラジル | 0.021 |
結果、スイスとイスラエルが特に高い値を示しました。
スイスといえばセキュリティ面で有名なスイス銀行がありますよね。それに関連するセキュリティ系のスタートアップがあるのではないかと仮説を立てることができ、調査を一歩進めることができます。
また、イスラエルも実はセキュリティ分野では有名な国で、徴兵制度を通して軍内でサイバーセキュリティと諜報活動を経験した精鋭チームが徴兵後セキュリティ関連のスタートアップに参画するという流れが形成されています。
企業数だけで見れば、アメリカ>>イスラエル>イギリス>カナダ>ドイツ という情報しかわからなかったところ、この処理を通すことで色々と面白いものが発見できました。
もちろん、この手法にも足りない部分や課題はありますが、1つのアプローチとして面白いのではないかと思います。
RouteX Inc.では世界各国の現地調査や進出のお手伝いをしております。
イスラエルでの調査活動はこちらよりご確認いただけます。
RouteX Inc.では引き続きスタートアップ・エコシステムにおける「情報の非対称性」を無くすため、世界中のスタートアップとの連携を進めてまいります。
RouteX Inc.との協業やパートナーシップにご興味のある皆様はお気軽にお問い合わせください。