クオンツ運用で重要となる画像データの「収集・解析」
AIを駆使したクオンツ運用で着実に高リターンを挙げているヘッジファンドが出てきていると説明しました。
クオンツ運用は、金融工学という数学的技術をふんだんに用いる学問がベースになっているため、数値データの収集が極めて重要です。しかし、それだけではなく、ネットなどにあふれるテキストデータや、衛星写真などの画像データを活用することで、さらに精密な分析が可能になるため、これらのデータの収集ならびに解析の技術が重要になってきています。
コンピュータによるテキストデータの解析が一般的に
投資判断をするにあたっては、昔から文字情報は重要でした。
例えば日本の投資家で日本経済新聞をはじめとする経済や金融の専門紙を読まない人はまずいないでしょう。さらに投資するとなれば、その業界の専門紙や専門誌を購読して調べるでしょう。先物取引などでは国際情勢を押さえるために、海外のものを含めたいくつもの新聞・雑誌を調べるはずです。
以上のようなニュース情報はもちろんのこと、有価証券報告書や中期経営計画、財務諸表なども調べるでしょうし、アナリストレポートも参考にするでしょう。また最近では、ツイッターやインスタグラム、フェイスブックなどのSNSや有名人のブログなども企業業績に大きな影響を与えるようになりました。
これらはすべて文字情報です。コンピュータが解析できるようにするためにはデータ化する必要があり、データ化された文字情報のことをテキストデータといいます。
テキストデータの評価は、これまでは人間だけが行えることでしたが、機械学習などの進展によりAIにも可能になりました。より精緻な分析をするためには、データは大量にあるほうがいいのですが、一人の人間が処理できるデータ量はたかがしれています。
またSNSの情報などとなると、極めて大量に読み込んで、ようやく数行分の重要情報が得られるといったことが普通です。こうなると人間の手には負えません。
こうして今ではコンピュータによるテキストデータの解析が一般的になりました。
大量のテキストデータを解析して、重要な情報を拾い出すことをテキストマイニングといいます。
テキストマイニング自体は1990年代からある技術ですが、以前はAIを使っていませんでした。機械学習やディープラーニングなど機械自らが学習する技術が発達したので、テキストマイニングでAIを活用するようになったのです。