金融データサイエンスの実像と課題──AI時代のリスク管理と投資判断を考える

金融データサイエンスの実像と課題──AI時代のリスク管理と投資判断を考える

金融領域では、経験や勘に頼る従来の意思決定に加え、データに基づく分析を活用する「金融データサイエンス」の重要性が高まっています。

近年はAIや機械学習の発展も進んでいますが、市場リスクの把握については依然として伝統的な計量経済学的手法が中心です。

また、データの整備やモデルの解釈性といった課題は未だ多く、経験知をどのように分析の中に組み込むかといった実践的な論点も存在します。

本インタビューでは、金融データサイエンスの実像と今後の課題について、研究現場の視点から東京都立大学の吉羽先生にお話を伺いました。

目次

金融データサイエンスの実像と今後の課題

LC Asset Design(以下LC): まず最初の質問ですが、「金融データサイエンス」と呼ばれる領域は、簡単に言うとどのようなものなのでしょうか。また、従来の経験や勘に頼る金融研究とどのような違いがあるのか教えていただければと思います。

吉羽氏:明確な定義があるわけではありませんが、過去のデータを収集し、それに基づいて金融に関連する判断やリスク認識を行うことが、金融データサイエンスの中心的な内容だと考えています。

従来、経験や勘に頼る部分が多かったと思いますが、そこにデータに基づく分析を加えていくという位置づけです。

LC:全く異なるものというより、経験にデータを付け加える形になるということですね。

吉羽氏:はい、経験だけに頼るのではなく、経験もデータサイエンスの中に取り入れていくことが一般的です。

つまり、経験や勘が不要になるわけではなく、経験知をデータ分析によって検証し判断を補強する形で両者を組み合わせることになります。

LC:経験がまったく不要になるわけではない中で、データ分析と経験値はどのようにバランスさせるのがベストなのでしょうか。

吉羽氏:経験をデータ分析に活かすことが重要だと思います。経験だけに頼るわけではないのですが、例えば経験に基づいて判断できるとしても、それをデータ分析で裏付けて確認するのが望ましいと思います。

また、データ分析だけでは不十分な部分に経験をどう取り入れるか、という観点もあります。単純な分析では得られない知見が経験的に存在する場合、それを反映しながら分析する手法を構築していくことも望まれます。

LC:ありがとうございます。

続いての質問ですが、金融に関連する判断やリスク認識について、実際の現場ではどのようなデータが扱われ、どのように利用されているケースが多いのか教えていただけますでしょうか。

吉羽氏:例えば、一般的な銀行のメイン業務は融資だと思います。融資では、融資先の信用力に応じて内部格付けを付与しますが、その時財務データなど様々なデータを加味して、要注意先かどうかなどランク付けして管理していますよね。

また、複数の融資先を抱えるため、それらの信用力の相関を把握し、銀行全体の信用リスク量を算出しています。

その上で必要な資本量を決定することになりますが、こうした信用リスク管理の場面で、データは広く利用されています。

さらに、金融機関が抱えるリスクには市場リスクもあります。株価などの市場データを取り入れ、リスク管理に活用しているのです。

そのほか、金融機関内部で蓄積される様々な業務データを分析し、マーケティングなどに利用するケースもあります。

LC:ありがとうございます。現段階でもデータサイエンスを活用しているように見えるのですが、今後日本の金融業界がさらにデータサイエンスを活用するために取り組むべき課題について教えていただきたいです。

吉羽氏:データサイエンスを金融実務に生かすには、取引データや口座データなど膨大な情報を適切に管理・整備する基盤づくりが不可欠であり、とりわけ個人情報を伴うデータではガバナンス体制の構築が重要な課題となっています。

銀行では預金の入出金など多くのデータを持っていますが、個人情報を含むこともあり、必ずしも整備が進んでいるとは限りません。

マーケティングやリスク管理にとって非常に有効なデータなので、制度整備や体制構築を含めてデータを整備していくことが重要な課題だと考えています。

AI・機械学習を用いたリスク管理手法の現状と課題

LC:AIや機械学習の技術を使って、金融商品のリスクを予測・管理する研究は、どのように進められているのでしょうか。

吉羽氏:市場リスクの把握という意味では、金融商品の価格変動のリスクを捉えることが重要です。ただし、ここでは深層学習のような高度な機械学習を用いるというよりも、伝統的な計量経済学の手法を用いることが一般的です。

伝統的な手法では、データ分析をいきなり始めるのではなく、過去の変動や他の説明変数によって将来の価格変動がどのように想定されるかを数式でモデル化し、そのパラメータを推定します。そうすることで、過去の変動や説明変数が市場リスクにどのように影響するかを明確に把握できます。

一方で、深層学習によって過去のデータから将来の価格変動を予測する研究も多くあります。しかし、深層学習ではモデルが非常に複雑になり、どの要因が将来の変動に影響しているのかを把握することが困難になります。

機械学習という意味では、深層学習に限らず、伝統的な手法でも有効な説明変数を探したり、どの程度のラグを取るべきか試行するなどの分析を行います。特に市場リスクだけでなく、信用リスクにおいても同様です。信用力判定では財務データや入出金情報など複数の要素を入力し、そこから有効な説明変数を抽出していきます。

LC:機械学習と伝統的な手法との使い分け方法について教えてください。

吉羽氏:信用リスクでは、ロジスティック回帰がよく用いられます。これは変換すると単純な線形回帰の形になるため、どの要因が将来に影響するかを把握しやすいという利点があります。

一方、不正検知のように通常とは異なるパターンを検出する場合には、深層学習がよく用いられます。過去の取引パターンから通常と異なる動きを検知し、その後に本当に不正かどうかを別途検証することになるので、深層学習はその検知に便利な手法だと思います。

LC:パターン検出にAIが使われるケースも見られるようになってきましたが、将来的にAIがリスク管理の意思決定を人間より担う可能性はあるのでしょうか。

吉羽氏:私は、その可能性は低く、今後もAIは補助的な役割に位置付けるのが適切で、最終決断は人間が行うことが望ましい姿だと考えます。

AIがある程度判断できるようになる可能性はあるとしても、その結果を正しく理解し最終判断を行うのは人間であるべきでしょう。

LC:金融ではAIの「過剰反応」も懸念されていますが、どのようなガバナンスや人による監督体制が必要とされるのでしょうか。

吉羽氏:AIは過去のデータに基づいて判断するだけなので、AIの判断には検知や過剰反応が起きる可能性があります。

そのため、AIによる判断は補助的な材料と位置付け、最終的にそれが本当に妥当かを人間が判断するプロセスが必要です。そのプロセスがガバナンス、あるいは人による監督という意味で重要であると考えます。

初心者が陥りやすい投資判断の誤解と、データサイエンス的視点からの注意点

LC: 最近は若い世代でも投資を始める人が増えています。そこで、データサイエンスの視点から、初心者が陥りやすいデータの読み間違いや注意すべきポイントについて教えていただけますか。

吉羽氏:投資判断の場面では、短期的な値動きや相関関係のみを根拠に判断すると誤った結論を導きやすく、因果関係の検証やリスクの把握が不可欠です。

投資を始める際、価格が最近上昇していると「今後も上昇するのでは」と考えて投資したくなることがあります。しかし冷静に見ると、市場参加者がその銘柄の価値を高いと判断した結果として価格が上昇しているだけで、その判断が一巡すれば価格は落ち着いたり、むしろ下落したりする可能性もあります。

逆に、最近大きく下落した銘柄は買いだと言われることがありますが、初心者はそこで投資をためらいがちです。しかし大規模投資家は、日経平均が大きく下落した際に段階的に買い進めることもあります。ただし「安いから買う」という判断は危険です。

下落しているのは市場がその企業の信用リスクを判断している場合もあり、倒産リスクがある場合は全損となる可能性も頭に入れておいたほうが良いでしょう。

LC:世間一般の意見をうのみにせず、慎重になったほうが良い場面もあるのですね。

吉羽氏:はい、ファイナンスの理論では、金融商品の価値は市場で決まり、将来の上昇・下落の期待値は市場金利(リスクフリーレート)とリスクプレミアムによって決まります。つまりリスクを負えば期待収益は上がりますが、損失リスクも当然あるということです。

さらに初心者が理解しにくいのが「分散投資」です。

ある企業の株式に投資する際には、リターンや価格変動(ボラティリティ)を把握することが重要ですが、同じリスク・同じリターンのものが二つあった場合でも、「どちらにも投資すればいい」という単純な話ではありません。

完全に同じ動きをするなら分散の意味はありませんが、片方が下落してももう片方が必ずしも下落するとは限らず、損を補填できることがあります。これがリスク軽減の仕組みで、分散投資の基本です。

ただし、あまりに多くに分散すると取引コストが増えるため、その点はバランスを取る必要があります。

LC:初心者が陥りやすい誤った分散とはどのようなものか、具体的に教えてください。

吉羽氏:分散投資は「ただ分散すれば良い」わけではなく、値動きが全く同じものに分散投資しても意味がありません。

片方が下落するときにもう片方も下落するようでは分散効果が小さいので、値動きが異なる、相関が低い(あるいは逆相関に近い)ものを組み合わせることが重要です。

相関を把握して投資することがポイントです。

LC:ありがとうございます。同じく初心者は短期投資を注目しがちですが、データサイエンス的にはどう距離を取るべきでしょうか。

吉羽氏:短期的な値動きや感情で判断することは間違う可能性が高いので、過去データの変化をきちんと分析し、リスクを把握した上で投資判断を行うのがデータサイエンス的な考え方です。

値動きだけで将来の値動きは決まりませんが、「なぜその値動きが起きているのか」を分析した上で判断することが重要です。

LC:初心者は値動きを分析する際、「相関が高い=理由がある」と誤解しがちです。その具体例を交えて説明いただけますか。

吉羽氏:二つの系列の相関が高いとは、過去データで動きが似ているということですが、因果関係があるとは限りません。例えばAとBの相関が高くても、その背景にCという要因があり、CがAに作用し、CがBにも作用して結果としてAとBに相関が出ている場合があります。

したがって、相関だけを見て因果関係を決めつけるのではなく、「要因は何か」を分析することが重要です。

LC:初心者でも押さえておくべきシンプルで効果的な指標として、PERやボラティリティ、相関係数などがありますが、何か有効なものはあるでしょうか。

吉羽氏:まずPER(株価収益率)が挙げられるでしょう。

PERは「株価がその企業の利益に対して割高か割安か」を判断するための代表的な指標です。これが極端に高いと市場が過大な期待を抱いている可能性があり、逆に極端に低い場合には、将来の利益を市場が低く評価している、あるいはリスクを織り込んでいる場合があります。

一方で、ボラティリティは「価格変動の大きさ」を表すので、投資対象のリスクを把握するのに有効です。低ボラティリティであれば比較的安定している可能性がありますし、高ボラティリティなら値動きが大きく、リスクも高いと考えられます。

相関係数については先ほど申し上げた通り、分散投資の効果を考えるうえで重要な変数になります。相関が低い、あるいは負の相関がある組み合わせを見つけることが、リスク軽減には有効です。

ある1つの金融商品への投資を検討している初心者の方におすすめするなら、まずPERで「割高・割安」を理解し、ボラティリティで「値動きリスク」を把握する。この二つを押さえることが第一歩として適切だと思います。

金融データサイエンスを志す学生に求められる準備と能力

LC:これからお金やデータを扱う仕事に就きたいと考えている高校生や大学生がいると思います。今のうちにどのような分野に興味を持ち、どんな準備をしておくと将来役立つのか、先生のご意見をお聞きしたいです。

吉羽氏:お金とデータを扱うということなので、金融とデータ分析、双方の基本的な知識を身につけ理解しておくのが良いと思います。

まず金融についてですが、金融の基本的な仕組みを学ぶことが重要です。一方、データを扱うことはデータサイエンスにつながり、その基礎は統計学になりますので、統計学の考え方を学ぶことが望ましいと考えます。
また、お金とデータを扱う仕事にはどのような業務があるのかを調べておくことも役立つと思います。興味が具体化してきたら、それに合わせた準備を進めていくと良いでしょう。

LC:データサイエンスというと数学のイメージが強く、苦手意識を持つ学生もいると思います。数学が得意でない学生は、どのように学び進めるべきかご意見を伺いたいです。

吉羽氏:データサイエンスに興味を持っているものの数学が苦手という場合でも、必ずしも数学を網羅的に学ばなければデータ分析ができないというわけではありません。

ただし、必要な数学の知識は存在しますので、データ分析に必要な数学を調べながら習得していくという形で進めれば十分可能だと思います。

LC:金融データサイエンスは理系寄りに見えますが、文系の強みが活かせる場面もあるのでしょうか。

吉羽氏:金融データサイエンスは金融に関わる業務の話です。単にデータを分析して終わりでは不十分で、その背景となる業務や制度に関する知識を持ちながら分析を行う必要があります。

そうした面では、業務内容や制度に関する理解は文系の方々の強みが活きる部分だと考えています。こうした領域では文系の強みがしっかり発揮されると思います。

LC:最後にもう一点、近年の金融業界では、データサイエンス人材にどのような能力が求められるようになってきているのか、ご見解をお聞かせください。

吉羽氏:金融業界に限らず、現在はデータサイエンス人材、つまりデータ分析を行う能力が求められている業界が多いと思います。

 金融データサイエンスの分野でも当然データ分析能力は必要ですが、それだけでなく、金融制度や経済・金融環境などの背景を理解し、それを分析に活かす能力が求められるでしょう。

LCマガジン(当社メディア)では以下のような記事も紹介しています。

目次