A Data-driven Approach to Environmental, Social and Governance

The future of finance goes hand in hand with social responsibility, environmental stewardship and corporate ethics. In order to stay competitive, Financial Services Institutions (FSI) are increasingly disclosing more information about their environmental, social and governance (ESG) performance. By better understanding and quantifying the sustainability and societal impact of any investment in a company or business, FSIs can mitigate reputation risk and maintain the trust with both their clients and shareholders. At Databricks, we increasingly hear from our customers that ESG has become a C-suite priority. This is not solely driven by altruism but also by economics: Higher ESG ratings are generally positively correlated with valuation and profitability while negatively correlated with volatility. In this blog post, we offer a novel approach to sustainable investing by combining natural language processing (NLP) techniques and graph analytics to extract key strategic ESG initiatives and learn companies’ relationships in a global market and their impact to market risk calculations.

この記事では、Databricks の統合データ分析プラットフォーム上での、Apache SparkTMDelta LakeMLflow の機能の活用し、ESG スコアの作成・格付けのための手法をご紹介します。アセットマネージャーは、これらの機能を使用することで、投資の持続性の評価が可能になり、環境、社会、コーポレートガバナンス戦略に関する全体的かつデータ駆動型の見解を得てビジネスを強化できます。具体的には、年次 PDF レポートとして報告された ESG への主要な取り組みを抽出したものと、ニュース記事の分析データから実際にメディア報道されたものとを比較します。

この手法は一般的な企業でも活用が可能なものですが、今回は ESG 関連の情報開示が進んでいる金融業界の分析手法を紹介していきます。

金融ニュース、自然言語処理(NLP)、グラフ分析を活用したESGスコア取得への新しいアプローチ

このブログの後半では、企業間の結びつきがビジネスにもたらす ESG のプラスとマイナスの影響について説明します。このブログでは、ESG や社会的責任投資に対する最新のアプローチを説明するためにアセットマネジャーに焦点を当てますが、このフレームワークは、消費財、エネルギー、メディア、医療・ヘルスケアなど、さまざまな経済セクターに広く適用できます。

ESG への主要な取り組みの抽出

Financial services organisations are now facing more and more pressure from their shareholders to disclose more information about their environmental, social and governance strategies. Typically released on their websites on a yearly basis as a form of a PDF document, companies communicate their key ESG initiatives across multiple themes such as how they value their employees, clients or customers, how they positively contribute back to society or even how they mitigate climate change by, for example, reducing  (or committing to reduce) their carbon emissions. Consumed by third-party agencies (such as msci or csrhub), these reports are usually consolidated and benchmarked across industries to create ESG metrics.

ESG レポートのコーパスの要約と分析

このセクションでは、トップ金融サービス機関から収集した 40件以上の ESG レポート(下記の表に一部掲載)にプログラム的にアクセスして、さまざまなトピックに関する主要な取り組みを抽出します。しかし、レポートには標準的なスキーマや規制ガイドラインがないため、ESG への取り組みは多様な表現で書かれています。そのため機械学習の利用には最適な候補となります。

バークレイズ https://home.barclays/content/dam/home-barclays/documents/citizenship/ESG/Barclays-PLC-ESG-Report-2019.pdf
JPモルガン・チェース https://www.jpmorganchase.com/content/dam/jpmc/jpmorgan-chase-and-co/documents/jpmc-cr-esg-report-2019.pdf
モルガン・スタンレー https://www.morganstanley.com/pub/content/dam/msdotcom/sustainability/Morgan-Stanley_2019-Sustainability-Report_Final.pdf
ゴールドマン・サックス https://www.goldmansachs.com/our-commitments/sustainability/sustainable-finance/documents/reports/2019-sustainability-report.pdf

比較的小さいデータセットを使用しますが、サードパーティのライブラリ PyPDF2 が Spark 環境全体で利用可能であると仮定して、ユーザー定義関数(UDF)を使用してスクレイピング処理を分散する方法を示します。

import requests
import PyPDF2
import io

@udf('string')
def extract_content(url):

    # retrieve PDF binary stream
    response = requests.get(url)
    open_pdf_file = io.BytesIO(response.content)
    pdf = PyPDF2.PdfFileReader(open_pdf_file)

    # return concatenated content
    text = [pdf.getPage(i).extractText() for i in range(0, pdf.getNumPages())]
    return "\n".join(text)

正規表現による処理や、かなり複雑なデータクレンジングに加えて、より高度な自然言語処理(NLP) 機能を活用して、コンテンツを文法的に有効な文章にトークン化する方法を示しています(ブログの最後にこの Notebook のリンクがあります)。また、トレーニングされた自然言語処理パイプラインをメモリへのロードするのにかかる時間を考慮し(例:図中の spacy ライブラリ)、PandasUDF ストラテジーを使って Spark のエグゼキュータごとに1回だけモデルをロードするようにしています。

import gensim
import spacy
from pyspark.sql.functions import pandas_udf, PandasUDFType

@pandas_udf('array', PandasUDFType.SCALAR_ITER)
def extract_statements(content_series_iter):
    
    # load spacy model for english only once
    spacy.cli.download("en_core_web_sm")
    nlp = spacy.load("en_core_web_sm")
    
    # provide process_text function with our loaded NLP model
    # clean and tokenize a batch of PDF content
    for content_series in content_series_iter:

    yield content_series.map(lambda x: process_text(nlp, x))

このアプローチにより、40件以上の未加工の PDF 文書の ESG レポートごとに、明確に定義された文章に変換できました(下記表に一部記載)。処理の一環として、コンテンツの見出し語化(lemmatisation)も行いました。見出し語化とは、時制を過去形から現在形に変換したり、複数形を単数形に変換したりするなど、単語をよりシンプルな文法的な形に変換することです。この追加の処理により、トピックを学習する単語数を減らすことで、モデリング段階での効果が見込めます。

ゴールドマン・サックス 当社は、米国および欧州において、多様性のある取締役が少なくとも1名以上在籍する企業のみを公開する方針を確立しました(来年からは目標を 2名に増やす)。
バークレイズ 全てのステークホルダーが、当社の事業の運営方法を明確に理解できるようにすることに重点を置きます。
モルガン・スタンレー 2019年、住居不足が発生したソノマ郡に2件の資金調達を実施し、80戸近くの低・中所得者向けの手頃な価格のアパートを建設する支援をしました。
リバーストーン 過去 4年間で、当社の基金は、15,000エーカー以上の低地広葉樹林を保全し、基金開始時に設定した35,000エーカーを保護する目標達成に向けて順調に進んでいます。

人間にとって、これらのステートメントのそれぞれに関するテーマ(この場合は多様性、透明性、社会、環境)を推測することは比較的容易ですが、これをプログラム的に、かつ大規模に実行することは別の複雑さがあり、データサイエンスの高度な適用が必要です。

ESG ステートメントの分類

In this section, we want to automatically classify each of our 8,000 sentences we extracted from 40+ ESG reports. Together with non matrix factorisation, Latent Dirichlet Allocation (LDA) is one of the core models in the topic modeling arsenal, using either its distributed version on Spark ML or its in-memory sklearn equivalent as follows. We compute our term frequencies and capture our LDA model and hyperparameters using MLflow experiments tracking.

from sklearn.feature_extraction.text import CountVectorizer
from sklearn.decomposition import LatentDirichletAllocation as LDA
import mlflow

# compute word frequencies
# stop words are common english words + banking related buzzwords
word_tf_vectorizer = CountVectorizer(stop_words=stop_words, ngram_range=(1,1))
word_tf = word_tf_vectorizer.fit_transform(esg['lemma'])
    
# track experiment on ml-flow
with mlflow.start_run(run_name='topic_modeling'):
    
    # Train a LDA model with 9 topics
    lda = LDA(random_state = 42, n_components = 9, learning_decay = .3)
    lda.fit(word_tf)
    
    # Log model 
    mlflow.sklearn.log_model(lda, "model")
    mlflow.log_param('n_components', '9')
    mlflow.log_param('learning_decay', '.3')
    mlflow.log_metric('perplexity', lda.perplexity(word_tf)) 

複数の実験の結果、9つのトピックがコーパスを最もよく要約することが判明しました。モデルから学習した各キーワードの重要性を掘り下げることで、以下の表のように、9つのトピックを具体的な 9つのカテゴリに分類して説明できます。

推奨される名前 LDA 記述キーワード
企業戦略 取締役会、会社、コーポレート、ガバナンス、マネジメント、エグゼクティブ、ディレクター、株主、グローバル、エンゲージメント、投票、任期、責任、ビジネス、チーム
グリーンエネルギー エネルギー、排出、 100万、再生可能、ユース、プロジェクト、削減、炭素、水、 10億、電力、グリーン、合計、ガス、ソース
顧客フォーカス 顧客、提供、ビジネス、改善、金融、サポート、投資、サービス、年、持続可能性、財務、グローバル、受容、ヘルプ、取り組み
サポート・コミュニティ コミュニティ、人々、ビジネス、サポート、新しい、小さい、収入、リアル、女性、起動、不動産、アクセス、顧客、英国、受容
倫理的投資 投資、気候、会社、変化、ポートフォリオ、リスク、責任、セクター、移行、株式、投資家、持続可能、ビジネス、機会、市場
持続可能な金融 持続可能、影響、持続可能性、資産、管理、環境、社会、投資、会社、 10億、廃棄物、クライアント、データ、投資、提供
行動規範 受容、ポリシー、情報、リスク、レビュー、管理、投資、会社、ポートフォリオ、プロセス、環境、ガバナンス、範囲、行動、データ
強力なガバナンス リスク、ビジネス、管理、環境、顧客、管理、人間、社会、気候、アプローチ、行動、ページ、クライアント、影響、戦略
従業員を大事にする 従業員、仕事、人、サポート、価値、クライアント、会社、ヘルプ、受容、提供、コミュニティ、プログラム、多様性、顧客、サービス

機械学習で得た 9つのトピックを使用することで、FSI の各 ESG レポートを並べて簡単に比較し、各レポートの優先事項をより正確に理解することができます。

金融サービス機関 30社の ESG への取り組みの比較

シーボーン (seaborn) で可視化を行うことにより、企業間での主な相違点を浮きだたせることが簡単になります(組織名は変更済)。ある組織では、従業員を大事にすることと多様性と包含性を促進することに重点を置き(例:ORG-21)、別の組織は、倫理的投資に重点を置いていることがわかります(例:ORG-14)。LDA の出力は、1つの特定のテーマではなく、9つのトピックにわたる確率分布であるため、シンプルな SQL 文と各テーマの最高確率が得られる分配関数を使用して、特定の組織を最も適切に説明する ESG への取り組みを簡単に見出せます。

WITH ranked (
    SELECT
        e.topic,
        e.statement,
        e.company,
        dense_rank() OVER (
            PARTITION BY e.company, e.topic ORDER BY e.probability DESC
        ) as rank
    FROM esg_reports e
)
    
SELECT 
    t.topic,
    t.statement
FROM ranked t
WHERE t.company = 'goldman sachs'
AND t.rank = 1  

This SQL statement provides us with a NLP generated executive summary for Goldman Sachs (see original report), summarising a complex 70+ pages long document into 9 ESG initiatives / actions.

トピック ステートメント
サポート・コミュニティ 女性起業家のための、Women Entrepreneurs Opportunity Facility (WEOF) と呼ばれるこのプログラムは、女性の起業家がビジネスを成長させるために必要な資金調達で直面する大きな障害を認識し、開発途上国で起業する女性経営者のための資金調達ニーズに対処することを目的としています。
強力なガバナンス ERMフレームワークは、リスク管理に対する包括的で統合されたアプローチを採用しており、事業活動を行う際に想定されるリスクを特定、評価、監視、管理するための堅牢なリスク管理プロセスを実現するように設計されています。
持続可能な金融 スウェーデンの主要施設に加え、ノースボルトはフォルクスワーゲングループと合弁会社を結成し、ドイツに 16GWh のバッテリーセル工場を設立しました。これにより、フォルクスワーゲンスのノースボルトへの投資総額は約 10億ドルに達します。
グリーンエネルギー JFK 空港の温室効果ガス排出量を年間約 7,000トン(約 1,400台の自動車のガス排出量に相当)削減するほか、空港での港湾局の温室効果ガス排出量を約 10%削減することが期待されています。本プロジェクトは、ゴールドマン・サックス・アセット・マネジメント(GSAM)の Renewable Power Group が、電力購入契約を締結し、サンパワー社(SunPower)が JFK 空港でインフラストラクチャを開発し、建設を担当します。
顧客フォーカス プログラムの卒業生は、2019年にスタートした起業家を対象にした、事業をスケールアップさせるための上級コース「10KW アンバサダープログラム」に参加することもできます。北京で行われた「10,000 Women Measures Impacts in China」で、10,000 Women(1万人の女性)が卒業 10年目の同窓会サミットを清華大学経済管理学院で開催しました。
倫理的投資 当社は、2015年のホワイトハウスの米ビジネス気候変動対応行動誓約に関して米国企業として初めてコミットした企業の1社であり、2017年には他の 29人の CEO とともに公開書簡に署名し、パリ協定に米国が留まることを支援しました。さらに最近では、80人以上の CEO と労働指導者のグループの一員として、パリ協定への参加が世界市場における米国の競争力を強化することの支持を改めて表明しました。
従業員の価値を高める 当社の視点の多様性を高めるその他の主な取り組みには、以下のものがあります。Returnship Initiative(リターンシップ・イニシアティブ)は、従従業員が長期休暇を取得した後のキャリアの再スタートを支援するものです。当社の文化の強み、戦略を実行する能力、およびクライアントとの関連性は、多様な人材と幅広い視点を奨励する包括的な環境によるものと考えています。
企業戦略 多様な視点が企業の業績に大きな影響を与える可能性があるという信念のもと、スチュワードシップでは、取締役会の多様性の実現に優先して取り組んでいます。
行動規範 (13%)信用分析に ESG 要素を組み込むためのアプローチの詳細については、『2019 Form 10-K』の 96ページをご覧ください。議論と分析。FN-CB-410a.2。環境政策の枠組み。

誤分類(主に各トピックの名前付け方法に関連している)が見られ、モデルをさらに調整する必要があるかもしれませんが、ここでは、複雑な PDF 文書から、明確に定義された取り組みを効率的に抽出するために、自然言語処理技術がどのように利用できるかを実証しました。ここで得た結果は、必ずしも企業の中核的な優先事項を反映しているとは限らず、各テーマの全ての取り組みを捉えるものではありません。この問題へのさらなる対処法は、異常検出から借用した技術を用いて、コーパスをより幅広いクラスタにグループ化し、規範から最も逸脱した文(すなわち、組織に特有であり、主流ではない文章)を抽出することです。この k 平均法を使用したアプローチは、このブログの最後の Notebook のリンクから確認ができます。

データ駆動型の ESG スコアの作成

As covered in the previous section, we were able to compare businesses side by side across 9 different ESG initiatives. Although we could attempt to derive an ESG score (the approach many third-party organisations would use), we want our score not to be subjective but truly data-driven. In other terms, we do not want to solely base our assumptions on companies’ official disclosures but rather on how companies’ reputations are perceived in the media, across all 3 environmental, social and governance variables. For that purpose, we use GDELT, the global database of event location and tones.

データ収集

Given the volume of data available in GDELT (100 million records for the last 18 months only), we leverage the lakehouse paradigm by moving data from raw, to filtered and enriched, respectively from Bronze, to Silver and Gold layers, and extend our process to operate in near real time (GDELT files are published every 15mn). For that purpose, we use a Structured Streaming approach that we `trigger` in batch mode with each batch operating on data increment only. By unifying Streaming and Batch, Spark is the de-facto standard for data manipulation and ETL processes in modern data lake infrastructures.

gdelt_stream_df = spark \
    .readStream \                              
    .format("delta") \
    .table("esg_gdelt_bronze") \                                        
    .withColumn("themes", filter_themes(F.col("themes"))) \
    .withColumn("organisation", F.explode(F.col("organisations"))) \
    .select(
        F.col("publishDate"),
        F.col("organisation"),
        F.col("documentIdentifier").alias("url"),
        F.col("themes"),
        F.col("tone.tone")
    )

gdelt_stream_df \
    .writeStream \
    .trigger(Trigger.Once) \
    .option("checkpointLocation", "/tmp/gdelt_esg") \
    .format("delta") \
    .table("esg_gdelt_silver")

From the variety of dimensions available in GDELT, we only focus on sentiment analysis (using the tone variable) for financial news related articles only. We assume financial news articles to be well captured by the GDELT taxonomy starting with ECON_*. Furthermore, we assume all environmental articles to be captured as ENV_* and social articles to be captured by UNGP_* taxonomies (UN guiding principles on human rights).

ESG の代理としてのセンチメント分析

Without any industry standard nor existing models to define environmental, social and governance metrics, and without any ground truth available to us at the time of this study, we assume that the overall tone captured from financial news articles is a good proxy for companies’ ESG scores. For instance, a series of bad press articles related to maritime disasters and oil spills would strongly affect a company’s environmental performance. On the opposite, news articles about […] financing needs of women-owned businesses in developing countries [source] with a more positive tone would positively contribute to a better ESG score. Our approach is to look at the difference between a company sentiment and its industry average; how much more “positive” or “negative” a company is perceived across all its financial services news articles, over time.

次の例では、主要な FSI の1つとその業界平均とのセンチメント(15日間の移動平均を使用)の差を示しています。2020年 3月の COVID-19(新型コロナウイルス感染症)ウイルス発生の影響をうけた特定の期間を除けば、この企業は常に業界平均を上回るパフォーマンスを行っており、全体的な環境スコアが良好であることがわかります。

業界平均と比較した金融ニュース記事のセンチメント分析

このアプローチを GDELT データセット記載の全ての企業に適用することで、公式の ESG レポートにアクセス可能な少数の FSI に限定されなくなり、それぞれの企業に対して、環境、社会、ガバナンス全体にわたる内部スコアを作成することができます。つまり、ESG の評価の焦点を、主観的なものからデータ駆動型にシフトし始めました。

伝播型の重み付き ESG 指標の導入

In a global market, companies and businesses are inter-connected, and the ESG performance of one (e.g. seller) may affect the reputation of another (e.g. buyer). As an example, if a firm keeps investing in companies directly or indirectly related to environmental issues, this risk should be quantified and must be reflected back on companies’ reports as part of their ethical investment strategy. We could cite the example of Barclays’ reputation being impacted in late 2018 because of its indirect connections to tar sand projects (source).

影響要因の特定

Democratised by Google for web indexing, Page Rank is a common technique used to identify nodes’ influence in large networks. In our approach, we use a variant of Page Rank, Personalised Page Rank, to identify influential organisations relative to our key financial services institutions. The more influential these connections are, the more likely they will contribute (positively or negatively) to our ESG score. An illustration of this approach is reported below where indirect connections to tar sand industry may negatively contribute to a company ESG score proportional to its personalised page rank influence.

Using Graphframes, we can easily create a network of companies sharing a common media coverage. Our assumption is that the more companies are mentioned together in news articles, the stronger their link will be (edge weight). Although this assumption may also infer wrong connections because of random co-occurrence in news articles (see later), this undirected weighted graph will help us find companies’ importance relative to our core FSIs we would like to assess.

val buildTuples = udf((organisations: Seq[String]) => {
    // as undirected, we create both IN and OUT connections
    organisations.flatMap(x1 => {
        organisations.map(x2 => {
        (x1, x2)
        })
    }).toSeq.filter({ case (x1, x2) =>
        x1 != x2 // remove self edges
    })
})
    
val edges = spark.read.table("esg_gdelt")
    .groupBy("url")
    .agg(collect_list(col("organisation")).as("organisations"))
    .withColumn("tuples", buildTuples(col("organisations")))
    .withColumn("tuple", explode(col("tuples")))
    .withColumn("src", col("tuple._1"))
    .withColumn("dst", col("tuple._2"))
    .groupBy("src", "dst")
    .count()
    
import org.graphframes.GraphFrame 
val esgGraph = GraphFrame(nodes, edges)

By studying this graph further, we observe a power of law distribution of its edge weights: 90% of the connected businesses share a very few connections. We drastically reduce the graph size from 51,679,930 down to 61,143 connections by filtering edges for a weight of 200 or above (empirically led threshold). Prior to running Page Rank, we also optimise our graph by further reducing the number of connections through a Shortest Path algorithm and compute the maximum number of hops a node needs to follow to reach any of our core FSIs vertices (captured in `landmarks` array). The depth of a graph is the maximum of every shortest path possible, or the number of connections it takes for any random node to reach any others (the smaller the depth is, denser is our network).

val shortestPaths = esgGraph.shortestPaths.landmarks(landmarks).run()
val filterDepth = udf((distances: Map[String, Int]) => {
    distances.values.exists(_ < 5)
})    

グラフの最大深度が 4になるようにフィルタリングします。この処理により、グラフは 2,300社の企業と 54,000の接続にまで縮小されます。これにより、業界の影響力をよりよく把握するために、ページランクアルゴリズムをより広範囲に、より多くの反復で実行することが可能になります。

val prNodes = esgDenseGraph
    .parallelPersonalizedPageRank
    .maxIter(100)
    .sourceIds(landmarks)
    .run()  

以下のグラフのように、特定の企業(ここではバークレイズ)に対して影響力のある上位100ノードを直接可視化することができます。バークレイズは、予想どおり主要な FSI(JP モルガン・チェース、ゴールドマン・サックス、クレディ・スイスといった投資機関)と深く結びついていますが、証券取引委員会(SEC)、連邦準備制度理事会(FRB)、国際通貨基金(IMF)とも深い結びつきがあります。

バークレイズ社を例に挙げた、結びつきによる ESG スコアの影響

この分布グラフの裾野の方には、ファーウェイ、シェブロン、スターバックス、ジョンソン・エンド・ジョンソンなどの上場あるいは非上場企業があります。これら全ての企業(または自然言語処理によって見い出される事業体)は、関連性の強さに違いがあったり、結びつきが直接的だったり間接的だったり違いはありますが、理論的にはバークレイズの ESG パフォーマンスに良くも悪くも影響を与え、ひいてはバークレイズの評判にも影響を与える可能性があります。

伝搬型指標としての ESG

上記で取得した ESG スコアと各事業体の重要度を組み合わせることで、各事業体がバークレイズに対する相対的な重要度に比例して ESG スコアに影響を与える「バークレイズネットワーク(Barclays network)」の加重平均を容易に求めることができます。このアプローチを伝播型の重み付き ESG スコア(PW-ESG)と呼んでいます。

ワードクラウドを用いた可視化を行って、あらゆる企業のネットワークにおける悪い影響あるいは良い影響を観察します。下の図は、特定の組織(組織名は伏せ字にしています)に対する悪い影響(ESG にマイナスに働いている事業体)を示しています。

ワードクラウドを用いた可視化による特定の組織の ESG 評価への影響

ニュース分析の性質上、トムソン・ロイターやブルームバーグなどのニュース通信社や、Facebook(フェイスブック)や Twitter(ツイッター)などのソーシャルネットワークが、強く結びついた組織として観察されても不思議ではありません。特定の企業の真の結びつきを反映しているのではなく、ニュース記事中の単純な共起による説明であることを考慮すると、ページランクによる処理の前に、結びつきの度合いがある一定より高いノードを削除するフィルタリングを行うことを検討する必要があります。しかし、この余計なノイズは、FSI 全体に一定に発生するようなので、ある組織が他の組織に比べて不利になることはないと考えられます。別のアプローチとして、未加工のテキストコンテンツに対して高度な自然言語処理を施して抽出した、確証済みの結びつきを使用して、グラフを構築することもできます。しかし、これは、このプロジェクトの複雑さとニュースのスクレイピング処理に関連するコストを大幅に増加させることになります。

最後に、前のセクションで計算した元の ESG スコアと、環境、社会、ガバナンスの各側面に PW-ESG アプローチを使用して、スコアがどの程度減少あるいは増加したかを示します。以下の例では、ある企業の場合、初期スコア 69、62、67 が 57、53、60に減少しており、環境領域に対して PW-ESG の最もマイナスの影響 (-20%) がありました。

伝播型の重み付き ESG スコア(PW-ESG)アプローチにより算出された加重平均で、環境、社会、ガバナンスのスコアが増減

Using the agility of Redash coupled with the efficiency of Databricks’ runtime, this series of insights can be rapidly packaged up as a BI/MI report, bringing ESG as-a-service to your organisation for asset managers to better invest in sustainable and responsible finance.

この新しいフレームワークには十分な汎用性があり、複数の事例に適用可能であることは特筆に値します。主要なFSIは、評判リスクをより良く評価するために、自社をページランクのランドマークと考えるかもしれませんが、アセットマネージャーは、投資判断の際の一つ一つに関連して持続可能性をより適切に評価できるように、全てのポジションをランドマークと考えることができます。

市場リスクへの ESG の適用

In order to validate our initial assumption that […] higher ESG ratings are generally positively correlated with valuation and profitability while negatively correlated with volatility, we create a synthetic portfolio made of random equities that we run through our PW-ESG framework and combine with actual stock information retrieved from Yahoo Finance. As reported in the graph below, despite an evident lack of data to draw scientific conclusions, it would appear that our highest and lowest ESG rated companies (we report the sentiment analysis as a proxy of ESG in the top graph) are respectively the best or worst profitable instruments in our portfolio over the last 18 months.

ESG スコアと収益性の相関関係

興味深いことに、CSRHub のレポートによると、Pearson 社(メディア)は ESG スコアで Prologis 社(不動産賃貸)を10ポイント上回っており、ESG スコアが主観的であること、伝えられることと実際に観測されることの間に不一致があることを浮き彫りにしています。

Following up on our recent blog post about modernizing risk management, we can use this new information available to us to drive better risk calculations. Splitting our portfolio into 2 distinct books, composed of the best and worst 10% of our ESG rated instruments, we report in the graph below the historical returns and its corresponding 95% value-at-risk (historical VaR).

ESG スコアと市場のボラティリティの相関関係:ESG の評価が低いほど VaR が高くなる

Without any prior knowledge of our instruments beyond the metrics we extracted through our framework, we can observe a risk exposure to be 2 times higher for a portfolio made of poor ESG rated companies, supporting the assumptions found in the literature that ”poor ESG […] correlates with higher market volatility”, hence to a greater value-at-risk.

前回のブログでも取り上げたように、リスク管理の未来は、俊敏性とインタラクティブ性にあります。リスクアナリストは、企業が直面するリスクを特定し、定量化するための新しい方法を模索するために、従来のデータを新しいデータや洞察で強化すべきです。クラウドコンピューティングの柔軟性と拡張性、Databricks のランタイムによって可能になったデータの高いインタラクティブ性を活用することで、さまざまな業界、国、セグメント、そして現在では ESG 格付けで市場リスクを細かく分析し、ビジネスが直面するリスクを深く理解することができます。このデータ駆動型の ESG フレームワークにより、「この企業の環境格付けを 10ポイント上げると、リスクはどの程度低下するか?」や、「PW-ESG のスコアが低い場合、これらの商品に投資することで、どれだけ多くのエクスポージャーに直面するか?」といった問題にも答えられるようになります。

ESG 戦略の転換

このブログでは、各投資の持続可能性の側面をより深く理解するために、複雑な文書を主要な ESG への取り組みにすばやく要約する方法、グラフ分析を使用して、グローバル市場が組織戦略と評判リスクの両方に与える影響を明確に特定する、ESG への新たなアプローチを紹介しました。最後に、ESG 要因が市場リスク計算に与える経済的影響を示しました。より良いデータ駆動型 ESG 開発の出発点として、このアプローチはさらに改善することが可能です。それには、お客様が保有するあらゆる投資に関する内部データと、第三者のデータから得られる追加指標を導入すること、そしてより持続可能な金融と収益性の高い企業投資を推進し続けるために PW-ESG フレームワークを介してリスクを伝播させることが考えられます。

Try the following notebooks on Databricks to accelerate your ESG development strategy today and contact us to learn more about how we assist customers with similar use cases.

Databricks 無料トライアル 使ってみる

ご登録