ゴール期待値は何を表すか

ゴール期待値は何を表すか

2021年10月13日 0 投稿者: マツシタ
Pocket

サッカーは運に支配されたスポーツだといわれる。このスポーツの「不安定さ」の要因はゴールによるところが大きいと思う。

サッカーにおけるゴールは不思議なものだ。メッシやロナウドでさえPKを失敗するし、かと思えば信じられないようなスーパーゴールが決まる。誤差ともいえるボールのずれで枠に弾かれたボールがどこに跳ね返るかが変わる。審判の判定ひとつであったはずのゴールが取り消されたり、なかったはずのゴールが生まれたりする。極めつけはセットプレーだ。あれはもはや別のスポーツで、いいキッカーやいいヘッダーがいれば点が取れてしまう。

そして、たったひとつのゴールの差で勝敗が決するというルールもサッカーの不安定さに拍車をかけている。

ただでさえこんなに得点数が少ない球技はない。そのゴールの決まり方がとても気まぐれなのだ。サッカーが運のスポーツだといわれるのも納得である。

そんな不安定なゴールについて、定量的に観測しようという指標がある、ゴール期待値だ。英語の「expected goals」を略してxGとも呼ばれるこの指標は近年急速に市民権を得ており、いまや代表的なデータとして定着した印象すらある。

それでは、ゴール期待値は一体何を表すのだろうか。今回はこの指標を深く掘り下げていこうと思う。




ゴール期待値とは

ゴール期待値とは、それぞれのシュートについてゴールにつながる確率を数値化した指標だ。確率なのでひとつひとつのシュートに与えられる得点確率は0~1の間になる。

数値を決定する要因は様々だ。

  • シュートを打った場所(距離、角度)
  • シュートした部位(右足、左足、頭、その他)
  • 近くにいるDFの配置
  • そのシュートに至るまでのプレーの流れ(カウンター、セットプレー)etc…

このほかにも様々な決定要素があるようだが、そのうちどれを用いているかはサイトによって異なる。また、新たな項目を加えながら日々進化し続けてもいる。なので、指標として明確なものを提示することは難しいらしい。

何はともあれ、シュートがゴールにつながる確率を数値化したものだと大まかにとらえておけばいいだろう。

ゴール期待値は普通、ある一定時間内に計測された数値の合計として表示される。前半なら前半の、1試合全体ならその試合に生まれたシュートすべてに与えられたゴール期待値の合計が表示される。

より分かりやすくするために具体例を挙げてみたい。欧州5大リーグの全試合についてゴール期待値を計測しているデータサイト「understat.com」から、先日9月27日に行われたローマダービーのゴール期待値を引用する。

こちらがローマダービーにおける1試合通したゴール期待値だ。ピッチ上に点で表されているのは両チームがシュートを打った場所で、円の大きさはゴール期待値の大きさ(シュートが決まる確率の高さ)を表している。星マークになっているのはゴールにつながったシュートだ。

ここで注目したいのは星マーク=得点につながったシュートの期待値が必ずしも大きいわけではないこと。星マークが大きいものは簡単なシュートが順当にゴールになったことを意味し、逆に星マークが小さいものは難易度が高いシュートがゴールにつながったことを表している。また、大きな円(だが星マークになっていないもの)に関しては決定的なチャンスを外してしまったことを意味している。

 

こちらはゴール期待値の合計を時間帯ごとに表示したものだ。このように、それぞれのシュートに与えられたゴール期待値は積み重なっていき、最終的にはその合計値が1試合に生まれたゴール期待値として表示される。1本1本のシュートの期待値が個別に表示されることは少ない。

 

この試合を見てみると、ラツィオはゴール期待値2.48で3ゴール、ローマは1.84で2ゴールを記録している。期待値に近いゴール数が決まっているといえるだろう。

これだけを見ると、ゴール期待値は気まぐれなゴールについてかなり正確に予測する指標に見える。果たして、ゴール期待値は試合のスコアを予見する指標なのだろうか。




ゴール期待値はスコアを正確に表すのか

ゴール期待値と実際の得点との誤差がどれくらいなのかを調べるため、昨季(20-21シーズン)のセリエA全380試合についてのゴール期待値と実得点とを集計し、データ化してみた(前述のunderstat.comよりデータを引用)。下がその結果を表したグラフだ。

20-21セリエAにおけるゴール期待値と実得点の関係性をグラフ上に点としてプロットしたもの。

これを見ると、ゴール期待値は必ずしも正確にスコアを予測するものではないことが見えてくる。

ゴール期待値の「2」の部分について下から上に見てみよう。ゴール期待値2.0を記録しながら無得点に終わっているチームもあれば、倍以上の5得点を挙げているチームも存在する。おなじゴール期待値を記録しても、実際の得点には5点もの幅があるのだ。

あるいは、実得点の「1」についても左から右へと見てみよう。同じ1ゴールを挙げたチームであっても、ゴール期待値がほぼ0のチームもあれば(ほとんど決定的なチャンスがなかったものの、難易度が高いシュートを決めていることを意味する)、4.0というとても高いゴール期待値を記録している(にもかかわらず1ゴールに終わった)チームも存在している。

このように見てくると、ゴール期待値と実得点の間には大きな乖離があるように思えてくる。

 

もう一つデータを挙げよう。

こちらはゴール期待値と実得点の差を棒グラフで表したものだ。実得点-ゴール期待値により計算。

こうしてみると、実得点と期待値との間に大きなばらつきがあることがわかりやすいと思う。左の山(実得点がゴール期待値を下回ったチーム)の平均値を計算したところ-0.72、右の山(実得点がゴール期待値を上回ったチーム)の平均値を計算したところ+0.81であった。サッカーが1点で勝敗が決まることを考えると、この差は決して小さくはないと思う。

たしかに2つの山を平均すると実得点に近づくのだけれど、実態をみるとかなり大きなばらつきがみられるのだ。

 

このようにしてみていくと、ゴール期待値は必ずしも試合のスコアと一致する指標ではなさそうだ。むしろ、実際に決まるゴールの数は気まぐれで、予測通りにはいかないという一般的な印象を裏付ける結果になっている。

それでは、ゴール期待値は一体何のためにあるのだろうか。我々はこの指標をどのように活用すればいいのだろうか。




ゴール期待値の真の目的は?

ここで、先ほど紹介したunderstat.comのホームに記載されているゴール期待値の説明の和訳をみてみよう。

特に重要なのが2行目と3行目だ。

これはサッカーというスポーツの本質にも迫る話だ。ここまで見てきたように、サッカーにおいてゴールが決まるかどうかは運に左右される部分が大きく、作り出したチャンスの数が必ずしも正確にゴールに反映されるわけではない。だから、試合結果だけでチームのパフォーマンスを判断するには限界がある

それでは何を基準に考えればいいのか。その答えの一つになりうるのが作り出したチャンスの質だ。サッカーにおいての最大の目的は勝利することだが、それに迫るための手段を最も簡単に言い表せば「ピンチを最小化しつつチャンスを最大化すること」とまとめられると思う。

ゴールが決まるかどうかは属人的な部分が大きくなり、運の要素も絡んでくる。しかし、その前段階まではチームとして戦術を整備し、戦略を持って試合に臨むことである程度デザインすることができる。守備に関してもしかりだ。

そのチャンスを作る・作らせないという部分に着目したのがこのゴール期待値という指標だ。前述のように、ゴール期待値は1試合で生まれたゴール期待値を積み上げたものだ。これを見ることで自分たちがどれほど質が高いチャンスを作れたか、逆に相手にどれくらい危険なピンチを作られたかがわかるのである。

試合内容を数値化するための指標。それがゴール期待値なのだ。




試合内容は結果に反映されるか

ゴール期待値が試合内容を反映しているとして、それがどれくらい結果に反映されるのか調べてみよう。チームとしてのピンチの最小化・チャンスの最大化はどれくらい結果に結びつくのだろうか。いいかえれば、戦術や戦略によってどの程度試合をコントロール下に置くことができるのだろう。

20-21セリエAにおいて、ゴール期待値を上回ったチームの試合結果をまとめた円グラフ。 ※このグラフを図1とする。

 

このグラフから読み取れることをまとめてみよう。

ほんの少しでも相手を上回るゴール期待値を記録した(=相手よりも質が高いチャンスを作り出した)場合、

  • そのチームが勝利する確率は60%
  • そのチームが引き分ける確率は25%
  • そのチームが負ける確率は15%
  • そのチームが獲得する平均勝ち点は2.05

相手よりもチャンスの質で上回っても15%は負けてしまう。これに関して、多いと感じるか少ないと感じるかは微妙なところだ。しかし、得られる平均勝ち点が2.05と考えると、試合内容で上回ることがかなりの確率で結果につながるととらえていいんじゃないだろうか

 

さて、先ほどのケースでは相手と比較して少しでもゴール期待値が上回った場合について見たわけだが、その内実は実に様々だ。0.01という誤差の範囲と言えるケースもあれば、相手の数倍のゴール期待値を記録したケースも混在している。

対戦相手とのゴール期待値の差分がどれくらいであればより確実に勝利に近づけるのだろうか。ここでは、サッカーでは1点差でも勝敗が決することを鑑みて効果的なゴール期待値の差を1と仮定し、上回った期待値の差が1以上か1未満かで分けて考えてみたい。

まずは対戦相手よりも1以上ゴール期待値で上回った場合について見てみよう。

20-21セリエAにおいて、相手と比較して1以上多くのゴール期待値を記録したチームの最終結果をまとめた円グラフ。

 

このグラフから読み取れることをまとめてみよう。

相手よりも1以上大きいゴール期待値を記録した場合、

  • そのチームが勝つ確率は72%
  • そのチームが引き分ける確率は20%
  • そのチームが負ける確率は8%
  • そのチームが得る平均勝ち点は2.36

期待値の差が1を超えるほど作り出したチャンスの質に差があった場合、7割以上の確率で勝利につながり、負ける確率は10%以下だ。これは「ピンチを最小にしつつチャンスを最大にする」というサッカーにおけるチーム目標の妥当性を強く裏付けるデータだといえるのではないだろうか。これが高いレベルで達成されることで、運による敗戦の確率はかなり低く抑えることができるといえる。

 

続いて、期待値で相手を上回ったものの、その差が1を超えていないケースについても見てみよう。

20-21セリエAにおいて、相手よりもゴール期待値で上回ったものの、その差が1を超えていない場合についてそのチームの最終結果をまとめた円グラフ。

 

このグラフから読み取れることをまとめてみよう。

ゴール期待値で相手を上回ったものの、その差分が1未満であった場合、

  • そのチームが勝つ確率は48%
  • そのチームが引き分ける確率は31%
  • そのチームが負ける確率は21%
  • そのチームが得る平均勝ち点は1.75

相手との差がそこまで開いてないので、引き分け・負けの確率が増加して半分を超えてくる。しかし、それでも負けるのは5試合に1試合、平均勝ち点が1.75ということを見るとどうだろう。たとえ1以下であったとしても、少しでも相手より期待値が上回ることで勝ち点を拾うゴールが決まる確率はけっこう高くなるといえるんじゃないだろうか。

 

各試合のゴール期待値と実得点を比較することで、ゴールが期待通り決まるかどうかは気まぐれであることが見えてきた。しかし一方で、期待値の差と最終結果を比較すると、ピンチを最小化しチャンスを最大化するというチームとしてのパフォーマンスを最大限発揮できれば、かなりの割合で運を排除し、勝利に近づくことができることも見えてきた。

これはチームとしての取り組み、いわゆる戦術の妥当性を裏付けるものでもあるし、ゴール期待値が試合内容を知る上で有用な指標であることを裏付けるものでもあると思う。

そして、結果のみを見て判断することの危険性も示唆しているといえる。たとえ結果に結びつかないとしても、いい内容の試合をしていれば最終的には勝利を重ねていく確率が高い。逆に、勝利を重ねていても内容が伴っていないのであればいずれは負けが込んでくる確率が高いからだ。

サッカーにおける評価は結果よりも内容によるべきだし、その試合内容を知る上でゴール期待値は有用な指標だといえる。このデータを活用することで、よりサッカーに対する正しい見方が広がっていくことを期待したい。




いろいろ調べてみた

さて、今回の記事の要諦は書き終えたのだが、せっかく苦労して多くのデータを集めたのでいろいろと調べてみたくなった。ここからはQ&Aという形式で様々な項目について掘り下げて調べてみた結果を共有したい。

 

Q.1 シーズン全体で見てみるとどうなる?

試合を単体で見た場合、ゴール期待値と実得点は必ずしも一致しないことは見てきた通りだ。それでは、シーズン全体で見た場合、ゴール期待値はどれほど正確に実際の得点を反映しているのだろうか。

20-21シーズンの全38試合の合計ゴール期待値と総得点をグラフ上に点としてプロットした。

ここで注目したいのはR2乗の数値だ。これは決定係数と言って、縦軸の数値から横軸の数値が予測できる程度を0~1の範囲で示したものだ。縦軸から横軸の数値が完全に予測できる(直線など何らかの法則に従ってデータがプロットされる)とき、数値は1になる。

少し難しいことを書いたが、1に近いほど2つの指標間に強い相関関係があるとだけとらえてもらいたい。

その前提を置いたうえでシーズン全体のゴール期待値と実得点の決定係数を見てみると、0.89とかなり1に近い数値となっている。つまり、シーズン全体で見た場合、そのチームの合計得点はゴール期待値の合計数に近づいて行くのだ。

1試合1試合ではスコアの一致程度が不安定だったゴール期待値だが、シーズン全体を大雑把にとらえる場合はかなり正確なデータ指標だといえそうだ。




Q.2 ゴール期待値と失点期待値、どちらが順位に関係する?

シーズン全体で考えるときゴール期待値がかなり正確な指標であることが分かったところで、この指標を使ってさらにしらべてみたい。それが、ゴール期待値と失点期待値のどちらが最終順位に影響してくるのかということだ。

得点力があるチームと失点が少ないチーム、どちらがより安定した結果を得ているのだろう。

understat.comでは、ゴール期待値とともに失点期待値も公開されている。これを利用し、どちらが最終順位とより強い相関関係を示すのか見てみたい。

上にゴール期待値と失点期待値、それぞれが最終順位とどのような関係にあるのかを示した。

両者の決定係数を比較すると、ゴール期待値の方が0.7653、失点期待値の方が0.8232。そこまで大きな差ではないものの、失点期待値の大きさの方がより最終的な順位と比例する傾向にあるようだ。

事実、セリエAにおいてはここ4シーズン連続でもっとも失点数が多かった3チームがそのまま降格した3チームと一致している。このことを考えても、サッカーにおいては守備の構築が非常に重要であることがわかる。

あなたの応援するチームは守備が安定しているだろうか?もし不安定なら、それは危険な兆候かもしれない。




Q.3 下剋上はいかにして起こる?

次は、下位チームが上位チームを倒す、いわゆるジャイアント・キリング(下剋上)に焦点を当ててみたい。

セリエAでは、上位7チーム(インテルミランアタランタユベントスナポリラツィオローマ)が7強と呼ばれていて、彼らがトップ7を占める状態が続いている。16-17から20-21の5シーズンの間に彼らの中に食い込んだのは18-19のトリノただ1チームだけだ(この時のトリノは6位だった)。

これを受け、ここでは7強以外のチームが7強に勝利することを下剋上と呼びたい。これが起こるとき、両者のゴール期待値はどのような関係にあるのだろうか。

下剋上が起こった時、非7強チームの期待値が7強チームの期待値を上回っていたかどうかを示した円グラフ。

これを見ると、非7強が7強に勝利した試合ではゴール期待値でも上回っているケースが6割を超えていることがわかる。これは、先ほど図1で見た「ゴール期待値で相手を上回った時の勝率」とほぼ一致している。つまり、下剋上が起こるとき、それは運によるものであるよりも試合内容から見ても順当なケースが多いのだ。

戦力差をひっくり返すのは運ではなく、あくまでもチームとしての戦術や戦略、そしてそれを狙い通り実行できたかどうかという選手のパフォーマンスによることが多い。これが達成された場合、結果だけでなく内容でも7強を上回る余地がある。サッカーにおける戦術・戦略の重要性がより際立つ結果となった。




Q.4 7強が非7強相手に勝ち点を落とすときの共通点は?

とはいえ、先ほどのデータについて期待値で下回っているケースが4割近くあることも注目に値するだろう。図1から読み取れる「ゴール期待値で相手を上回った場合の負ける確率」が15%であったことを考えても、これはかなり大きい割合だといえる。

ここからは、非7強が7強相手に引き分けた場合も加えて考えてみよう。

非7強が7強と引き分けたとき、非7強のゴール期待値が相手と比較して上回っていたかどうかを示した円グラフ。

これを見ると、非7強が7強と引き分けた場合、8割以上で非7強側の方がゴール期待値で下回っていることがわかる。

下剋上が起こるときは内容でも非7強が勝っていることが多いのだが、引き分けるときは内容で負けているにもかかわらず勝ち点を拾っているケースが多く存在しているということになる。

 

以下では非7強が7強に勝利したケースと引き分けたケースを合算して「非7強が7強から勝ち点を奪った場合」として、このような試合の共通点を考えてみたい。

非7強が7強から勝ち点を奪った試合において、非7強の実得点がゴール期待値を上回ったか下回ったかを示した円グラフ

これを見ると、6割以上の試合で非7強の実得点がゴール期待値を上回っていることがわかる。これを多いととらえるべきかは難しいところだが、確実に言えるのは引き分けと勝利とで様相が大きく変わってくることだ。

非7強が勝利した=下剋上を達成したとき、非7強の実得点がゴール期待値を上回っていた確率は85.7%という非常に高い数字を記録した。

一方で、引き分けにとどまった場合、非7強の実得点がゴール期待値を上回っていた確率は48.5%。半分を割っていたのだ。

つまり、下剋上が達成されるときには難易度が高いゴールが決まっている一方、引き分けどまりの時はそうしたゴールが決まっている割合は少ないのである。これらには、特に共通点がみられない。

 

となってくるのは7強側のパフォーマンスだ。彼らについても実得点とゴール期待値の関係を見てみよう。

非7強に勝ち点を奪われた試合において、7強の実得点がゴール期待値を上回ったかどうかを示した円グラフ。

これを見ると、非7強に対して勝ち点を奪われた試合における7強の実得点がゴール期待値を上回った確率はわずか22%。8割近い確率でゴール期待値を下回る得点に終始していたのだ。

そしてここが重要だが、この傾向は引き分けだろうが敗戦だろうが変わらなかった。7強が敗戦したとき、実得点がゴール期待値を上回っていたのは19%。引き分けたときのそれは23.5%だ。

つまり、7強が勝ち点を落とすとき、高い確率で期待値を下回る得点に終始しているのだ。決定的なチャンスを多く外しているのである。これが7強が勝ち点を落とすときの共通点と言えそうだ。

そこから非7強が勝利できるか引き分けどまりに終わるかは、期待値を上回る得点を記録できるかどうかにかかっている。さらにQ.3で見た通り、相手を上回る期待値を記録できるかどうか=試合内容でも上回れるかどうかも重要である。これが結論になりそうだ。




Q.5 上位チームほど期待値の差をひっくり返している?

それでは、今度はゴール期待値で下回ったにもかかわらず勝ち点を得たケースについて考えてみたい。ふつうはより質が高いチャンスを多く作ったチームが勝利する。それは、この記事でさんざん見てきた通りだ。しかし、そうした試合内容をひっくり返して勝ち点を得てしまうケースもまた一定数存在する。

そして、そうした「苦しいながらも勝利をもぎ取る」チームの多くが上位に進出するのではないかという仮説を立ててみたい。苦しくてもなんだかんだ勝ち点を得る。これができるかどうかは、長いシーズンの成績を左右しうるのではないだろうか。

そこで、7強vs非7強の試合において7強がゴール期待値で下回ったとき、最終的な試合結果がどうなったのか調べてみた。

7強vs非7強についてゴール期待値が下回ったチームが勝利した試合について、7強と非7強のどちらが勝利したかを表した円グラフ

これをみると、やはり7強の方がゴール期待値の上下関係をひっくり返して勝利を得ていることがわかる。仮説通りの結果だ。

これがいわゆるタレント力というやつなのかもしれない。ゴール期待値の高いシュート、いわゆる決定的なピンチを防げるGKがいる。逆に、ゴール期待値が低い、いわゆるスーパーゴールが決められるアタッカーがいる。彼らの存在が試合内容とは真逆の結果をもたらすと考えられる。だからこそ、彼らは評価され強豪クラブに移籍していくのだ。チームを勝たせられる選手、それが真のタレントなのかもしれない。

 

ちなみに、7強どうしの試合においても期待値が低いチームが勝利を得るケースが多かった。7強どうしの試合においてゴール期待値が低いチームが勝利したのは8試合。7強どうしの試合が1シーズンに42試合であることを考えると、およそ5試合に1試合の割合で期待値で下回ったチームが勝利しているのだ。

 

いずれにせよ、「内容で上回られても結果はきっちりもぎ取ることができるチームが上位に来る」という仮説は正しそうだ。すべての試合が思い通りなることはまずない。どんなに強いチームでも、シーズンに何試合華は苦しい展開が出てくる。そうした中でも何とか勝ち点を拾っていく力があることは、タイトルを取るチームにとって不可欠の要素だといえそうだ。




あとがき

今回は20-21シーズンのセリエAのみを対象にして色々な事象を検証・考察してきた。サンプル数が少なすぎる!というツッコミは正しいと思う。何シーズンも通してデータを集めるとまた違った結果が見えてくるかもしれないし、ほかのリーグも合わせて考えれば各リーグの特徴のようなものが見えてくるかもしれない。

今回行った考察自体が的外れだという指摘も考えられる。そう思ったなら、ぜひ自分でいろいろなデータを集めて反論としてまとめてみてほしい。この記事を入り口にして話が広がるのなら、いち物書きとしてうれしい。

この記事を読んで、皆さんのゴール期待値への印象が変わり、より積極的に活用してもらえれば幸いだ。