FNCについて

Feature Neutral Correlation (FNC)

Motivation

Feature Neutral Correlation(FNC)とは、モデルの予測値と、Numeraiがもつすべての特徴量を中和した後の、ターゲットとの相関のことです。 少数の特徴量に依存しているモデルは、FNCが低くなりますが、短期的には高いパフォーマンスを持つかもしれません。 たとえば、dex7を予測値としたこのモデルは、高いパフォーマンスを示す時期があります。

しかし、このようなモデルでは長期的なパフォーマンスが低い可能性があります。 様々な特徴量を使用し、なおかつターゲットとの相関性が高いモデルは、FNCが高く、長期的に安定したパフォーマンスを発揮する可能性が高いです。

FNCの計算方法

・あるラウンドにおけるユーザのFNCを計算するために、提出された予測値を正規化します。 ・Numeraiがもつ特徴量に対して中和をします。 ・中和された予測値とターゲットとのスピアマン順位相関を計算します。

def calculate_fnc(sub, targets, features):
"""
Args:
sub (pd.Series)
targets (pd.Series)
features (pd.DataFrame)
"""
# Normalize submission
sub = (sub.rank(method="first").values - 0.5) / len(sub)
# Neutralize submission to features
f = features.values
sub -= f.dot(np.linalg.pinv(f).dot(sub))
sub /= sub.std()
sub = pd.Series(np.squeeze(sub)) # Convert np.ndarray to pd.Series
# FNC: Spearman rank-order correlation of neutralized submission to target
fnc = np.corrcoef(sub.rank(pct=True, method="first"), targets)[0, 1]
return fnc

Discussion

より詳しいFNCの計算についてはこちらをご覧ください。