Japanese Docs
Search…
Tournament概要
公式ルールと始め方ガイド

Tournament概要

前書き

Numerai Tournamentとは、株式市場の動向を予測し、競争するプラットフォームです。 参加者は難読化されたデータを使用して機械学習モデルを構築し、予測ファイルを提出することでTournamentに参加できます。 また、提出した予測ファイルにNMRと呼ばれる暗号通貨を賭けると、パフォーマンスに基づいてNMRを獲得できます。 Numeraiに提出された予測ファイルは、Numeraiが保有するヘッジファンドのモデル(メタモデル)を設計するために使用されます。下に示すyoutubeを見ることで、どのようにデータが使用されるか学べます。

概要

1.Numeraiに登録する。 2.トレーニングデータとサンプルスクリプトを含むデータセットをダウンロードする。 3.モデルを作成し、予測をNumeraiに送信する。 4.モデルにNMRを賭けて、パフォーマンスに基づいてNMRを貰う/払う 6.毎週の提出物を自動化する。

データ

Numerai Tournamentの中核は無料のデータセットが使用できることです。データセットはクリーンアップ・正規化・難読化された高品質の財務データで構成されています。
提供されているtraining_dataでは、各idは難読化されたfeaturesのセットを持つ株式に対応しています。 targetは将来のパフォーマンスを表します。行は、異なる時点を表すerasにグループ化されています。 詳細は本記事に詳しく記述されています。

モデリング

Numerai Tournamentでは、過去のデータを用いて予測モデルを作成し、そのモデルを用いて将来の株式市場を予測することが目的です。 PythonでXGBoostを使用した基本的な例を次に示します。 過去のトレーニングデータを使用してモデルをトレーニングし、ライブTournamentデータで予測を行います。 (*本プログラムのみでは予測ファイルの提出ができません。より実践的な例は本記事をチェックしてください。
1
import pandas as pd
2
from xgboost import XGBRegressor
3
4
# training data contains features and targets
5
training_data = pd.read_csv("numerai_training_data.csv").set_index("id")
6
7
# tournament data contains features only
8
tournament_data = pd.read_csv("numerai_tournament_data.csv").set_index("id")
9
feature_names = [f for f in training_data.columns if "feature" in f]
10
11
# train a model to make predictions on tournament data
12
model = XGBRegressor(max_depth=5, learning_rate=0.01, \
13
n_estimators=2000, colsample_bytree=0.1)
14
model.fit(training_data[feature_names], training_data["target"])
15
16
# submit predictions to numer.ai
17
predictions = model.predict(tournament_data[feature_names])
18
predictions.to_csv("predictions.csv")
Copied!

予測ファイルの提出

毎週土曜日の18:00 UTC(日本時間では日曜日03:00 JST) に新しいラウンドが始まり、新しいTournamentデータが公開されます。Tournamentデータを用いて予測値の入ったファイルを作成し、Numeraiに提出しましょう!
締め切りは月曜日14:30 UTC (日本時間では月曜日23:30 JST) です。提出が遅れた場合、ペイアウトの対象外となります。 NumerapiRnumeraiGraphQL API を使用することもできます。 以下は、コードの例です。
1
import numerapi
2
napi = numerapi.NumerAPI("public_id", "secret_key")
3
4
# download data
5
napi.download_current_dataset(unzip=True)
6
7
# upload predictions
8
napi.upload_predictions("predictions.csv", model_id="model_id")
Copied!
また、Numerai-cli を用いて毎週の予測ファイル提出を自動化することもできます。
1
# setup your cloud infrastructure
2
numerai setup
3
4
# copy the example model
5
numerai docker copy-example
6
7
# deploy the example model
8
numerai docker deploy
Copied!
prediction.csv

モデルパフォーマンスの診断

モデルパフォーマンスはDIAGNOSTICSに示される指標を用いて診断することができます。過去のデータから提出した予測ファイルのパフォーマンス・リスクを評価する指標が表示されます。
この評価ツールを繰り返し使用すると、すぐにオーバーフィットします。本ツールは、最終チェックとして使用するのが望ましいです。
詳細についてはこのフォーラム投稿を読んでください。

モデルの評価方法

あなたが提出した予測結果は、あなたの予測と真のターゲットの correlation (ここではspearmanの順位相関)でスコアリングされます。相関性が高いほど高いペイアウトを得られます。
scoring_function.py
1
# method='first' breaks ties based on order in array
2
ranked_predictions = predictions.rank(pct=True, method="first")
3
correlation = np.corrcoef(labels, ranked_predictions)[0, 1]
Copied!
予測結果は、メタモデルへの寄与(mmc)と機能の中立的な相関(fnc)についてもスコアが付けられます。 各提出物は、Tournamentが開始してから4週間にわたって評価されます。締め切り後の木曜日に最初の評価を受け取り、4週間後の水曜日に最終スコアを受け取ることができます。合計で20スコアの加重平均値がペイアウトされるNMRの量を決定します。
Tournamentが終了するまでには約4週間かかるため、毎週新しい予測ファイルを提出すると、進行中の4つのラウンドから各スコアリング日に複数(最大4)の評価を受け取ります。
モデルのライブスコアは、プロフィールページで公開されています。これは、過去20ラウンドにわたるモデルの最終スコアの例です。
特定のラウンドにズームインして、ラウンド内の毎日のスコアを確認することもできます。

ステーキングとペイアウト

モチベーション

シビル攻撃などのNumeraiにとって不都合な攻撃を防止しつつNMRをペイアウトするにはどのようなシステムを設計すればよいでしょうか? その答えはステーキング(=預け入れ)です。各参加者はNMRを掛け金として自分の予測の正確さを担保します。NMRのステーク量が多ければ多いほど予測に自信をもっているとみなします。 Numeraiは正確な予測ファイルの提出を望んでおり、良い予測には高い報酬で報います。 どれだけのNMRを得られるかはNMRのステーク量と、Corr,MMCの値に依存します。 これは、Skin in the Gameという本で述べられているメゾットを使用しています。 NumeraiにNMRをステーキングする場合、Numeraiはシビル耐性のある方法を提供します。NMRのペイアウトはステーク量に比例するため、複数のアカウントを作成するだけでは多くのペイアウト得ることができません。 もちろん、NMRをステークせずにNumeraiに参加することもできます。 例えば、Tournamentの詳細や自分のモデルの性能を知るために、NMRをステークしないのは良いテストとなるでしょう。 自分のモデルに自信が持てるようになったら、そのモデルにステークすることができます。ステークの最小値は3NMRです。

ステーク量の変更方法

Numeraiのウェブサイトでは、「Manage Stake」をクリックしてステーク量を管理できます。このモーダルを使用すれば、NMRのステーク量を増減したり、CorrCorr+1/2MMCCorr+MMCCorr+2MMCにベットできます。 ステーキングとは、NMRをイーサリアムブロックチェーンのスマートコントラクトに固定することを意味します。ステーク中はNumeraiがロックアップされたNMRを増減させる権利を保有します。
NMRのステーク量を増やすと、あなたのウォレットからNMRが引き出され、Numeraiの保有しているアカウントにNMRが移送されます。 NMRのステーク量を減らすと、Numeraiの保有しているアカウントからNMRが移送され、あなたのウォレットに入金されます。
ステーク量への変更はすぐに適用されるのではなく、約4週間後に反映されます。これは、Tournamentの終了期間が4週間であることに起因します。

ペイアウト

どれだけのNMRを得られるかはNMRのステーク量と、Corr,MMCの値に依存します。 スコアが高いほど、より多くのNMRを得ることができます。もし負のCorr,MMCとなった場合、ステークしたNMRの一部が没収され、バーンされます。 バーンとはERC-20トークンの持つ機能の一つであり、トークンを永遠に使用できなくする操作のことです。 ペイアウトされるNMRの量はステークした量の±25%に制限されています。 ペイアウトは以下の式で計算されます。 payout = stake_value payout_factor (corr corr_multiplier + mmc mmc_multiplier) stake_value:ラウンド開始時点の最初の木曜日にステークしたNMRの量 payout_factor:30万NMR以下では1、30万NMR以上では以下の図に示す値をとります。Numeraiはペイアウトの上限を決めることで持続的なTournamentの開催を行うことができます。
corr:提出した予測ファイルとターゲットの相関 corr_multiplier:現在は1のみ mmc:提出した予測ファイルとメタモデルの相関 mmc_multiplier:0,0.5,1,2の中で一つ選べる。 ペイアウトファクターの関数やマルチプライヤーは、Numeraiによって変更される可能性があります。 ペイアウト計算の例を下図に示します。 最初の2つの例は、corr_multiplierの影響を示しています。 3番目の例は、負のスコアがペイアウトに影響を与えるかを示しています。 4番目の例は、ペイアウトがステーク量の±25%に制限されていることを示しています。
スコアは毎日更新されますが、ペイアウトはTournamentの終了日(日本時間の木曜日)にのみ行われます。参加者の一人が作成したNumeraiPayoutsアプリを使用すると、毎日の変化を追跡できます。 ステークを開始すると、最初の4ラウンドの間ステーク値は一定に保たれます。その後、4週間前のラウンドの支払いに基づいて、ステーク値が毎週更新されます。
提出した予測ファイルがプラスのCorr、MMCを持ち続ける限り、得られたNMRの量は増大します。モデルが52週間、毎週同じ正のスコアを取得すると仮定した場合の支払い予測の例を下図に示します。

濫用防止

Numeraiは、積極的にペイアウトルールを悪用している、または悪用していると判断した場合には、賭け金を払い戻し、すべての得られたNMRを無効化にする権利を保有します。
Numeraiの支払いシステムは攻撃に強いように設計されています。ユーザーが罰を恐れずに新しいアイデアを試してもらいたいため、この権利を行使することはめったにありません。
悪質な攻撃を発見した場合には、そのことをコミュニティに伝えてください。以前あった攻撃の一つがこちらで紹介されています。

リーダーボード

NMRのペイアウトはラウンドごとのパフォーマンスに左右されます。リーダーボードに掲載される評価や順位は20ラウンド分のCorr,MMCの加重平均値を用いています。 詳しくは、 Reputation のセクションを参照してください。

サポート

助けが必要ですか?
質問、サポート、フィードバックは RocketChat にお願いします!
Last modified 5mo ago