TAPE Benchmark

Model Evaluation

For a more detailed evaluation results of the models see below:

ruGPT-3 Small

Winograd

RuWorldTree

RuOpenBookQA

Ethics₁

Ethics₂

MultiQ

CheGeKa

ruGPT-3 Medium

Winograd

RuWorldTree

RuOpenBookQA

Ethics₁

Ethics₂

MultiQ

CheGeKa

ruGPT-3 Large

Winograd

RuWorldTree

RuOpenBookQA

Ethics₁

Ethics₂

MultiQ

CheGeKa