MBPP

benchmarkko
GenRank Score
1.8

파이썬 프로그래밍 문제를 평가하기 위해 설계된 벤치마크 데이터셋으로, 코드 생성 모델의 성능 측정에 사용됩니다.

Also Known As

MBPPMostly Basic Python Problems
1 question1 category

Score History

Loading score data...
Average Rank
#5.0
Median
#5
Range
#5#5
🎯Top 5 in 1/1 models

Rankings by Model

Gemini 2.0 Flash #5