MBPP
benchmarkko
GenRank Score
1.8
파이썬 프로그래밍 문제를 평가하기 위해 설계된 벤치마크 데이터셋으로, 코드 생성 모델의 성능 측정에 사용됩니다.
Also Known As
MBPPMostly Basic Python Problems
1 question•1 category
Score
1.8
Rank
#24
Score History
Loading score data...
Average Rank
#5.0
Median
#5
Range
#5–#5
🎯Top 5 in 1/1 models
Rankings by Model
Gemini 2.0 Flash #5