verum ipsum factum

sudillap's blog

TOEICで満点(990点)を取った人は何人か?

TOEICで満点のスコアである990点を取った人は何人いるのか気になったので、その人数を推定してみました。

TOEICの公式ホームページでTOEICの平均スコア・スコア分布が公開されており、そのページを見ればスコア区分(50点刻み)ごとの人数はわかります。しかし、不思議なことに895から満点の990点までは刻み幅が95に拡大されており、ここだけデータの間隔が粗くなっています。そのため、このスコア分布をただ見ただけでは満点(990点)を取った人が何人いるのか見当がつきません。

もし最低スコア10点から最高スコア990点まで、スコアごと(5点刻み)の人数が推定できれば、満点を取った受験者数を推定することができます。

TOEICは頻繁に実施されています。どの実施回のデータを分析対象にしても良いのですが、この記事では第177回(2013年1月)[受験者数:106,477人]のTOEICスコアを分析対象にします。

スコアごとの人数推定

とりあえず参考までに公開されているTOEICのスコア分布(トータルスコアとリスニング・リーディングスコア区分ごとの人数)のグラフを見ておきます。
f:id:sudillap:20130411214309p:plainf:id:sudillap:20130411214316p:plain

さて、公開されているスコア分布表にはスコア区分ごとの人数しか書かれていないので、この表からスコアごとの人数までは当然ながらわかりません。しかし、後述する方法によりこのデータだけから10~990まで5刻みでスコアごとの人数を推定しました。
下図がそのグラフです。横軸はスコアで、縦軸はそのスコアを取った受験者の推定人数を表しています。
スコアごとの人数の一覧表は参考までに後半に載せておきました。
f:id:sudillap:20130411222921p:plain
図からわかるように、満点スコア990のところでいきなり人数が急増しています。一見すると990だけ振る舞いが異なるため計算間違いのように思えますが、次のように考えればこの結果は合理的と考えられます。

まず、990より低いスコア(たとえば800)の場合で考えると、そのスコアの人数が意味することは、スコアちょうどの英語力を持っている受験者がその人数だけいるということです。
しかしスコア990の場合には人数の意味する内容が異なると考えられます。990を取った受験者の内訳を想像してみると、990ちょうどの実力を持っている人もいれば、990を遥かに超える英語力を持っていても、TOEICの満点990を超えるスコアを取ることは不可能なので結果的に990となった人もいます。すなわち、スコア990の人数には990以上の英語力を持った受験者すべてが含まれていることになるため、990の人数が急増したと考えられます*1

問題のスコア990を達成した受験者の人数ですが、後述するスコア別推定人数の一覧表をみると、満点990を達成した人は全受験者の0.33%と推測されます。
実際、TOEIC 全国公開試験で満点 990 を獲得せよによると、

第105回(2004年3月)全国公開試験において受験者の何人が 990 満点を獲得したかは、990 満点を獲得した受験者のスコアレポートに記載されている Percentile Rank の数字で推測できます。過去の公開試験では、この数字が 99.7 / 99.8 / 99.9 / 100.0 のことがありました。

とのことで、990を獲得した人の割合は0.3%から0.0%であったことがわかります。この数字は本記事での推定割合0.33%と非常に近いので、スコア別人数推定値は案外いい線いっていると思います。
ちなみに、この引用文にあるPercentile Rank(パーセンタイルランク)とは、下位者100分比(%)のことで、そのスコアに満たない受験者が占める割合(%)を表しています。たとえば、990のPercentile Rankが99.7とすると990の人の割合は全受験者の0.3%(=100-99.7)となります。Percentile Rankの詳細については、公開テスト 平均スコア・スコア分布一覧の「スコア分布」ページの「■注意」を御覧ください。


さて、上の図は最小スコア間隔(5刻み)で最も細かいグラフでした。次に示す図は30点、40点、50点ごとに人数を集計したグラフです。スコア区分で集計することにより、グラフが990までなめらかにつながって見えます。
f:id:sudillap:20130411222900p:plain
f:id:sudillap:20130411222144p:plain
f:id:sudillap:20130411222912p:plain

次の図はスコア区分をTOEICの公式データと同じにして推定値を集計したグラフです。全体的に公表値と推定値がよく一致していることが分かります。
f:id:sudillap:20130412032339p:plain

第177回 TOEICスコアごとの推定人数一覧表

参考データとして、第177回(2013年1月)でのTOEICスコアごとの人数とその下位者100分比(%)の推定値一覧表を示します。

スコア 人数(推定値) 下位者100分比(%)(推定値)
10 3 0
15 1 0
25 1 0
30 1 0
35 1 0.01
40 1 0.01
45 1 0.01
50 1 0.01
55 1 0.01
60 1 0.01
65 2 0.01
70 1 0.01
75 3 0.01
80 3 0.02
85 3 0.02
90 3 0.02
95 4 0.03
100 6 0.03
105 6 0.04
110 7 0.04
115 10 0.05
120 9 0.06
125 14 0.07
130 18 0.08
135 19 0.1
140 23 0.11
145 28 0.14
150 29 0.16
155 35 0.19
160 39 0.22
165 45 0.26
170 52 0.3
175 56 0.35
180 68 0.4
185 81 0.47
190 89 0.54
195 92 0.63
200 109 0.71
205 115 0.82
210 124 0.92
215 143 1.04
220 163 1.17
225 173 1.33
230 185 1.49
235 200 1.66
240 229 1.85
245 237 2.07
250 252 2.29
255 274 2.53
260 293 2.78
265 312 3.06
270 346 3.35
275 368 3.68
280 375 4.02
285 399 4.37
290 415 4.75
295 449 5.14
300 471 5.56
305 495 6
310 521 6.47
315 557 6.96
320 552 7.48
325 582 8
330 608 8.55
335 622 9.12
340 655 9.7
345 687 10.32
350 697 10.96
355 751 11.62
360 753 12.32
365 782 13.03
370 790 13.76
375 821 14.5
380 830 15.28
385 844 16.05
390 855 16.85
395 888 17.65
400 907 18.48
405 920 19.34
410 937 20.2
415 954 21.08
420 957 21.98
425 971 22.87
430 981 23.79
435 1001 24.71
440 1019 25.65
445 1018 26.6
450 1028 27.56
455 1019 28.53
460 1034 29.48
465 1053 30.46
470 1056 31.44
475 1051 32.44
480 1050 33.42
485 1059 34.41
490 1065 35.4
495 1082 36.4
500 1070 37.42
505 1074 38.43
510 1081 39.43
515 1077 40.45
520 1076 41.46
525 1074 42.47
530 1088 43.48
535 1075 44.5
540 1079 45.51
545 1076 46.52
550 1082 47.53
555 1064 48.55
560 1072 49.55
565 1076 50.55
570 1036 51.56
575 1049 52.54
580 1050 53.52
585 1058 54.51
590 1047 55.5
595 1024 56.49
600 1040 57.45
605 1024 58.42
610 1006 59.39
615 991 60.33
620 993 61.26
625 986 62.2
630 993 63.12
635 965 64.05
640 946 64.96
645 944 65.85
650 914 66.73
655 918 67.59
660 922 68.46
665 899 69.32
670 881 70.17
675 891 70.99
680 853 71.83
685 851 72.63
690 844 73.43
695 838 74.22
700 810 75.01
705 798 75.77
710 796 76.52
715 780 77.27
720 771 78
725 758 78.72
730 748 79.44
735 730 80.14
740 711 80.82
745 729 81.49
750 711 82.18
755 688 82.84
760 679 83.49
765 673 84.13
770 664 84.76
775 639 85.38
780 632 85.98
785 616 86.58
790 620 87.16
795 605 87.74
800 582 88.31
805 579 88.85
810 571 89.4
815 557 89.93
820 528 90.46
825 529 90.95
830 514 91.45
835 499 91.93
840 494 92.4
845 478 92.87
850 447 93.31
855 437 93.73
860 415 94.14
865 402 94.53
870 393 94.91
875 374 95.28
880 358 95.63
885 342 95.97
890 329 96.29
895 307 96.6
900 294 96.89
905 273 97.16
910 261 97.42
915 241 97.66
920 221 97.89
925 202 98.1
930 189 98.29
935 172 98.46
940 159 98.63
945 146 98.78
950 134 98.91
955 128 99.04
960 115 99.16
965 105 99.27
970 93 99.37
975 86 99.45
980 77 99.53
985 67 99.61
990 351 99.67
合計 106,475 -

上の表の下位者100分比(%)をグラフしたものが下図です。
f:id:sudillap:20130411222928p:plain


ところで、公式ページの公開テスト 平均スコア・スコア分布一覧の「平均スコア」ページにはトータルスコアの平均と標準偏差が載っています。この数字と推定値と比較すると、両者がほぼ一致することがわかります。

公表値 推定値
平均スコア 570.3 567.8
標準偏差 174.0 176.9

スコアごとの人数推定方法

スコアごとの人数をどのように推定したか、概要を書いておきます。

用いたデータはTOEICスコア分布の公表値のみ。
手順は次のとおりです。

  • スコア区分ごとの人数データからカーネル密度推定により滑らかな推定スコア分布を求めます。
  • 推定スコア分布にしたがう乱数を生成することにより、受験者ごとの推定スコア(0から1100まで)を計算します。
  • 推定スコアを集計します。ただし、推定スコアが995以上となった人のスコアは990とみなして集計します(下図)。

f:id:sudillap:20130412130706p:plain

*1:WikipediaによるとTOEICの採点方法は普通のテストとは異なるので990での振る舞いは本記事の推測と異なるかもしれません。