MLB · model accountability

How the model
has held up

Every prediction we've made on MLB games, with every result. Pre-game probabilities are frozen at the moment of prediction — the backtest never reads from a future rating.

Hit rate

55.1%

1650 / 2996 games

Home-always baseline

53.5%

Naive: pick home every time

Edge over naive

+1.6pp

What the model adds

Calibration gap

0pp

Avg pred 53.5% vs actual 53.5%

By confidence bucket

Higher confidence → higher hit rate?

Buckets defined by edge from 50%: tossup < 4pp, lean 4–8pp, edge 8–15pp, lock ≥ 15pp.

Bucket	Games	Wins	Hit rate	Edge bounds
tossup	1152	608	52.8%	0–4pp
lean	899	483	53.7%	4–8pp
edge	741	420	56.7%	8–15pp
★ Lock	204	139	68.1%	15–50pp

Best calls

When we nailed it

Highest-confidence games where the model was right. The receipts.

SEA pick 79%

COL 2 – 6 SEA

Sep 26, 25 · vs COL

✓

SEA pick 78%

COL 2 – 9 SEA

Sep 25, 25 · vs COL

✓

SEA pick 78%

COL 3 – 4 SEA

Sep 24, 25 · vs COL

✓

CHC pick 75%

COL 1 – 2 CHC

May 29, 25 · vs COL

✓

TOR pick 75%

COL 1 – 5 TOR

Mar 31, 26 · vs COL

✓

NYM pick 75%

COL 3 – 5 NYM

Jun 1, 25 · vs COL

✓

Worst misses

When we got it wrong

Highest-confidence games where the model was wrong. Honest accounting.

TOR pick 77%

COL 14 – 5 TOR

Mar 30, 26 · vs COL

✗

TOR pick 75%

COL 2 – 1 TOR

Apr 1, 26 · vs COL

✗

MIL pick 75%

COL 4 – 3 MIL

Jun 29, 25 · vs COL

✗

MIL pick 74%

SF 7 – 1 MIL

Aug 23, 25 · vs SF

✗

LAD pick 73%

LAD 3 – 4 COL

Apr 19, 26 · vs COL

✗

SD pick 73%

COL 4 – 2 SD

Sep 13, 25 · vs COL

✗

The model's last 12 games

TOR pick 57%

TOR 7 – 3 MIN

May 2, 26 · vs MIN

✓

LAD pick 56%

LAD 2 – 7 STL

May 2, 26 · vs STL

✗

ATL pick 65%

ATL 8 – 6 COL

May 2, 26 · vs COL

✓

LAA pick 52%

NYM 4 – 3 LAA

May 2, 26 · vs NYM

✗

SD pick 64%

CHW 8 – 2 SD

May 2, 26 · vs CHW

✗

ATH pick 54%

CLE 8 – 5 ATH

May 2, 26 · vs CLE

✗

SEA pick 60%

KC 7 – 6 SEA

May 2, 26 · vs KC

✗

CHC pick 61%

ARI 5 – 6 CHC

May 1, 26 · vs ARI

✓

DET pick 52%

TEX 5 – 4 DET

May 1, 26 · vs TEX

✗

PIT pick 50%

CIN 1 – 9 PIT

May 1, 26 · vs CIN

✓

MIL pick 58%

MIL 6 – 1 WSH

May 1, 26 · vs WSH

✓

NYY pick 66%

BAL 2 – 7 NYY

May 1, 26 · vs BAL

✓

How we report this

Every row above carries the probability we'd have shown you before first pitch — never a backfilled rating. A game counted as "model right" if the team we favored won, regardless of margin. Hit rate is total wins divided by total finals. No selection bias, no excluded results.

← Tonight's slate

How the modelhas held up

Higher confidence → higher hit rate?

When we nailed it

When we got it wrong

The model's last 12 games

How the model
has held up