nginx не читает весь файл сразу, а читает постепенно.
Он старается поддерживать заполненным output_buffers
к примеру, для
output_buffers 2 256k;
Сначала будет прочитано 2*256k сходу, и как только будет отдано первые 256k данных - на диск пойдет новый запрос на чтение данных для освободившегося пространства 256k;
Соотв на диск запросы поступают с интенсивностью скачки.
Для limit_rate_after 1m первый мегабайт будет запрошен быстро (если клиент успеет быстро скачать), а остальные данные будут запрашиваться с интенсивностью, пропорциональной скорости скачки.