Running A High Throughput Openai Compatible Vllm Inference Server On Modal Modal Labs Mp3 & Mp4 Download

running a high throughput openai-compatible vllm inference server on modal