Smaller Weaker Yet Better Training Llm Reasoners Via Compute Optimal Sampling Arxiv Papers Mp3 & Mp4 Download