<div dir="ltr"><a href="https://arxiv.org/pdf/1806.00187.pdf">https://arxiv.org/pdf/1806.00187.pdf</a><br><div><br></div><div>You apparently *can* use the new low-precision GPU modes for RNNs by scaling the loss.</div></div>