机器之心报道
编辑:陈萍
Andrej Karpathy 用通俗易懂的语言介绍了 speculative execution。
「如今,型有限制LLM(大语言模型)并不是内存单点突破的 —— 而是需要多个重要组件有效协同工作的系统。Speculative decoding 是个妙帮助我们从系统角度思考的一个很好的例子。」爱丁堡大学博士生符尧表示道