hessian

一种让你的大语言模型更“轻”、更“快”、不失真的技术突破

想象一下,你有一本厚重的百科全书(原始模型),但携带和翻阅都很不方便。传统方法是简单地缩小字体和页面(基本量化),虽然书变轻了,但内容可能变得模糊难辨。而YAQA就像是一种神奇的压缩术,不仅能让书变得轻便,还能尽可能保留原书的全部知识和表达方式,让读者在阅读"

模型 语言 llama ho hessian 2025-06-04 16:25  7

清华大学校友袁域重要成果在数学顶刊Annals of Mathematics上发表

近日,由普林斯顿大学出版的数学四大顶刊之一的《Annals of Mathematics》(数学年刊,双月刊)更新了本年度第二期的正式上线发表的文章,本次共更新上线了6篇文章,本次无国内机构作者参与发表,但有两位华人学者。其中一位就是大名鼎鼎的第二位华人菲尔兹

数学 清华大学 清华大学校友 annals hessian 2025-03-19 14:46  12

泰勒展开与Hessian矩阵

黑塞矩阵(Hessian Matrix),又译作海森矩阵、海瑟矩阵、海塞矩阵等,是一个多元函数的二阶偏导数构成的方阵,描述了函数的局部曲率。黑塞矩阵最早于19世纪由德国数学家Hesse提出,并以其名字命名。在工程实际问题的优化设计中,所列的目标函数往往很复杂,

泰勒 hessian hessian矩阵 2025-01-26 11:45  19