【新智元导读】最近,来自NUS、UT Austin等机构的研究人员创新性地提出了一种「拖拽式大语言模型」(DnD),它可以基于提示词快速生成模型参数,无需微调就能适应任务。不仅效率最高提升12000倍,而且具备出色的零样本泛化能力。 刚刚,包括尤洋教授在内的来自新加坡国立大学、得克萨斯大学奥斯汀分校等机构的研究人员,提出了一种全新的「拖拽式大语言模型」——Drag-and-Drop LLMs! 通过一个轻量级文本编码器与一个级联超卷积解码器的组合,DnD能在数秒内,仅根据无标签的任务提示词,生成针对该任务的LoRA权重矩阵。 通过观察,研究人员发现,LoRA适配器无非是其训练数据的一个函数:梯度下降会将基础权重「拖拽」至一个特定任务的最优状态。 为了赋予模型「拖拽」的能力,团队将这些数据集的提示词与收集到的LoRA权重进行随机配对,构成DnD模型的训练数据——即「提示词-参数」对。 在推理阶段,团队只需将来自全新数据集(训练中未见过)的提示词输入DnD,仅需一次前向传播,即可获得为该任务量身定制的参数。 实验结果表明,在零样本测试集上,团队的方法相较于训练所用的LoRA模型的平均性能,取得了惊人的提升,并且能够很好地泛化到多种真实世界任务和不同尺寸的LLM。 此前,他在中国科学技术大学获得人工智能学士学位。并曾在北卡罗来纳大学教堂山分校Huaxiu Yao教授的指导下进行实习,以及在中国科学技术大学数据科学实验室跟着导师Xiang Wang度过了两年的时光。 Zhangyang Wang目前是德克萨斯大学奥斯汀分校钱德拉家族电气与计算机工程系的终身副教授,并荣膺坦普尔顿基金会第7号捐赠教席。 他于2016年获伊利诺伊大学厄巴纳-香槟分校电气与计算机工程博士学位,师从计算机视觉泰斗黄煦涛(Thomas S.Huang)教授;并于2012年获中国科学技术大学电子工程与信息科学学士学位。 核心目标是创建结构化、模块化的模型表示:1)在过参数化模型空间中实现高效、鲁棒的学习;2)与符号知识及推理进行无缝连接。 此前,他在新加坡国立大学获得数据科学与机器学习博士学位,在中国科学院深圳先进技术研究院获得计算机技术硕士学位,在北京师范大学珠海校区获得学士学位。
17.c.cow起草同时,地缘政治紧张局势对黄金市场的影响显现:部分央行计划将更多黄金储备存放在国内,而非伦敦和纽约——这两个城市是全球最大的黄金储备中心。小王同学的化学学得非常好,于是他信心满满地选了“物化生”组合。不巧的是,“物化生”的组合如今已经是学霸的聚集地了,而小王只有一科化学占优势,在这里显然不够用,这个选择也让他陷入最激烈的竞争。17.c.cow起草蘑菇短视频app免费版本下载现年21岁的查奥纳上赛季为拉齐奥出场37次,打进2球助攻1次。查奥纳目前正随法国U21国家队参加欧青赛,迪马济奥称,等到欧青赛结束后的几天内,查奥纳的转会交易将正式完成。安德烈·科瓦连科表示,坦波夫火药厂是俄罗斯军工联合体的核心设施之一,主要生产用于各种轻武器、火炮和导弹系统的火药,是俄罗斯军队的主要炸药供应商之一。乌克兰媒体报道称,该火药厂在遭乌无人机袭击后发生火灾。
20250815 💦 17.c.cow起草据“今日俄罗斯”(RT)报道,当地时间6月10日,乌克兰总统泽连斯基在接受采访时称,乌克兰的一些西方支持者要求乌克兰将征兵年龄降至18岁,以换取他们支持对俄罗斯实施更严厉的制裁。你比我丈夫厉害中文版我会在购买一个漂亮水杯的时候,想象我拿着这个水杯在图书馆一边背书一边喝水;我会在购买一个非常适合我的夏季懒人凉凉冰丝套装时,想象我穿着它窝在图书馆的角落里学上一整天。这些“物品”带来的期待和想象,已经让物品本身超越了消费主义的范畴,而成为了一种情感寄托。
📸 程树全记者 周枢岩 摄
20250815 🔞 17.c.cow起草付女士:到医院后,告诉医生天太黑,没看清被什么咬了,但怀疑是蛇,给医生看了伤口。作为普通人只能这样告诉医生,好让医生专业性处理。比如云南菌类中毒的多,医院可能治疗经验比较多。三亚蛇咬案例多,认为医院应该会有经验和判断。漫蛙漫画(网页入口)报道称,尽管勒沃库森和纽卡斯尔联此前已有初步接触,但仍未就引进雷恩前锋卡利穆恩多采取进一步行动,托特纳姆热刺在过去数小时内决定加快追逐现年23岁、与雷恩合同至2027年6月的卡利穆恩多的进程。
📸 许莉记者 吴洁 摄
😏 德黑兰目前情况怎么样?史先生称,自己生活的地方和此前离开时没有太大区别,大部分店铺都开着,“交通正常,上班正常。汽油没有问题,加油很方便。不需要囤物资,保民生的大饼店一直都开着。就是街上人少了,车少了。”德黑兰市区的网络也已经恢复,他可以使用家里的宽带。y31成色好的y31