标签:方法
关于大模型「越狱」的多种方式,有这些防御手段
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
TPAMI 2024 | ProCo: 无限contrastive pairs的长尾对比学习
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
大模型智障检测+1:Strawberry有几个r纷纷数不清,最新最强Llama3.1也傻了
梦晨 一水 发自 凹非寺量子位 | 公众号 QbitAI继分不清9.11和9.9哪个大以后,大模型又“集体失智”了! 数不对单词“Strawberry”中有几个“r”,再次引起一片讨论...
终于有人把大模型的内部一致性和自反馈讲明白了
夕小瑶科技说 原创作者 | 谷雨龙泽 在LLM的研究中,改进LLMs的推理能力和减少幻觉内容一直是诸多研究者为之献祭GPU和头发的重大问题。近日,中国的一群青年才...
中科院张家俊团队最新综述,谈大模型研究的新领域:多模型协作
夕小瑶科技说 原创作者 | Richard“没有什么是一个大模型不能解决的。如果不能,那就两个!”这并不是一句玩笑话,而是人工智能领域的一个热门趋势。最近,中科...
夏天太热怎么办?AI 为“降温”材料发现提速数千倍,你的手机、电脑或许再也不发烫了
大数据文摘受权转载自学术头条 炎炎夏日,智能手机、平板电脑等电子设备常因“过热”而产生性能、安全问题。如何设计出散热更好的电子产品,材料是关键。 而其...
AI视频修复速度10倍提升,过曝变色也能逐帧搞定|美图国科大新算法
BlazeBVD团队 投稿量子位 | 公众号 QbitAI家人们,消除“视频闪烁”(比如画面突然一白)有新招了! 回想一下,当你看一部老电影或者用手机拍摄的视频时,画面...
仅微调0.02%参数,性能接近全量微调!上交大推出高效微调统一新范式
ChouJay 投稿量子位 | 公众号 QbitAIScaling Laws当道,但随着大模型应用的发展,基础模型不断扩大的参数也成了令开发者们头疼的问题。 为了减轻训练负担,Ad...
清华夺SIGIR 2024「时间检验+最佳论文奖」!中国大陆研究机构首次牵头获奖
新智元报道编辑:桃子 好困 【新智元导读】刚刚,信息检索领域的国际顶会SIGIR 2024,公布了最终获奖结果。在所有获奖名单中,来自清华计算机系的团队们斩获...
【综述专栏】大型视觉语言模型攻击综述:资源、进展与未来趋势!
来源:人工智能前沿讲习 在科学研究中,从方法论上来讲,都应“先见森林,再见树木”。当前,人工智能学术研究方兴未艾,技术迅猛发展,可谓万木争荣,日新月异...
大模型“玩”Excel更6了,微软搞的
金磊 发自 凹非寺量子位 | 公众号 QbitAI大模型理解、推理Excel,现在变得更加精准了。 这就是来自微软的一项最新研究——SPREADSHEETLLM,主打的就是让大模型...
Meta开发System 2蒸馏技术,Llama 2对话模型任务准确率接近100%
机器之心报道 编辑:杜伟研究者表示,如果 Sytem 2 蒸馏可以成为未来持续学习 AI 系统的重要特征,则可以进一步提升 System 2 表现不那么好的推理任务的性能...
剑桥大学:基于语音的大模型攻击,轻松“操纵”多模态大模型
夕小瑶科技说 原创作者 | Richard随着人工智能技术的快速发展,基于语音的大模型正在成为一个热门领域。这些模型不仅能实现语音识别,还可以执行翻译等多种任...
AI慢思考蒸馏进快思考,Llama2跃升至GPT-4水平,不写过程也能做对题
克雷西 发自 凹非寺量子位 | 公众号 QbitAI《思考快与慢》中人类的两种思考方式,属实是被Meta给玩明白了。 研究人员通过把AI的“慢思考”结果蒸馏进“快思考”,...
阿里发布大模型发布图结构长文本处理智能体,超越GPT-4-128k
夕小瑶科技说 原创作者 | Richard 随着大语言模型的发展,处理长文本的能力成为了一个重要挑战。虽然有许多方法试图解决这个问题,但都存在不同程度的局限性...