标签:方法
最强智能体Agent Q发布!Llama 3成功率飙升3倍,OpenAI神秘「草莓」遭截胡?
新智元报道编辑:乔杨 好困 【新智元导读】初创公司MultiOn最近发布了号称「目前最强」的Agent Q,在真实的预订任务中可以达到95.4%的成功率。网友纷纷猜测其...
30秒生成建模师级Mesh!最大可生成面数提升至1600,GitHub揽星1.9k项目发布V2版本
木子 投稿量子位 | 公众号 QbitAI只需30秒,AI就能像3D建模师一样,在各种指示下生成高质量人造Mesh。 NeRF、3D Gaussian Splatting生成的三维重建图像Mesh效...
清华光学AI登Nature!物理神经网络,反向传播不需要了
一水 发自 凹非寺量子位 | 公众号 QbitAI用光训练神经网络,清华成果最新登上了Nature! 无法应用反向传播算法怎么办? 他们提出了一种全前向模式(Fully For...
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
新智元报道编辑:LRST 好困 【新智元导读】多模态大语言模型(MLLM)在医学视觉问答(VQA)领域展现出巨大潜力,通过提供针对医学图像的具体临床问题的回答,...
ICML 2024 | 人物交互图像,现在更懂你的提示词了,北大推出基于语义感知的人物交互图像生成框架
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
准确率达60.8%,浙大基于Transformer的化学逆合成预测模型,登Nature子刊
将 ScienceAI设为星标 第一时间掌握 新鲜的 AI for Science 资讯编辑 | KX 逆合成是药物发现和有机合成中的一项关键任务,AI 越来越多地用于加快这一过程。 ...
Machine Unlearning 会是未来 LLM 的必需品吗?
机器之心PRO · 会员通讯 Week 31---- 本周为您解读 ③个值得细品的AI & Robotics业内要事 ---- 1.Machine Unlearning 会是未来 LLM 的必需品吗? 为什么需...
阿里「轨迹可控版Sora」,告别「抽卡」,让视频生成更符合物理规律
机器之心报道 编辑:陈陈、杜伟你规定路线,Tora 来生成相应轨迹的视频。目前,扩散模型能够生成多样化且高质量的图像或视频。此前,视频扩散模型采用 U-Net ...
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
新智元报道编辑:LRST 好困 【新智元导读】研究人员提出了一种新颖的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比...
北京大学:利用好不确定性,8B小模型也能超越GPT-4
夕小瑶科技说 原创作者 | 谢年年大模型有一个显著的特点,那就是不确定性——对于特定输入,相同的LLM在不同解码配置下可能生成显著不同的输出。 比如问一问cha...
寡姐带货国风Polo衫,马斯克穿牛仔走红毯!虚拟试衣新框架火了,只需两张图30秒即生成
种政 投稿自 凹非寺量子位 | 公众号 QbitAI只需两张图像,不到30秒,就能让马斯克穿牛仔走红毯~ 或者让寡姐带货国风Polo衫~ 就是二次元换装也不在话下。 来自...
今日arXiv最热大模型论文:北京大学最新综述:视觉大模型中的漏洞与攻防对抗
夕小瑶科技说 原创作者 | 谢年年近年来,视觉语言大模型(LVLM)在文本转图像、视觉问答等任务中大放异彩,背后离不开海量数据、强大算力和复杂参数的支撑。 ...
1890美元,就能从头训练一个还不错的12亿参数扩散模型
机器之心报道 编辑:张倩、陈陈只用1890美元、3700 万张图像,就能训练一个还不错的扩散模型。现阶段,视觉生成模型擅长创建逼真的视觉内容,然而从头开始训...
关于大模型「越狱」的多种方式,有这些防御手段
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
TPAMI 2024 | ProCo: 无限contrastive pairs的长尾对比学习
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...