标签:研究人员
比Flux更强大的文生图模型来了!秘诀是“集百家之长”
IterComp团队 投稿量子位 | 公众号 QbitAI打造更强大文生图模型新思路有—— 面对Flux、stable diffusion、Omost等爆火模型,有人开始主打“集各家所长”。 具体...
高级人工智能能否解决视觉难题并进行抽象推理?
人工智能已经学会了掌握语言、创作艺术,甚至在国际象棋比赛中击败了大师。但它能破解抽象推理的密码吗?这些让人类困惑的棘手视觉谜题?研究人员正在测试人...
基于944种材料数据,日本东北大学联合MIT发布GNNOpt模型,成功识别数百种太阳能电池和量子候选材料
作者:李姝 编辑:李宝珠 日本东北大学和 MIT 的研究人员推出了一种基于图神经网络 (GNN) 的 GNNOpt 模型,成功识别出 246 种超过 32% 太阳能转换效率的材料...
推理?别闹了!现在的 AI 仍然连小学数学题都搞不定!
“ 研究发现,尽管OpenAI和Google等公司强调其AI模型的推理能力,但苹果的研究表明,当前的大型语言模型(LLMs)在面对微小变化时,推理能力脆弱且不可靠。测...
入选NeurIPS 24!浙大团队提出全新去噪蛋白质语言模型DePLM,突变效应预测优于SOTA模型
作者:梅菜 编辑:十九,李宝珠 本研究所提出的全新去噪蛋白质语言模型 (DePLM) 不仅显著提升了蛋白质优化性能,而且保持了强大的泛化能力。作为生物功能的主...
Nature:人工智能科学搜索引擎如何加速你的研究
借助人工智能工具,文献综述等任务可以变得更加简单,但必须谨慎使用。图片来源:Olena Hromova/Alamy 人工智能 (AI) 工具正在改变我们的工作方式。许多产品...
宾夕法尼亚州立大学:电子舌头揭示人工智能的“内心想法”
最近开发的电子舌头能够识别类似液体中的差异,例如含水量不同的牛奶;各种产品,包括苏打水类型和咖啡混合物;果汁变质的迹象;以及食品安全问题的例子。由...
Nature:AI 能拥有常识吗?找出答案将是实现机器智能的关键
2022 年英国格拉斯顿伯里音乐节上,一名机器人艺术家正在为表演者创作画作。图片来源:Leon Neal/Getty 自不到两年前公开发布以来,大型语言模型 (LLM)(例如...
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
新智元报道编辑:LRS 【新智元导读】Playground Research推出了新一代文本到图像模型PGv3,具备240亿参数量,采用深度融合的大型语言模型,实现了在图形设计...
灵巧的机器人,DeepMind推出两个基于AI的机器手系统和未知场景「生成式AI」应对策略
来源:ScienceAI 编辑:萝卜皮 人们每天都会执行许多任务,例如系鞋带或拧紧螺丝。但对于机器人来说,学习这些高度灵巧的任务非常困难。为了让机器人在人们的...
首个检索增强3D生成模型!实现各种模态生成大一统:文&图&3D都可以
王振伟 投稿自 凹非寺量子位 | 公众号 QbitAI3D生成也能支持检索增强(RAG)了。 有了检索到的参考模型之后,3D生成效果更好,还具有极强的泛化性和可控性。 ...
完全使用「自生成数据」实现LLM自我纠正,DeepMind新突破SCoRe:纠正性能提升15.9%
新智元报道编辑:LRS 【新智元导读】Google DeepMind的SCoRe方法通过在线多轮强化学习,显著提升了大型语言模型在没有外部输入的情况下的自我修正能力。该方...
Llama系列上新多模态!3.2版本开源超闭源,还和Arm联手搞了手机优化版
鱼羊 发自 凹非寺量子位 | 公众号 QbitAI在多模态领域,开源模型也超闭源了! 就在刚刚结束的Meta开发者大会上,Llama 3.2闪亮登场: 这回不仅具备了多模态能...
Llama 3.2来了,多模态且开源!AR眼镜黄仁勋首批体验,Quest 3S头显价格低到离谱
作者:十九,李姝 编辑:李宝珠 北京时间 9 月 26 日凌晨 1 点,在 Meta Connect 2024 大会上,扎克伯格介绍了 Meta 的首款全息 AR 眼镜,价格更亲民的 Meta ...
最高3倍无损提速!数学规划求解器效率升级,论文已中顶刊TPAMI | 中科大&华为诺亚
HEM++团队 投稿量子位 | 公众号 QbitAI最高3倍无损提速,用数学规划求解器寻找最优解更快了! 近日,中科大王杰教授团队(MIRA Lab)和华为诺亚方舟实验室(H...