标签:成功率

超全拆解AlphaFold 3,上海交大钟博子韬:极致利用数据,以原子精度预测所有生物分子结构,但并不完美

作者:钟博子韬 编辑:十九 上海交通大学 AI for Bioengineering 暑期学校活动中,钟博子韬博士以「AlphaFold 3:原理,应用与展望」为题,系统性地梳理了他...
阅读原文

最强智能体Agent Q发布!Llama 3零样本成功率提升340%

夕小瑶科技说 分享来源 | 新智元没有等来OpenAI的Q*草莓项目的发布,一家名为MultiOn初创公司却抢先发布了名为Q的智能体。 非常高兴地宣布我们过去6个月的工...
阅读原文

最强智能体Agent Q发布!Llama 3成功率飙升3倍,OpenAI神秘「草莓」遭截胡?

新智元报道编辑:乔杨 好困 【新智元导读】初创公司MultiOn最近发布了号称「目前最强」的Agent Q,在真实的预订任务中可以达到95.4%的成功率。网友纷纷猜测其...
阅读原文

只需两步,让大模型智能体社区相信你是秦始皇

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

冰毒配方脱口而出,过去时态让GPT-4o防线崩塌!成功率从1%暴涨至88%

新智元报道编辑:桃子 【新智元导读】最高端的大模型,往往需要最朴实的语言破解。来自EPFL机构研究人员发现,仅将一句有害请求,改写成过去时态,包括GPT-4o...
阅读原文

提示词用上“过去式“,秒破GPT4o等六大模型安全限制!中文语境也好使

克雷西 发自 凹非寺量子位 | 公众号 QbitAI只要在提示词中把时间设定成过去,就能轻松突破大模型的安全防线。 而且对GPT-4o尤其有效,原本只有1%的攻击成功率...
阅读原文

相隔3000英里,用苹果头显遥控机器人!UCSD、MIT华人团队开源TeleVision

新智元报道编辑:桃子 【新智元导读】现实中,机器人收据收集可以通过远程操控实现。来自UCSD、MIT的华人团队开发了一个通用框架Open-TeleVision,可以让你身...
阅读原文

今日arXiv最热大模型论文:Agent也疯狂!FoA方法对智能体做树结构搜索,超越ToT

夕小瑶科技说 原创作者 | 谢年年大模型agents包揽了从理解问题、规划任务、记忆输入输出、精准调用工具,执行任务解决问题的全过程,更厉害的是,它们还有自...
阅读原文

AI能治病了?AI生成药物分子90%成功率通过I期临床试验,未来研发新药只需5年!

新智元报道编辑:编辑部 【新智元导读】AlphaFold已经更新到第三代,Al4Science的口号喊了好几年,AI算法在药物发现领域的实质进展究竟如何?BCG的一篇调研报...
阅读原文

GPT-4推理能力为0?开发者悬赏1万美金被打脸,神秘提示正确率直冲100%

新智元报道编辑:Aeneas 好困 【新智元导读】小孩子都会的脑筋急转弯推理题,GPT-4和Claude 3做不出?国外一位开发者小哥坚称这一观点,认为GPT模型在训练集...
阅读原文

ICLR 2024 | 联邦学习后门攻击的模型关键层

机器之心专栏 机器之心编辑部联邦学习使多个参与方可以在数据隐私得到保护的情况下训练机器学习模型。但是由于服务器无法监控参与者在本地进行的训练过程,参...
阅读原文

多忽悠几次AI全招了!Anthropic警告:长上下文成越狱突破口,GPT羊驼Claude无一幸免

克雷西 发自 凹非寺量子位 | 公众号 QbitAI大模型厂商在上下文长度上卷的不可开交之际,一项最新研究泼来了一盆冷水—— Claude背后厂商Anthropic发现,随着窗...
阅读原文