标签:模型

ICML 2024 Oral | DPO是否比PPO更适合LLM,清华吴翼团队最新揭秘

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

ECCV 2024 | 让GPT-4图像理解更易出错,全新策略增强VLP模型对抗迁移性

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

权重、代码、数据集全开源,性能超越Mistral-7B,苹果小模型来了

机器之心报道 机器之心编辑部小模型成趋势?本周,OpenAI 上线小模型 GPT-4o-mini,小模型赛道正式开卷。近期加入这一赛道的还有苹果。 最近,苹果公司作为 D...
阅读原文

KDD 2024|港大黄超团队深度解析大模型在图机器学习领域的「未知边界」

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

可「自主进化」的Agent?首个端到端智能体符号化训练框架开源了

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

【阿姆斯特丹博士论文】以实体为中心的神经模型用于自然语言处理

来源:专知 这篇论文探讨了如何通过将实体信息纳入神经网络模型来增强自然语言理解。它解决了三个关键问题: 利用实体进行理解任务:本文引入了Entity-GCN模...
阅读原文

1 周 3 ,小型模型反而更具潜力?

点击上方蓝字关注我们“本周,人工智能行业迎来重大变革,Hugging Face、Nvidia与Mistral AI及OpenAI相继推出小型语言模型,旨在提高自然语言处理技术的普及度...
阅读原文

英伟达Mistral AI联袂出击!120亿小模型王者强势登场,碾压Llama 3单张4090可跑

新智元报道编辑:耳朵 桃子 【新智元导读】GPT-4o mini头把交椅还未坐热,Mistral AI联手英伟达发布12B参数小模型Mistral Nemo,性能赶超Gemma 2 9B和Llama 3...
阅读原文

配方脱口而出,过去时态让GPT-4o防线崩塌!成功率从1%暴涨至88%

新智元报道编辑:桃子 【新智元导读】最高端的大模型,往往需要最朴实的语言破解。来自EPFL机构研究人员发现,仅将一句有害请求,改写成过去时态,包括GPT-4o...
阅读原文

我们从过去一年的大模型构建过程中学到的经验

作者 | Eugene Yan、Bryan Bischof、Charles Frye、Hamel Husain、Jason Liu 和 Shreya Shankar 翻译 | 王强 策划 | 褚杏娟 当下正是使用大型语言模型(LLM...
阅读原文

香港大学:教你如何一眼识破Sora合成的视频!

夕小瑶科技说 原创作者 | Axe_越FAKE NEWS!!! —— 唐纳德·特朗普 犹记得几年前川普当选前后,各种假新闻乱飞,川普不得不一次又一次在推上痛斥假新闻的画面...
阅读原文

「安全智能」的背后,Ilya 究竟看到了什么?

以下文章来自飞哥说AI,作者李维、高佳当Ilya Sutskever 离开 OpenAI 重归大众视野,带着他名为 SSI(Safe Superintelligence Inc.)的新公司。 这一举动惊讶...
阅读原文

字节跳动科学家组团演讲,揭秘AI视频生成大招!

字节跳动多位视觉大模型研究关键人物同台。 作者|程茜 编辑|心缘 智东西7月19日报道,今日下午,在字节跳动AI技术菁英论坛上,字节跳动豆包大模型视觉基础研...
阅读原文

今日,OpenAIChatGPT-3.5

GPT-4o mini白菜价!10家同行PK,谁能与OpenAI对打? 编译|李水青 编辑|心缘 GPT-4o新版本降到1块钱/百万tokens了,打败OpenAI的还是OpenAI! 智东西7月19日...
阅读原文

咦?我从GPT-4o mini身上看到了两家中国大模型厂商的影子

夕小瑶科技说 分享 OpenAI 今天最新推出的 GPT-4o mini 又火了,一句话总结就是更小、更高效、更便宜。 圈内很多朋友转发并对 OpenAI 再次膜拜—— OpenAI 果然...
阅读原文