标签:模型

超越OpenAI,谷歌重磅发布从大模型蒸馏的编码器Gecko

夕小瑶科技说 原创作者 | Tscom 引言:介绍文本嵌入模型的重要性和挑战文本嵌入模型在自然语言处理(NLP)领域扮演着至关重要的角色。它们将文本转换为密集的...
阅读原文

Sora之后,OpenAI Lilian Weng亲自撰文教你从头设计视频生成扩散模型

选自Lil’Log 作者:Lilian Weng 机器之心编译 编辑:Panda过去几年来,扩散模型强大的图像合成能力已经得到充分证明。研究社区现在正在攻克一个更困难的任务...
阅读原文

首个基于Mamba的MLLM来了!模型权重、训练代码等已全部开源

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

扎克伯格最新2万字访谈:价值百亿美金的“最强开源大模型”Llama3及背后的一切

来源:华尔街见闻 4月18日,Meta重磅推出Llama 3,称其为“迄今能力最强的开源大模型”,Llama3的登场又一次影响着AI大模型的竞争格局,引爆AI圈。 同日,Meta ...
阅读原文

清华、智谱AI团队:Loss才是涌现的关键,而非模型参数|论文分享

来源:GLM大模型 作者:GLM技术团队 大语言模型中的涌现能力(Emergent Ability)研究指出,伴随着模型参数的增大会出现能力涌现。但过去的观察却发现:1)小...
阅读原文

OpenAI掌门人与运营官首次联合访谈:人工智能成本有望逼近“零”

在20VC with Harry Stebbings的播客节目中,OpenAI的联合创始人兼CEO萨姆·奥尔特曼和首席运营官布拉德·莱特凯普首度联袂对外进行专访。这场对话持续了约一个...
阅读原文

AI安全之问:我们的智能助手真的安全吗?

夕小瑶科技说 原创作者 |韩旭东在我们日益依赖人工智能来撰写文档、编写程序代码、甚至创作艺术作品的今天,我们是否曾经想过这些智能系统可能面临的被恶意操...
阅读原文

今日arXiv最热NLP大模型论文:微软发布可视思维链VoT,提高大模型空间想象力

夕小瑶科技说 原创作者 | 芒果 引言:思维可视化技术的探索此项研究提出了一种名为思维可视化(VoT)的技术,旨在通过可视化大型语言模型(LLMs)的推理过程来增...
阅读原文

刘强东AI数字人首播,30分钟观看破千万;雷军回应爽文人生:不是高考状元、没有40亿;特斯拉大裁员:员工对赔偿满意|AI周报

整理|傅宇琪,褚杏娟 引言:特斯拉全球裁员 10%,但被裁员工很满意?钉钉上线 AI 助理市场 ;雷军:没模仿马斯克、乔布斯,卡里也没有冰冷的 40 亿;官网秒空...
阅读原文

GPT-4化身黑客搞破坏,成功率87%!OpenAI要求保密提示词,网友复现ing

西风 明敏 发自 凹非寺量子位 | 公众号 QbitAI91行代码、1056个token,GPT-4化身黑客搞破坏! 测试成功率达87%,单次成本仅8.8美元(折合人民币约63元)。 这...
阅读原文

高通万卫星:终端侧生成式AI时代已经来临|中国AIGC产业峰会

编辑部 整理自 AIGC峰会量子位 | 公众号 QbitAIAI手机、AI PC硬件新物种正崭露头角。 高通作为技术及芯片厂商,所提供的产品和解决方案正在推动AIGC相关产业...
阅读原文

轻松拿捏4K高清图像理解!这个多模态大模型自动分析网页海报内容,打工人简直不要太方便

陈林 投稿自 凹非寺量子位 | 公众号 QbitAI一个可以自动分析PDF、网页、海报、Excel图表内容的大模型,对于打工人来说简直不要太方便。 上海AI Lab,香港中文...
阅读原文

Llama 3每秒输出800个token逼宫openAI!下周奥特曼生日或放出GPT-5?

新智元报道编辑:桃子 Lumina 【新智元导读】Llama 3的开源,或将催生数十亿美元新产业。发布不到一周的时间,全网各种测试微调都开启了。甚至,Llama 3在Gro...
阅读原文

「个性化」图像生成时代来了!六大顶尖高校联手发布全新Gen4Gen框架

新智元报道编辑:LRS 【新智元导读】文中提出了一个半自动数据集创建管道Gen4Gen,将个性化概念与文本描述结合成复杂的组合,创建了基准测试数据集MyCanvas,...
阅读原文

4000万蛋白结构训练,西湖大学开发基于结构词表的蛋白质通用大模型,已开源

将ScienceAI设为星标 第一时间掌握 新鲜的AI for Science资讯编辑 |ScienceAI 蛋白质结构相比于序列往往被认为更加具有信息量,因为其直接决定了蛋白质的功能...
阅读原文