标签:维度

拿下SOTA!最强中文Embedding模型对标OpenAI,技术路线公开

新智元报道编辑:编辑部 【新智元导读】国产大模型「日日新 5.0」已经在权威主流评测中鲨疯了。变强的背后原因竟是,来自商汤自研中文Embedding模型——Piccolo...
阅读原文

独家专访Pika:Sora is not very hard to beat,我们的算法能够以小胜大|AI Pioneers

人类正在迎来人工智能领域的爆炸式更新,技术向未知拓展的每一步,几乎都引起惊人的关注度。 在人工智能边界扩张的过程中,重要赛道的技术路线创新与分歧并存...
阅读原文

Mamba-2新架构出世一统江湖!普林斯顿CMU华人再出神作,性能狂飙8倍

新智元报道编辑:编辑部 【新智元导读】在开源社区引起「海啸」的Mamba架构,再次卷土重来!这次,Mamba-2顺利拿下ICML。通过统一SSM和注意力机制,Transform...
阅读原文

高效训练超越LoRA,北航发布MoRA

夕小瑶科技说 原创作者 | Richard什么!LoRA我都没有学懂,又出现了MoRA??? LoRA作为当下最火热的大语言模型参数高效微调技术,正在以前所未有的速度迭代...
阅读原文

3D生成竞技场来了!比拼360°环绕视频,最强模型由你pick

3DGen发自 凹非寺量子位 | 公众号 QbitAI3D生成也有自个儿的人工评测竞技场了~ 来自复旦大学和上海AI lab的研究人员搞了个3DGen-Arena,和大语言模型的Chatb...
阅读原文

250行代码从头搭建Llama 3,GitHub一天4.6k星!Karpathy大赞

新智元报道编辑:乔杨 好困 【新智元导读】Llama 3发布一个月后,一位开发者在GitHub上创建了名为「从头开始实现Llama 3」的项目,引起了开源社区的广泛关注...
阅读原文

小模型性能饱和、表现不佳,根源是因为Softmax?

机器之心报道 编辑:陈萍小语言模型的出现是为弥补大语言模型的训练、推理等成本昂贵的缺点,但其自身也存在训练到某个阶段后性能下降的事实 (饱和现象),那...
阅读原文

今日arXiv最热大模型论文:大模型也来看球,还能判断是否犯规

夕小瑶科技说 原创作者 | 谢年年在足球世界,裁判的哨声可谓“千金难买”,因为它能直接决定俱乐部的钱包是鼓是瘪。但球场变化莫测,非常考验裁判的水平。 2022...
阅读原文

苹果一次性开源了8个大模型! 包含模型权重、训练日志和设置,OpenELM全面开源

夕小瑶科技说 原创作者 | 任同学不以开放性著称的苹果居然同时开源了大模型的权重、训练和评估框架,涵盖训练日志、多个保存点和预训练设置。同时升级计算机...
阅读原文

5大维度21项细分能力拿下国产大模型首位,文心一言还是那个老大

▲图片由AI辅助生成 技术为根,客户+应用成国产大模型“新考场”。 作者|徐珊 编辑|漠影 智东西3月26日报道,近日,全球增长咨询公司弗若斯特沙利文发布了《2024...
阅读原文

谷歌承认“窃取”OpenAI模型关键信息:成本低至150元,调用API即可得手

明敏 丰色 发自 凹非寺量子位 | 公众号 QbitAI什么?谷歌成功偷家OpenAI,还窃取到了gpt-3.5-turbo关键信息??? 是的,你没看错。 根据谷歌自己的说法,它...
阅读原文

ICLR 2024 | 为音视频分离提供新视角,清华大学胡晓林团队推出RTFS-Net

机器之心专栏 机器之心编辑部视听语音分离(AVSS)技术旨在通过面部信息从混合信号中分离出目标说话者的声音。这项技术能够应用于智能助手、远程会议和增强现...
阅读原文

超强干货!OpenAI Sora文生视频技术原理解读

智猩猩和智东西发起主办的2024中国生成式AI大会将于4月18-19日在北京举办。主会场将进行开幕式、大模型专场、AI Infra专场和AIGC应用专场;分会场将进行具身...
阅读原文

有了这块活地板,成为VR届的「街溜子」

机器之心报道 编辑:泽南、小舟给 VR 系统加了新维度。还记得电视剧《三体》里面汪淼他们用来打游戏的 V 装具吗? 和最近苹果发布的 Vision Pro 相比,这套近...
阅读原文

Pika、Gen-2、ModelScope、SEINE……AI视频生成哪家强?这个框架一测便知

机器之心专栏 机器之心编辑部AI 视频生成,是最近最热门的领域之一。各个高校实验室、互联网巨头 AI Lab、创业公司纷纷加入了 AI 视频生成的赛道。Pika、Gen-...
阅读原文
123