标签:模型
揭秘 AI 多模态融合的“智慧核心”:六校联合发布低质数据融合新篇章
多模态融合是多模态智能中的基础任务之一。多模态融合的动机在于联合利用来自不同模态的有效信息提升下游任务的准确性和稳定性。传统的多模态融合方法往往依...
今日arXiv最热NLP大模型论文:GPT-4理解武林外传中的含蓄表述,达人类水平
夕小瑶科技说 原创作者 | 谢年年在人际交谈中,特别是在使用中文这样博大精深的语言时,人们往往不会直接回答问题,而是采用含蓄、隐晦或间接的表达方式。 人...
阿里通义实验室薄列峰:从兵马俑跳“科目三”到照片唱歌,四大框架让AI生成的人物活起来丨GenAICon 2024
四大框架玩转AI人物视频生成,已落地通义千问APP。 2024中国生成式AI大会于4月18-19日在北京举行,在大会首日的主会场开幕式上,阿里巴巴通义实验室XR团队负...
天图万境图拉古:大部分大模型公司5年内死去,自媒体用“炸裂”“吊打”是瞎说丨GenAICon 2024
AI视听创业的教训血淋淋,比MidJourney做得更早,但资本看不明白。 2024中国生成式AI大会于4月18-19日在北京举行,在大会第二天的主会场AIGC应用专场上,天图...
图灵奖得主LeCun哈佛演讲PPT放出:唱衰自回归LLM,指明下一代AI方向
来源:机器之心LeCun 一如既往地不看好自回归 LLM。机器如何能像人类和动物一样高效地学习?机器如何学习世界运作方式并获得常识?机器如何学习推理和规划…… ...
甲对话柳钢:CEO对股东最大的责任,是对成功的概率负责|甲子光年
只有看见最微小的事物,才能洞悉伟大的定律。作者|甲小姐刘杨楠 编辑|栗子 商业史上,职业经理人成为“空降CEO”的故事往往胜少败多。 “究其原因有三条——容易...
AIGC大模型第一股,成「五一档」超强黑马!交易量股价双创新高
新智元报道编辑:编辑部 【新智元导读】最近,我们的国产大模型AIGC第一股,已在港股连破多项纪录。这位明星赛道的「国家队」选手,已经吸引了众多散户、多家...
手机可跑,3.8B参数量超越GPT-3.5!微软发布Phi-3技术报告:秘密武器是洗干净数据
新智元报道编辑:LRS 【新智元导读】Scaling Laws再次失效?微软最新的phi-3-mini模型,只用3.8B模型就击败了一众7B老大哥,用iPhone14每秒可生成12个tokens...
前 LangChain 员工爆料更强的 Devin 2.0 要来了?所以,“世界首个AI程序员”到底造假没?
整理 | 褚杏娟 3 月份,有着“世界首个 AI 程序员”的 Devin 横空出世,立刻就被大家追捧。据报道,Devin 可以规划和执行需要数千个决策的复杂工程任务,并回...
历时 5 个月从零到一研发一款数据库产品,这些坑他们已经踩过了 |InfoQ 独家专访百度智能云向量数据库团队
采访嘉宾|百度数据库产品总架构师朱洁、百度数据库高级架构师郭波 作者 | 李冬梅 生成式人工智能技术发展带动了大规模预训练模型的广泛应用,向量数据库成...
58行代码把Llama 3扩展到100万上下文,任何微调版都适用
梦晨 发自 凹非寺量子位 | 公众号 QbitAI堂堂开源之王Llama 3,原版上下文窗口居然只有……8k,让到嘴边的一句“真香”又咽回去了。 在32k起步,100k寻常的今天...
上海AI Lab开源首个可替代GPT-4V的多模态大模型
夕小瑶科技说 原创作者 | 任同学与开源和闭源模型相比,InternVL 1.5 在 OCR、多模态、数学和多轮对话等 18 个基准测试中的 8 个中取得了最先进的结果。 上海...
今日arXiv最热大模型论文:首个面向AI的python编程框架,提升大模型编程能力新思路
夕小瑶科技说 原创作者 | 谢年年高级编程语言Python有两个受众:一是编译和执行程序的机器,二是阅读、理解和编写程序的人类。机器关注程序的语义操作,而人...
万字长文梳理Llama开源家族:从Llama-1到Llama-3
01引言在AI领域,大模型的发展正以前所未有的速度推进技术的边界。 北京时间4月19日凌晨,Meta在官网上官宣了Llama-3,作为继Llama-1、Llama-2和Code-Llama之...
仅用250美元,Hugging Face技术主管手把手教你微调Llama 3
机器之心报道 编辑:赵阳大语言模型的微调一直是说起来容易做起来难的事儿。近日 Hugging Face 技术主管 Philipp Schmid 发表了一篇博客,详细讲解了如何利用...