标签:模型
今日arXiv最热NLP大模型论文:微软重磅:AgentAI,下一代人工智能的关键
夕小瑶科技说 原创作者 | Tscom 引言:AI的全面智能之路人工智能的发展已从简单算法进化到复杂的大型基础模型,尤其在理解开放世界环境中的感官信息方面取得...
哈工深提出基于联邦学习的大模型指令微调
夕小瑶科技说 原创作者 | 松果引言:面对数据匮乏与隐私挑战的联邦指令调整在当今大语言模型(LLMs)发展中,指令调整被证明对于生成与人类对齐的响应至关重...
离职谷歌的Transformer作者创业,3个模型(附技术报告)
机器之心报道 编辑:陈萍、小舟去年 8 月,两位著名的前谷歌研究人员 David Ha、Llion Jones 宣布创立一家人工智能公司 Sakana AI,总部位于日本东京。其中,...
讨论下一个token预测时,我们可能正在走进陷阱
机器之心报道 编辑:赵阳自香农在《通信的数学原理》一书中提出「下一个 token 预测任务」之后,这一概念逐渐成为现代语言模型的核心部分。最近,围绕下一个 ...
剑桥团队开源:赋能多模态大模型RAG应用,首个预训练通用多模态后期交互知识检索器
机器之心专栏 机器之心编辑部PreFLMR模型是一个通用的预训练多模态知识检索器,可用于搭建多模态RAG应用。模型基于发表于 NeurIPS 2023 的 Fine-grained Late...
通用文档理解新SOTA,多模态大模型TextMonkey来了
机器之心专栏 机器之心编辑部最近,华中科技大学和金山的研究人员在多模态大模型 Monkey [1](Li et al., CVPR2024)工作的基础上提出 TextMonkey。在多个场...
中电信星辰AI大模型TeleChat-7B评测
智猩猩与智东西将于4月18-19日在北京共同举办2024中国生成式AI大会,阿里巴巴通义千问大模型技术负责人周畅,「清华系Sora」生数科技CEO唐家渝,云天励飞“云...
中国生成式AI大会再揭晓15位嘉宾!大模型及应用技术大咖、算力专家和青年学者都来了
2024中国生成式AI大会4月18-19日北京举行,报名火热进行中~ 自ChatGPT面世以来,生成式AI已加速狂飙16个月,在学术界、产业界、投资界掀起滔天巨浪,冲击着千...
EmbodiedGPT一作穆尧:具身智能大模型与通用机器人系统 | GenAICon 2024
4月18日-19日,由智猩猩和智东西共同发起主办的2024中国生成式AI大会(GenAICon 2024)将在北京JW万豪酒店正式举行。 大会将由主会场会议+分会场论坛+展览+榜...
Mistral 创始人访谈:和云厂商合作后,立刻获得了 1000 个客户
Mistral 可以说是欧洲目前最有代表性的 AI 公司,开源小模型、MoE、专注欧洲多语言市场等等,都让它与美国的几家大模型公司如 OpenAI、Anthropic 截然不同。 ...
阶跃星辰发布 Step 通用大模型:多模态、MoE、万亿模型参数
3 月 23 日,国内通用大模型创业公司阶跃星辰在 2024 全球开发者先锋大会上发布了公司的通用大模型产品。 阶跃星辰创始人、CEO 姜大昕博士在大会开幕式上对外...
Stability CEO自己跑路:没董事会控制权;月之暗面Kimi火爆至宕机,已扩容5次;王小川怼李彦宏:活在幻觉中|AI周报
整理 | 傅宇琪、褚杏娟 CEO 莫斯塔克辞职,“稳定”AI 乱成一锅粥;苹果 CEO 库克现身上海时,美国司法部对苹果提起反垄断诉讼;vivo 离职半年收到年终奖,主动...
32K上下文,Mistral 7B v0.2 基模型突然开源了
机器之心报道 编辑:蛋酱刚刚,Mistral AI 的模型又更新了。 这次开源一如既往地「突然」,是在一个叫做 Cerebral Valley 的黑客松活动上公布的。PPT 一翻页...
CNN、Transformer、Uniformer之外,我们终于有了更高效的视频理解技术
机器之心报道 编辑:Rome Rome视频理解因大量时空冗余和复杂时空依赖,同时克服两个问题难度巨大,CNN 和 Transformer 及 Uniformer 都难以胜任,Mamba 是个...
CVPR 2024 | 零样本6D物体姿态估计框架SAM-6D,向具身智能更进一步
机器之心专栏 机器之心编辑部物体姿态估计在许多现实世界应用中起到至关重要的作用,例如具身智能、机器人灵巧操作和增强现实等。 在这一领域中,最先受到关...