标签:能力
Mistral新旗舰决战Llama 3.1!最强开源Large 2 123B,扛鼎多语言编程全能王
新智元报道编辑: 【新智元导读】紧跟着Meta的重磅发布,Mistral Large 2也带着权重一起上新了,而且参数量仅为Llama 3.1 405B的三分之一。不仅在编码、数学...
OpenAI五级AGI战略遭吐槽,命名不清、逻辑混乱,本质只是空洞营销?
新智元报道编辑:耳朵 乔杨 【新智元导读】OpenAI的最新AGI布局——5级路线图再被吐槽是营销手段,不仅对「超级智能」命名和定义存在模糊之处,5个级别的层次结...
开源模型超过最强闭源模型,Llama 3.1能否颠覆AI生态?|甲子光年
扎克伯格誓要把开源进行到底。作者|苏霍伊 编辑|赵健Llama 3.1终于来了。 美国当地时间7月23日,Meta正式发布Llama 3.1。其包含8B、70B 和405B三个规模,最...
招聘 | 商汤研究院基础视觉组&基础多模态模型组研究员和实习岗位开放
「智猩猩招聘」将持续分享人工智能、硬科技领域在招职位信息,欢迎在看机会、在找工作的朋友关注。企业若有招聘需求,也可以关注本公众号,通过「联系我们」...
第四范式发布先知 AIOS 5.1,节省大模型算力硬件成本,提高 GPU 综合利用率
今天,第四范式先知AIOS 5.1版本正式发布。该版本新增GPU资源池化(vGPU)能力,实现对硬件集群平台化管理、算力资源的按需分配和快速调度,最多节省80%的硬...
马斯克启动全球最大AI集群,由10万个英伟达H100组成
点击上方蓝字关注我们“埃隆·马斯克领导的xAI孟菲斯超级集群启动,配备十万个Nvidia H100 GPU,旨在年底前训练出世界最强AI,此举或将重塑全球AI竞争格局。科...
ICML2024: 华中科大发现大模型具有自我认知
夕小瑶科技说 原创作者 | 谢年年不知道大家是否记得之前传到沸沸扬扬的Bing的 Sydney事件。 起因是一位网友晒出了其与Bing的聊天记录,其中Bing自述自己名叫S...
大模型时代结束?大佬齐预测:AI模型或需先缩小规模,才能再次扩大规模
新智元报道编辑:耳朵 【新智元导读】小模型强势来袭,「大模型时代」或将落幕?「小模型周」过去了 ,小模型的最新战场才刚刚开辟。 上周GPT-4o mini和Mistr...
从 OpenAI 收购实时分析数据公司看未来数据库长什么样?
作者 | 冬梅 前不久,OpenAI 宣布收购了一家以数据索引及查询功能而闻名的实时分析数据库 Rockset。消息一出,数据库领域和 AI 圈一片哗然。 据悉,Rockset ...
1 周 3 ,小型模型反而更具潜力?
点击上方蓝字关注我们“本周,人工智能行业迎来重大变革,Hugging Face、Nvidia与Mistral AI及OpenAI相继推出小型语言模型,旨在提高自然语言处理技术的普及度...
大模型“自学”后能力反下降,Llama/Mistral都没逃过
PengFei Liu 投稿量子位 | 公众号 QbitAIAI经过多轮“自我提升”,能力不增反降? 上海交通大学GAIR团队最新研究表明,在常识理解、数学推理和代码生成等复杂任...
华为GTS LocMoE+:高可扩展性亲和度 MoE 架构,低开销实现主动路由
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
上海AI lab开源LLaMAX,用3.5万小时的A100训练让大模型掌握上百种语言翻译
夕小瑶科技说 原创作者 | Richard 在这个AI大爆发的时代,各种智能工具如雨后春笋般涌现,大语言模型的能力也在不断刷新我们的认知。随便拉出一个AI模型,似...
OpenAI 秘密武器曝光!Q* 推理能力大爆发,逼近 AGI L2 里程碑
上周,一张OpenAI内部通往AGI最新路线图,在全网掀起热议。从图中明显可以看出,OpenAI将最终抵达AGI终点,划分了五大等级: L1:聊天机器人,具有对话能力的...