标签:能力

38页!限时下载!AI原生云建设与加速指南报告

导读《 AI 原生云建设与加速指南》由腾讯云和Gartner联合发布,该报告旨在为企业提供全面的AI原生云平台建设指南,助力企业在AI时代实现快速发展和创新,抢占...
阅读原文

为什么AI数不清Strawberry里有几个 r?Karpathy:我用表情包给你解释一下

机器之心报道 机器之心编辑部让模型知道自己擅长什么、不擅长什么是一个很重要的问题。还记得这些天大模型被揪出来的低级错误吗? 不知道 9.11 和 9.9 哪个大...
阅读原文

AI Scaling的神话

截至目前,语言模型越来越大,能力也越来越强,但过去的表现能预测未来吗? 一种流行的观点是,我们应该期待当前的趋势继续保持下去,并且出现更多数量级,这...
阅读原文

两天内,Meta 和 Mistral 两款主流大模型打擂台!已经不仅卷性能了,谁更便宜就用谁?

来源:AI前线 整理:冬梅、核子可乐Mistral 发布开源旗舰模型, 参数更小但性能不打折 对于前沿人工智能模型领域来说,这两天可谓热闹非凡,AI 科技竞赛正在...
阅读原文

Mistral新旗舰决战Llama 3.1!最强开源Large 2 123B,扛鼎多语言编程全能王

新智元报道编辑: 【新智元导读】紧跟着Meta的重磅发布,Mistral Large 2也带着权重一起上新了,而且参数量仅为Llama 3.1 405B的三分之一。不仅在编码、数学...
阅读原文

OpenAI五级AGI战略遭吐槽,命名不清、逻辑混乱,本质只是空洞营销?

新智元报道编辑:耳朵 乔杨 【新智元导读】OpenAI的最新AGI布局——5级路线图再被吐槽是营销手段,不仅对「超级智能」命名和定义存在模糊之处,5个级别的层次结...
阅读原文

开源模型超过最强闭源模型,Llama 3.1能否颠覆AI生态?|甲子光年

扎克伯格誓要把开源进行到底。作者|苏霍伊 编辑|赵健Llama 3.1终于来了。 美国当地时间7月23日,Meta正式发布Llama 3.1。其包含8B、70B 和405B三个规模,最...
阅读原文

招聘 | 商汤研究院基础视觉组&基础多模态模型组研究员和实习岗位开放

「智猩猩招聘」将持续分享人工智能、硬科技领域在招职位信息,欢迎在看机会、在找工作的朋友关注。企业若有招聘需求,也可以关注本公众号,通过「联系我们」...
阅读原文

第四范式发布先知 AIOS 5.1,节省大模型算力硬件成本,提高 GPU 综合利用率

今天,第四范式先知AIOS 5.1版本正式发布。该版本新增GPU资源池化(vGPU)能力,实现对硬件集群平台化管理、算力资源的按需分配和快速调度,最多节省80%的硬...
阅读原文

马斯克启动全球最大AI集群,由10万个英伟达H100组成

点击上方蓝字关注我们“埃隆·马斯克领导的xAI孟菲斯超级集群启动,配备十万个Nvidia H100 GPU,旨在年底前训练出世界最强AI,此举或将重塑全球AI竞争格局。科...
阅读原文

ICML2024: 华中科大发现大模型具有自我认知

夕小瑶科技说 原创作者 | 谢年年不知道大家是否记得之前传到沸沸扬扬的Bing的 Sydney事件。 起因是一位网友晒出了其与Bing的聊天记录,其中Bing自述自己名叫S...
阅读原文

大模型时代结束?大佬齐预测:AI模型或需先缩小规模,才能再次扩大规模

新智元报道编辑:耳朵 【新智元导读】小模型强势来袭,「大模型时代」或将落幕?「小模型周」过去了 ,小模型的最新战场才刚刚开辟。 上周GPT-4o mini和Mistr...
阅读原文

从 OpenAI 收购实时分析数据公司看未来数据库长什么样?

作者 | 冬梅 前不久,OpenAI 宣布收购了一家以数据索引及查询功能而闻名的实时分析数据库 Rockset。消息一出,数据库领域和 AI 圈一片哗然。 据悉,Rockset ...
阅读原文

1 周 3 连发,小型模型反而更具潜力?

点击上方蓝字关注我们“本周,人工智能行业迎来重大变革,Hugging Face、Nvidia与Mistral AI及OpenAI相继推出小型语言模型,旨在提高自然语言处理技术的普及度...
阅读原文

大模型“自学”后能力反下降,Llama/Mistral都没逃过

PengFei Liu 投稿量子位 | 公众号 QbitAIAI经过多轮“自我提升”,能力不增反降? 上海交通大学GAIR团队最新研究表明,在常识理解、数学推理和代码生成等复杂任...
阅读原文
1111213141555