标签:能力
38页!限时下载!AI原生云建设与加速指南报告
导读《 AI 原生云建设与加速指南》由腾讯云和Gartner联合发布,该报告旨在为企业提供全面的AI原生云平台建设指南,助力企业在AI时代实现快速发展和创新,抢占...
为什么AI数不清Strawberry里有几个 r?Karpathy:我用表情包给你解释一下
机器之心报道 机器之心编辑部让模型知道自己擅长什么、不擅长什么是一个很重要的问题。还记得这些天大模型被揪出来的低级错误吗? 不知道 9.11 和 9.9 哪个大...
两天内,Meta 和 Mistral 两款主流大模型打擂台!已经不仅卷性能了,谁更便宜就用谁?
来源:AI前线 整理:冬梅、核子可乐Mistral 发布开源旗舰模型, 参数更小但性能不打折 对于前沿人工智能模型领域来说,这两天可谓热闹非凡,AI 科技竞赛正在...
Mistral新旗舰决战Llama 3.1!最强开源Large 2 123B,扛鼎多语言编程全能王
新智元报道编辑: 【新智元导读】紧跟着Meta的重磅发布,Mistral Large 2也带着权重一起上新了,而且参数量仅为Llama 3.1 405B的三分之一。不仅在编码、数学...
OpenAI五级AGI战略遭吐槽,命名不清、逻辑混乱,本质只是空洞营销?
新智元报道编辑:耳朵 乔杨 【新智元导读】OpenAI的最新AGI布局——5级路线图再被吐槽是营销手段,不仅对「超级智能」命名和定义存在模糊之处,5个级别的层次结...
开源模型超过最强闭源模型,Llama 3.1能否颠覆AI生态?|甲子光年
扎克伯格誓要把开源进行到底。作者|苏霍伊 编辑|赵健Llama 3.1终于来了。 美国当地时间7月23日,Meta正式发布Llama 3.1。其包含8B、70B 和405B三个规模,最...
招聘 | 商汤研究院基础视觉组&基础多模态模型组研究员和实习岗位开放
「智猩猩招聘」将持续分享人工智能、硬科技领域在招职位信息,欢迎在看机会、在找工作的朋友关注。企业若有招聘需求,也可以关注本公众号,通过「联系我们」...
第四范式发布先知 AIOS 5.1,节省大模型算力硬件成本,提高 GPU 综合利用率
今天,第四范式先知AIOS 5.1版本正式发布。该版本新增GPU资源池化(vGPU)能力,实现对硬件集群平台化管理、算力资源的按需分配和快速调度,最多节省80%的硬...
马斯克启动全球最大AI集群,由10万个英伟达H100组成
点击上方蓝字关注我们“埃隆·马斯克领导的xAI孟菲斯超级集群启动,配备十万个Nvidia H100 GPU,旨在年底前训练出世界最强AI,此举或将重塑全球AI竞争格局。科...
ICML2024: 华中科大发现大模型具有自我认知
夕小瑶科技说 原创作者 | 谢年年不知道大家是否记得之前传到沸沸扬扬的Bing的 Sydney事件。 起因是一位网友晒出了其与Bing的聊天记录,其中Bing自述自己名叫S...
大模型时代结束?大佬齐预测:AI模型或需先缩小规模,才能再次扩大规模
新智元报道编辑:耳朵 【新智元导读】小模型强势来袭,「大模型时代」或将落幕?「小模型周」过去了 ,小模型的最新战场才刚刚开辟。 上周GPT-4o mini和Mistr...
从 OpenAI 收购实时分析数据公司看未来数据库长什么样?
作者 | 冬梅 前不久,OpenAI 宣布收购了一家以数据索引及查询功能而闻名的实时分析数据库 Rockset。消息一出,数据库领域和 AI 圈一片哗然。 据悉,Rockset ...
1 周 3 连发,小型模型反而更具潜力?
点击上方蓝字关注我们“本周,人工智能行业迎来重大变革,Hugging Face、Nvidia与Mistral AI及OpenAI相继推出小型语言模型,旨在提高自然语言处理技术的普及度...
大模型“自学”后能力反下降,Llama/Mistral都没逃过
PengFei Liu 投稿量子位 | 公众号 QbitAIAI经过多轮“自我提升”,能力不增反降? 上海交通大学GAIR团队最新研究表明,在常识理解、数学推理和代码生成等复杂任...