标签:性能
重磅!Mistral Large 2深夜发布!Llama3.1仅一天被超越,最强开源再易主
夕小瑶科技说 原创作者 | 海野 第一次开源模型革命,突然就兴起了…… Llama3.1发布后,Meta还沉浸在强烈的社会反响中时,法国的Mistral AI团队突然扔出王炸:...
减轻幻觉新SOTA,7B模型自迭代训练效果超越GPT-4,上海AI lab发布
夕小瑶科技说 原创作者 | 谢年年 LLMs在回答各种复杂问题时,有时会“胡言乱语”,产生所谓的幻觉。解决这一问题的初始步骤就是创建高质量幻觉数据集训练模型以...
开源模型超过最强闭源模型,Llama 3.1能否颠覆AI生态?|甲子光年
扎克伯格誓要把开源进行到底。作者|苏霍伊 编辑|赵健Llama 3.1终于来了。 美国当地时间7月23日,Meta正式发布Llama 3.1。其包含8B、70B 和405B三个规模,最...
大模型风向变了,OpenAI苹果掉头布阵
大模型迈入“小而强”时代。 作者|ZeR0 编辑|漠影 生成式AI似乎有个隐形规律:每隔一段时间,就会上演一场令人瞠目的大型“撞车”事件。 仅是今年,就有谷歌Gemin...
挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2
新智元报道编辑:乔杨 【新智元导读】Scaling Law还没走到尽头,「小模型」逐渐成为科技巨头们的追赶趋势。Meta最近发布的MobileLLM系列,规模甚至降低到了1B...
夏天太热怎么办?AI 为“降温”材料发现提速数千倍,你的手机、电脑或许再也不发烫了
大数据文摘受权转载自学术头条 炎炎夏日,智能手机、平板电脑等电子设备常因“过热”而产生性能、安全问题。如何设计出散热更好的电子产品,材料是关键。 而其...
英伟达Mistral AI联袂出击!120亿小模型王者强势登场,碾压Llama 3单张4090可跑
新智元报道编辑:耳朵 桃子 【新智元导读】GPT-4o mini头把交椅还未坐热,Mistral AI联手英伟达发布12B参数小模型Mistral Nemo,性能赶超Gemma 2 9B和Llama 3...
Redmi K70 至尊版体验:它是性能的至尊版,还是全能的超大杯
从性能旗舰 到全能旗舰在雷军年度演讲的前一天,K70 至尊版就发布了。 和 K60 至尊版的更新模式相同,Redmi K70 至尊版搭载了联发科最新的天玑 9300+ 处理器...
LLama+Mistral+…+Yi=? 免训练异构大模型集成学习框架DeePEn来了
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
奥特曼深夜发动价格战,GPT-4o mini暴跌99%!清华同济校友立功,GPT-3.5退役
新智元报道编辑:编辑部 【新智元导读】GPT-4o mini深夜忽然上线,OpenAI终于开卷小模型!每百万输入token已达15美分的超低价,跟GPT-3相比,两年内模型成本...
上海AI lab开源LLaMAX,用3.5万小时的A100训练让大模型掌握上百种语言翻译
夕小瑶科技说 原创作者 | Richard 在这个AI大爆发的时代,各种智能工具如雨后春笋般涌现,大语言模型的能力也在不断刷新我们的认知。随便拉出一个AI模型,似...
ACL 2024 | 对25个开闭源模型数学评测,GPT-3.5-Turbo才勉强及格
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
只激活3.8B参数,性能比肩同款7B模型!训练微调都能用,来自微软
克雷西 发自 凹非寺量子位 | 公众号 QbitAI只需激活60%的参数,就能实现与全激活稠密模型相当的性能。 微软亚洲研究院的一项新研究,实现了模型的完全稀疏激...
Mamba一作再祭神作,H100利用率飙至75%!FlashAttention三代性能翻倍,比标准注意力快16倍
新智元报道编辑:编辑部 【新智元导读】时隔一年,FlashAttention又推出了第三代更新,专门针对H100 GPU的新特性进行优化,在之前的基础上又实现了1.5~2倍的...
大语言模型的前世今生:万字长文完整梳理所有里程碑式大语言模型(LLMs)
点击下方卡片,关注“AI生成未来” >>后台回复“GAI”,免费获取AI行业报告和资料! 作者:APlayBoy编辑:AI生成未来 链接:https://zhuanlan.zhihu.com/p/...