性能 - 第 7 页

重磅！Mistral Large 2深夜发布！Llama3.1仅一天被超越，最强开源再易主

夕小瑶科技说原创作者 | 海野第一次开源模型革命，突然就兴起了…… Llama3.1发布后，Meta还沉浸在强烈的社会反响中时，法国的Mistral AI团队突然扔出王炸：...

阅读原文

AIGC动态

2年前 (2024)

减轻幻觉新SOTA，7B模型自迭代训练效果超越GPT-4，上海AI lab发布

夕小瑶科技说原创作者 | 谢年年 LLMs在回答各种复杂问题时，有时会“胡言乱语”，产生所谓的幻觉。解决这一问题的初始步骤就是创建高质量幻觉数据集训练模型以...

阅读原文

AIGC动态

2年前 (2024)

开源模型超过最强闭源模型，Llama 3.1能否颠覆AI生态？｜甲子光年

扎克伯格誓要把开源进行到底。作者｜苏霍伊编辑｜赵健Llama 3.1终于来了。美国当地时间7月23日，Meta正式发布Llama 3.1。其包含8B、70B 和405B三个规模，最...

阅读原文

AIGC动态

2年前 (2024)

大模型风向变了，OpenAI苹果掉头布阵

大模型迈入“小而强”时代。作者|ZeR0 编辑|漠影生成式AI似乎有个隐形规律：每隔一段时间，就会上演一场令人瞠目的大型“撞车”事件。仅是今年，就有谷歌Gemin...

阅读原文

AIGC动态

2年前 (2024)

挑战Scaling Law，Meta发布移动端350M小模型MobileLLM，性能比肩7B LLaMA-v2

新智元报道编辑：乔杨【新智元导读】Scaling Law还没走到尽头，「小模型」逐渐成为科技巨头们的追赶趋势。Meta最近发布的MobileLLM系列，规模甚至降低到了1B...

阅读原文

AIGC动态

2年前 (2024)

夏天太热怎么办？AI 为“降温”材料发现提速数千倍，你的手机、电脑或许再也不发烫了

大数据文摘受权转载自学术头条炎炎夏日，智能手机、平板电脑等电子设备常因“过热”而产生性能、安全问题。如何设计出散热更好的电子产品，材料是关键。而其...

阅读原文

AIGC动态

2年前 (2024)

英伟达Mistral AI联袂出击！120亿小模型王者强势登场，碾压Llama 3单张4090可跑

新智元报道编辑：耳朵桃子【新智元导读】GPT-4o mini头把交椅还未坐热，Mistral AI联手英伟达发布12B参数小模型Mistral Nemo，性能赶超Gemma 2 9B和Llama 3...

阅读原文

AIGC动态

2年前 (2024)

Redmi K70 至尊版体验：它是性能的至尊版，还是全能的超大杯

从性能旗舰到全能旗舰在雷军年度演讲的前一天，K70 至尊版就发布了。和 K60 至尊版的更新模式相同，Redmi K70 至尊版搭载了联发科最新的天玑 9300+ 处理器...

阅读原文

AIGC动态

2年前 (2024)

LLama+Mistral+…+Yi=? 免训练异构大模型集成学习框架DeePEn来了

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

奥特曼深夜发动价格战，GPT-4o mini暴跌99%！清华同济校友立功，GPT-3.5退役

新智元报道编辑：编辑部【新智元导读】GPT-4o mini深夜忽然上线，OpenAI终于开卷小模型！每百万输入token已达15美分的超低价，跟GPT-3相比，两年内模型成本...

阅读原文

AIGC动态

2年前 (2024)

上海AI lab开源LLaMAX，用3.5万小时的A100训练让大模型掌握上百种语言翻译

夕小瑶科技说原创作者 | Richard 在这个AI大爆发的时代，各种智能工具如雨后春笋般涌现，大语言模型的能力也在不断刷新我们的认知。随便拉出一个AI模型，似...

阅读原文

AIGC动态

2年前 (2024)

ACL 2024 | 对25个开闭源模型数学评测，GPT-3.5-Turbo才勉强及格

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

只激活3.8B参数，性能比肩同款7B模型！训练微调都能用，来自微软

克雷西发自凹非寺量子位 | 公众号 QbitAI只需激活60%的参数，就能实现与全激活稠密模型相当的性能。微软亚洲研究院的一项新研究，实现了模型的完全稀疏激...

阅读原文

AIGC动态

2年前 (2024)

Mamba一作再祭神作，H100利用率飙至75%！FlashAttention三代性能翻倍，比标准注意力快16倍

新智元报道编辑：编辑部【新智元导读】时隔一年，FlashAttention又推出了第三代更新，专门针对H100 GPU的新特性进行优化，在之前的基础上又实现了1.5～2倍的...

阅读原文

AIGC动态

2年前 (2024)

大语言模型的前世今生：万字长文完整梳理所有里程碑式大语言模型（LLMs）

点击下方卡片，关注“AI生成未来” >>后台回复“GAI”，免费获取AI行业报告和资料！作者：APlayBoy编辑：AI生成未来链接：https://zhuanlan.zhihu.com/p/...

阅读原文

AIGC动态

2年前 (2024)

标签：性能