模型 - 第 34 页

LLM实践系列-详谈Tokenizer训练细节

今天给大家带来知乎@真中合欢的一篇文章，《LLM实践--Tokenizer训练》。知乎：https://zhuanlan.zhihu.com/p/739078635 经过了数据收集、筛选、去重，马上就...

阅读原文

AIGC动态

2年前 (2024)

李开复回应AI六小虎困境：有资金训练模型，融资、芯片都不是问题；阿里称新AI翻译工具击败谷歌和ChatGPT丨AI情报局

要闻提示1.零一万物新旗舰模型 Yi-Lightning 首度超越 GPT-4o，李开复回应AI六小虎困境传言：融资、芯片都不是问题 2.阿里巴巴国际部门称新AI翻译工具击败谷...

阅读原文

AIGC动态

2年前 (2024)

冲出“包围圈”，阶跃星辰登顶国内多模态理解大模型榜首

说起阶跃星辰，可以说是 AI 六小强中最低调的一个，但最近这家公司在 AI 圈里频频“闹出动静”。前几天，中文大模型基准测评机构 SuperCLUE 发布了 10 月中文...

阅读原文

AIGC动态

2年前 (2024)

最强小模型又易主！Mistral发布小部长Ministral 3B、8B，边缘计算之王！

夕小瑶科技说原创作者 | 付奶茶家人们，就在今天，Mistral 7B发布一周年之际，小模型的宝座又易主了！ Mistral研究团队发布了两款新的边缘计算小模型：Minis...

阅读原文

AIGC动态

2年前 (2024)

从威尔・史密斯鬼畜吃面到「Her」，这些幕后技术正在推动AI视频时代的到来

机器之心原创作者：张倩还记得「威尔・史密斯吃意大利面」的 AI 鬼畜视频吗？在这些视频里，威尔・史密斯的面部表情、动作都非常夸张，还充满了扭曲、变形。...

阅读原文

AIGC动态

2年前 (2024)

英伟达开源最新大模型Nemotron 70B后，只有OpenAI o1一个对手了

机器之心报道编辑：杜伟、陈陈英伟达不仅要做显卡领域的领先者，还要在大模型领域逐渐建立起自己的优势。今天，英伟达又开源了一个性能超级强大的模型 —— Ll...

阅读原文

AIGC动态

2年前 (2024)

全模态对齐框架align-anything来了：实现跨模态指令跟随

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

NeurIPS 2024 | FaceChain团队新作，开源拓扑对齐人脸表征模型TopoFR

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

2 美元就能用上 H100？英伟达 H100 价格崩盘，集群投资血亏：GPU 生意还怎么玩下去？

作者 | Eugene Cheah 译者 | 核子可乐策划 | 褚杏娟就在去年，H100 GPU 的每小时租赁价格还高达 8 美元。可现如今，不单可选的租赁商更加丰富，市场平均价...

阅读原文

AIGC动态

2年前 (2024)

零一万物发布最新旗舰模型，百万 token 仅 0.99 元！李开复：定价没有亏本

作者 | 褚杏娟 10 月 16 日，继上半年千亿参数模型 Yi-Large 之后，零一万物正式对外发布最新旗舰模型 Yi-Lightning。与 Yi-Large 相比，Yi-Lightning 在模...

阅读原文

AIGC动态

2年前 (2024)

52万张GPU集群塞进一个「盒子」？AI神器百模争霸困局！

新智元报道编辑：编辑部 HYZ 【新智元导读】「算力」堪称是AI时代最大的痛。在国外，OpenAI因为微软造GPU集群的速度太慢而算力告急。在国内，企业则面临着「...

阅读原文

AIGC动态

2年前 (2024)

英伟达开源新王！70B刷爆SOTA，击败GPT-4o只服OpenAI o1

新智元报道编辑：编辑部 HYZ 【新智元导读】就在刚刚，英伟达开源了超强模型Nemotron-70B，后者一经发布就超越了GPT-4o和Claude 3.5 Sonnet，仅次于OpenAI o1...

阅读原文

AIGC动态

2年前 (2024)

4090笔记本0.37秒直出大片！英伟达联手MIT清华祭出Sana架构，速度秒杀FLUX

新智元报道编辑：桃子好困【新智元导读】一台4090笔记本，秒生1K质量高清图。英伟达联合MIT清华团队提出的Sana架构，得益于核心架构创新，具备了惊人的图像...

阅读原文

AIGC动态

2年前 (2024)

不敢对比阿里Qwen2.5，Mistral“最强小模型”陷争议，欧洲的OpenAI也不Open了

梦晨发自凹非寺量子位 | 公众号 QbitAI欧洲的OpenAI，也不Open了。 Mistral AI发布自称“世界上最好的边缘模型”，却陷入质疑和争议。不仅因为这一次没有磁...

阅读原文

AIGC动态

2年前 (2024)

LeCun最新万字演讲：纯语言模型永远到不了人类水平，我们基本已经放弃了

白小交整理自凹非寺量子位 | 公众号 QbitAI当奥特曼、马斯克、Anthropic CEO都纷纷将AGI实现锚定在2026年前后，LeCun无疑是直接浇了冷水：完全是胡说八道。...

阅读原文

AIGC动态

2年前 (2024)

标签：模型