标签:模型
LLM实践系列-详谈Tokenizer训练细节
今天给大家带来知乎@真中合欢的一篇文章,《LLM实践--Tokenizer训练》。 知乎:https://zhuanlan.zhihu.com/p/739078635 经过了数据收集、筛选、去重,马上就...
李开复回应AI六小虎困境:有资金训练模型,融资、芯片都不是问题;阿里称新AI翻译工具击败谷歌和ChatGPT丨AI情报局
要闻提示1.零一万物新旗舰模型 Yi-Lightning 首度超越 GPT-4o,李开复回应AI六小虎困境传言:融资、芯片都不是问题 2.阿里巴巴国际部门称新AI翻译工具击败谷...
冲出“包围圈”,阶跃星辰登顶国内多模态理解大模型榜首
说起阶跃星辰,可以说是 AI 六小强中最低调的一个,但最近这家公司在 AI 圈里频频“闹出动静”。 前几天,中文大模型基准测评机构 SuperCLUE 发布了 10 月中文...
最强小模型又易主!Mistral发布小部长Ministral 3B、8B,边缘计算之王!
夕小瑶科技说 原创作者 | 付奶茶家人们,就在今天,Mistral 7B发布一周年之际,小模型的宝座又易主了! Mistral研究团队发布了两款新的边缘计算小模型:Minis...
从威尔・史密斯鬼畜吃面到「Her」,这些幕后技术正在推动AI视频时代的到来
机器之心原创 作者:张倩还记得「威尔・史密斯吃意大利面」的 AI 鬼畜视频吗?在这些视频里,威尔・史密斯的面部表情、动作都非常夸张,还充满了扭曲、变形。...
英伟达开源最新大模型Nemotron 70B后,只有OpenAI o1一个对手了
机器之心报道 编辑:杜伟、陈陈英伟达不仅要做显卡领域的领先者,还要在大模型领域逐渐建立起自己的优势。今天,英伟达又开源了一个性能超级强大的模型 —— Ll...
全模态对齐框架align-anything来了:实现跨模态指令跟随
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
NeurIPS 2024 | FaceChain团队新作,开源拓扑对齐人脸表征模型TopoFR
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
零一万物发布最新旗舰模型,百万 token 仅 0.99 元!李开复:定价没有亏本
作者 | 褚杏娟 10 月 16 日,继上半年千亿参数模型 Yi-Large 之后,零一万物正式对外发布最新旗舰模型 Yi-Lightning。与 Yi-Large 相比,Yi-Lightning 在模...
2 美元就能用上 H100? 英伟达 H100 价格崩盘,集群投资血亏:GPU 生意还怎么玩下去?
作者 | Eugene Cheah 译者 | 核子可乐 策划 | 褚杏娟 就在去年,H100 GPU 的每小时租赁价格还高达 8 美元。可现如今,不单可选的租赁商更加丰富,市场平均价...
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,速度秒杀FLUX
新智元报道编辑:桃子 好困 【新智元导读】一台4090笔记本,秒生1K质量高清图。英伟达联合MIT清华团队提出的Sana架构,得益于核心架构创新,具备了惊人的图像...
52万张GPU集群塞进一个「盒子」?AI神器百模争霸困局!
新智元报道编辑:编辑部 HYZ 【新智元导读】「算力」堪称是AI时代最大的痛。在国外,OpenAI因为微软造GPU集群的速度太慢而算力告急。在国内,企业则面临着「...
英伟达开源新王!70B刷爆SOTA,击败GPT-4o只服OpenAI o1
新智元报道编辑:编辑部 HYZ 【新智元导读】就在刚刚,英伟达开源了超强模型Nemotron-70B,后者一经发布就超越了GPT-4o和Claude 3.5 Sonnet,仅次于OpenAI o1...
王炸级3nm安卓AI芯片发布:生成视频不用联网,智能体帮你点外卖订酒店
克雷西 发自 深圳量子位 | 公众号 QbitAI安卓首款3nm、PC级Arm V9架构、第八代NPU——天玑9400,成为了移动AI芯片的最新最强成果! 相比上一代生成式AI芯片天玑...
Meta版快慢机来了!田渊栋团队整合快慢思考,能走迷宫推箱子
明敏 发自 凹非寺量子位 | 公众号 QbitAIMeta版“快慢机”来了。 田渊栋团队带来新作Dualformer,把快慢思考无缝结合,性能提升还成本更低。 能解决迷宫、推箱...