标签:性能
1块3090就能训7B大模型,山东大学低带宽低显存训练法,解决显卡限购卡脖子
夕小瑶科技说 原创作者 | 谢年年 大模型的全参数微调对资源要求非常高,当前业界更倾向于采用LoRA,Parallel Adapter等参数高效微调(PEFT)方法,通过添加只...
吴恩达团队新作:多模态多样本上下文学习,无需微调快速适应新任务
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
大模型压缩量化方案怎么选?无问芯穹Qllm-Eval量化方案全面评估:多模型、多参数、多维度
机器之心发布 作者:李师尧(无问芯穹TechView)基于 Transformer架构的大型语言模型在各种基准测试中展现出优异性能,但数百亿、千亿乃至万亿量级的参数规模...
2.5%KV缓存保持大模型90%性能,大模型金字塔式信息汇聚模式探秘|开源
蔡泽凡 投稿量子位 | 公众号 QbitAI用KV缓存加速大模型的显存瓶颈,终于迎来突破。 北大、威斯康辛-麦迪逊、微软等联合团队提出了全新的缓存分配方案,只用2....
苹果智能揭秘:神奇背后的尖端人工智能技术
点击上方蓝字关注我们“苹果在WWDC上推出个人智能系统Apple Intelligence,集成至平台,优化移动设备性能,专注日常任务,与OpenAI合作处理复杂请求。苹果公司...
FineWeb技术报告出炉!揭秘HuggingFace规模最大、质量最高预训练数据集
新智元报道编辑:Mindy 【新智元导读】从大规模网络爬取、精细过滤到去重技术,通过FineWeb的技术报告探索如何打造高质量数据集,为大型语言模型(LLM)预训...
原作者带队,LSTM卷土重来之Vision-LSTM出世
机器之心报道 编辑:鸭梨、蛋酱与 DeiT 等使用 ViT 和 Vision-Mamba (Vim) 方法的模型相比,ViL 的性能更胜一筹。 AI 领域的研究者应该还记得,在 Transforme...
全球开源新王Qwen2-72B诞生,碾压Llama3-70B击败国产闭源模型!AI圈大佬转疯了
新智元报道编辑:编辑部 【新智元导读】一夜之间,全球最强开源模型再次易主。万众瞩目的Qwen2-72B一出世,火速杀进开源LLM排行榜第一,美国最强开源模型Llam...
英特尔放大招:新制程、能效核一起上,144核的至强6,性能成倍提升
机器之心发布 机器之心编辑部今日,英特尔推出英特尔® 至强® 6能效核处理器,每个 CPU 拥有多达 144 个内核,机架密度提高达3倍1,以高性能、高密度、高能效...
iQOO Pad2 Pro:卓尔不群的巅峰性能,从容应对不止一面
标题: iQOO Pad2 Pro:卓尔不群的巅峰性能,从容应对不止一面 摘要: 工作学习电竞娱乐多面手。 到底是谁在说, Android 平板的性能,够用就好? 但 iQOO 电...
首次证实白盒Transformer可扩展性!马毅教授CRATE-α:鲸吞14亿数据,性能稳步提升
新智元报道编辑:LRS 【新智元导读】CRATE-α是一种新型Transformer架构变体,通过设计改进提升了模型的可扩展性、性能和可解释性,CRATE-α-Base在ImageNet分...
AI手机PC大爆发,Arm从软硬件到生态发力,打造行业AI百宝箱
生成式AI,Arm抛出AI软硬件加速全家桶。 作者|云鹏 编辑|漠影 随着“Gen-AI”时代的到来,AI手机、AI PC等关键核心移动设备都在快速与生成式AI结合,越来越多的...
英特尔牙膏挤爆:功耗降40%、AI算力120TOPS,你的下一代笔记本没有内存条了
西风 发自 凹非寺量子位 | 公众号 QbitAI英特尔为了AI,再次做出重大架构变革: 像手机一样搞起SoC(系统级芯片),你的下一台笔记本不会再有独立内存条。 刚...
苏妈杀疯了:移动端最强NPU算力达50TOPS,最强AI芯片挑战英伟达
机器之心报道 作者:杜伟、亚鹂你方唱罢我登场。一年一度的 Computex 科技大会成为了 GPU 厂商们秀肌肉的舞台,其中当属英伟达和 AMD 最为亮眼。英伟达现场拿...
挑战英伟达,AMD官宣年更芯片!新款MI325X重磅发布,比H200快1.3倍
新智元报道编辑:庸庸 乔杨 【新智元导读】AMD在Computex主题演讲上大出风头,推出了首批Zen 5处理器,包括台式机用Ryzen 9000 CPU和笔记本电脑用Ryzen AI 30...