标签:模型
颜水成加入昆仑万维,任天工智能联席CEO、2050全球研究院院长
机器之心报道编辑:泽南、小舟AI 大牛颜水成,要来造通用人工智能了。人工智能领域传来重磅转会消息。本周五晚间,昆仑万维正式宣布计算机视觉、机器学习领域...
用BigDL-LLM 即刻加速百亿级参数LLM推理 | 最“in”大模型
作者:英特尔公司黄晟盛、黄凯、戴金权量子位 | 公众号 QbitAI我们正迈入一个由大语言模型(Large Language Model, LLM)驱动的 AI 新时代,LLM在诸如客户服...
苹果芯跑大模型不用降计算精度,投机采样杀疯了,GPT-4也在用
梦晨 发自 凹非寺量子位 | 公众号 QbitAI专攻代码的Code Llama一出,大家伙都盼着谁来后续量化瘦身一下,好在本地也能运行。果然是llama.cpp作者Georgi Gerga...
复旦大学团队发布中文医疗健康个人助手,同时开源47万高质量数据集
机器之心发布机器之心编辑部随着远程医疗的兴起,在线问诊、咨询越发成为患者寻求便捷高效的医疗支持的首选项。近来大语言模型(LLM)展示出强大的自然语言交...
微软亚研提出TinyMIM,用知识蒸馏改进小型ViT
机器之心专栏微软亚洲研究院本文提出了 TinyMIM,它是第一个成功地使小模型受益于MIM预训练的模型。一、研究动机掩码建模(MIM, MAE)被证明是非常有效的自监...
4个月狂揽两千万,国内首个披露营收的大模型来了!
新智元报道编辑:编辑部【新智元导读】稳居国内第一梯队的360智脑,已经开始赚钱了!根据360的2023年半年报,360智脑已创造近2000万元相关业务收入,成为国内...
算法闻到榴莲臭!Science:AI嗅觉超人类,谷歌绘出50万气味图谱
新智元报道编辑:编辑部【新智元导读】谷歌团队在Sience上发文称,AI模型比人类具有更好的「嗅觉」。有了AI帮忙创造各种味道,吃货们有福了。你想知道,下面...
不用4个H100!340亿参数Code Llama在Mac可跑,每秒20个token,代码生成最拿手|Karpathy转赞
新智元报道编辑:桃子【新智元导读】现在,34B Code Llama模型已经能够在M2 Ultra上的Mac运行了,而且推理速度超过每秒20个token,背后杀器竟是「投机采样」...
GPT-4 MATH准确率最高涨至84.3%!港中文、清华等七所顶尖高校提出全新CSV方法
新智元报道编辑:LRS【新智元导读】让模型用代码自我验证解决方案,结合多数投票集成机制,推理准确率可以提升近30%!虽然大型语言模型(LLMs)在常识理解、...
谷歌证实大模型能顿悟,特殊方法能让模型快速泛化,或将打破大模型黑箱
新智元报道编辑:润 好困【新智元导读】谷歌团队认为,模型泛化能力无处不在,只要摸清条件,模型就不是随机鹦鹉。在特定情况下,人工智能模型会超越训练数据...
1句指令+5美元+20分钟,就能训练出小型专业模型,Prompt2Model了解一下
夕小瑶科技说 分享来源 | 机器之心CMU 与清华的研究者联合发布了 Prompt2Model 框架,它可以根据用户提供的 prompt,快速训练一个小型专业模型。仅需投入 5 ...
LeCun再泼冷水:只会看书的语言模型永远无法实现「类人智能」
夕小瑶科技说 分享来源 | 新智元问题不在语言模型的学习算法,而是语言本身的固有局限性,多模态将引领下一次AI爆发!自去年ChatGPT发布后,业内外都涌现出了...
哪个视觉语言模型更优?InstructBLIP、MiniGPT-4?全面评估基准LVLM-eHub告诉你
夕小瑶科技说 原创作者 | 王思若LLaMA、GPT-3等大型语言模型实现了对自然语言强大的理解和推理能力,为AI社区构筑了强大的语言基座模型。进而,继续迭代的GPT...
雹暴中心收集数据、大模型加持极端天气预测,「追风者也」正在上演
大数据文摘受权转载自HyperAI超神经作者 | 雪菜编辑 | 三羊雷暴、冰雹、龙卷风等极端天气总是让人捉摸不透又避之不及。然而澳洲的研究者们却以身犯险,深入雹...