标签:模型

抛弃自回归,连接一致性Diffusion和LLM!UCSD上交新作热度紧追AF 3

新智元报道编辑:乔杨 好困 【新智元导读】来自加州大学圣地亚哥分校和上海交通大学的几位研究者发表了他们关于「一致性大语言模型」的研究成果(Consistency...
阅读原文

奠基性VAE荣获ICLR首届「时间检验奖」!国内学者获2篇杰出论文提名

新智元报道编辑:好困 乔杨 【新智元导读】5月7日-11日,ICLR 2024会议在维也纳召开,不仅公布了杰出论文以及荣誉提名等奖项,而且颁发了2013年成立以来首个...
阅读原文

图灵巨头现身ICLR,顶会现场疯狂追星LeCun、Bengio!中国团队三大技术趋势引爆AGI新想象

新智元报道编辑:编辑部 【新智元导读】这几天的维也纳,上演了一场AI圈的狂欢。在ICLR 2024上,图灵巨头LeCun、Bengio纷纷现身,直接让现场挤爆,变成追星现...
阅读原文

重磅!腾讯云下周发布多项混元大模型最新进展 | 直播预告

随着生成式Al技术发展加速,大模型产业化应用正在逐步迎来爆发式增长。腾讯云作为各行各业的数字化转型助手,积极推动大模型深入产业,助力产业智能化升级。 ...
阅读原文

Mixtral-8x7B MoE大模型微调实践,超越Llama2-65B

直播预告 | 5月14日晚7点,「智猩猩AI新青年讲座」第235讲正式开讲,慕尼黑工业大学视觉实验室陈振宇博士将直播讲解《三维室内场景纹理图生成》欢迎扫码报名~...
阅读原文

数字大脑的未来,技术与计算交叉的愿景 | 追问观察

近年来,得益于方法学的重大进步和从分子到整个大脑多层次的数字数据集成及建模,脑科学研究无疑已迈入一个新时代。在这一背景下,神经科学与技术、计算的交...
阅读原文

王贻芳院士:当代粒子物理的主旋律——希格斯粒子 | 科技导报

来源:科技导报王贻芳,实验高能物理学家,中国科学院院士,美国国家科学院外籍院士,俄罗斯科学院外籍院士,发展中国家科学院院士。现任中国科学院高能物理...
阅读原文

2024年,自动驾驶会迎来质的改变吗?|甲子光年智库

一文读懂端到端自动驾驶。作者|翟惠宇 编辑|王博 89.2万人次,这是今年北京国际汽车展览会(以下简称“北京车展”)的观众人数,而上一届北京车展的观众人数...
阅读原文

千卡集群算力竞赛,国产大模型终于等来了“中国英伟达”|甲子光年

国产算力新突破。作者|赵健 在替代英伟达的道路上,国产算力一直面临一个“鸡生蛋、蛋生鸡”的难题。 当国产芯片问世之后,要想真正用起来,需要种子客户用实...
阅读原文

RAG还是微调?万字长文总结大模型微调技能图谱

随着大模型的飞速发展,在短短一年间就有了大幅度的技术迭代更新,从LoRA、QLoRA、AdaLoRa、ZeroQuant、Flash Attention、KTO、PPO、DPO、蒸馏技术到模型增量...
阅读原文

今日arXiv最热NLP大模型论文:NAACL24实锤语言学对大模型“负优化”,抽象语义表示+思维链有损表现

夕小瑶科技说 原创作者 | Richard大语言模型正以势不可挡的姿态席卷自然语言处理领域。在这个语言模型大显神威的时代,很多任务都转变为了端到端的文本生成任...
阅读原文

知名 AI 搜索 Perplexity 发布 Pages 功能,开始对内容创作下手了

Perplexity 目前正在对一项名为「Perplexity Pages」的新功能进行 beta 测试,旨在增强其平台内的内容创作能力。该功能处于内测阶段,仅对通过官方表格注册的...
阅读原文

周日聊:C.AI 类产品壁垒如何构建,商业模式在哪里?

Character.AI 带起了一波情感娱乐类产品的热潮。从最初进入人们视野的星野、筑梦岛,如今 AI 咨询、塔罗、陪伴式日记等不同形态的产品层出不穷。处于不断演变...
阅读原文

75亿元!今年自动驾驶领域最大融资来了:90后剑桥博士带队,微软、英伟达为其站台,这家英国AI独角兽被首相视为“全村的希望”

整理 | 冬梅、核子可乐 Alex Kendall,29 岁,是自动驾驶初创公司 Wayve 的联合创始人兼首席执行官。英国自动驾驶独角兽 获 10 亿美元融资 微软、英伟达为其...
阅读原文

零一万物李谋:当大模型推理遇到算力瓶颈,如何进行工程优化?

嘉宾 | 李谋 编辑 | 李忠良 自 OpenAI 发布 ChatGPT 起,大语言模型的惊艳效果吸引了越来越多的人和资本关注到该领域,近年模型本身的参数量和序列长度也呈指...
阅读原文