标签:模型
对标Hugging Face?GitHub Models新增OpenAI o1/Llama 3.2等, 新功能支持模型并排比较
作者:李姝,李宝珠 编辑:李宝珠 北京时间 10 月 30 日,GitHub Universe 2024 如约而至,而今年正值大会十周年纪念日。本文将从 GitHub 发布的 AI 新进展入...
杰弗里·辛顿:从小语言到大语言,人工智能究竟如何理解人类?
来源:返朴 演讲:杰弗里·辛顿 翻译:陈国华(北京外国语大学外国语言研究所教授)2024 年 4 月 8 日辛顿获得尤利西斯奖章,以表彰他对计算机科学人工智能领...
微软发长文炮轰谷歌:不遗余力诋毁我们;抖音:严厉打击利用AI骗取老年人互动;苹果公开其AI背后技术,邀请研究人员访问丨AI情报局
要闻提示1.字节招兵买马,拟在欧洲设立 AI 研发中心 2.抖音:严厉打击利用 AI 骗取老年人互动,下架违规视频、处置违规账号3.可灵 AI 收入或破千万,商业化已...
港科大广州2025年春季与秋季博士生/研究助理招聘-大模型、AI4SCI、几何机器学习等方向
香港科技大学(广州)数据智能与几何人工智能实验室(DIGAI Lab) 诚邀有志于AI前沿研究的优秀学子加入,攻读博士学位或进行访问研究。实验室专注于表示学习、...
至高 1.8 倍无损加速!互补量化方案的投机加速
夕小瑶科技说 原创作者 | Juntao Zhao等本文作者来自香港大学和哈尔滨工业大学。其中共同第一作者分别为来自香港大学Netexplo实验室的博士生Juntao Zhao、She...
迈向复现 OpenAI o1 的一小步:Steiner 开源模型阶段性进展报告
讲座预告11月1日上午10点,南开大学在读博士李森茂,将以《基于扩散模型编码器模块的推理加速》为主题进行直播讲解,欢迎扫码报名~导读作者为季逸超 原文来自...
神秘模型“小熊猫”一夜刷屏:排名超Flux、Midjourney,网友:一看就中国的
一水 发自 凹非寺量子位 | 公众号 QbitAI一夜之间,名为“red_panda”(小熊猫)的神秘文生图模型狠狠火了!! 登顶文生图竞技场,直接将Flux、Midjourney等一...
免训练大模型知识编辑,吸收新数据更高效|EMNLP'24
阿里安全 投稿量子位 | 公众号 QbitAI让大模型能快速、准确、高效地吸收新知识! 被EMNLP 2024收录的一项新研究,提出了一种检索增强的连续提示学习新方法,...
超越YOLOv10/11、RT-DETRv2/3!中科大D-FINE重新定义边界框回归任务
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
古早费曼论文手写公式也能转LaTeX,还能看懂梗图,马斯克Grok新功能上线就火了
机器之心报道 编辑:张倩、陈陈Grok 大模型终于能看懂图像了。设想一下,如果我们能够将所有 LaTeX 时代之前的文本资料输入到先进的大型语言模型(LLM)中,...
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
机器之心发布 机器之心编辑部大型语言模型(LLM)的出现统一了语言生成任务,并彻底改变了人机交互。然而,在图像生成领域,能够在单一框架内处理各种任务的...
权威AI开源标准1.0版发布:Llama也不算开源
机器之心报道 编辑:泽南、小舟大模型开源的口号,不是随便说说的。该来的终于来了。 本周,人工智能领域迎来了对于「开源」的官方定义。开放源代码促进会(O...
小红书大模型团队的探索与实践:从 0 到 1 构建自研 RLHF 框架
采访嘉宾 | 于子淇,小红书 资深技术专家 编辑 | 冬梅 在人工智能技术的快速发展中,多模态大语言模型(MLLM)以其强大的图文理解、创作、知识推理及指令遵...
一个模型走天下!智源提出全新扩散架构OmniGen,AI生图进入「一键生成」时代
新智元报道编辑:编辑部 HYZ 【新智元导读】LLM统一了语言生成任务,图像生成可以吗?就在刚刚,智源推出了全新扩散模型架构OmniGen,单个模型就能生成图像,...
超越Transformer,全面升级!MIT等华人团队发布通用时序TimeMixer++架构,8项任务全面领先
新智元报道编辑:LRST 【新智元导读】TimeMixer++是一个创新的时间序列分析模型,通过多尺度和多分辨率的方法在多个任务上超越了现有模型,展示了时间序列分...