标签：模型

对标Hugging Face？GitHub Models新增OpenAI o1/Llama 3.2等，新功能支持模型并排比较

作者：李姝，李宝珠编辑：李宝珠北京时间 10 月 30 日，GitHub Universe 2024 如约而至，而今年正值大会十周年纪念日。本文将从 GitHub 发布的 AI 新进展入...

阅读原文

AIGC动态

2年前 (2024)

杰弗里·辛顿：从小语言到大语言，人工智能究竟如何理解人类？

来源：返朴演讲：杰弗里·辛顿翻译：陈国华（北京外国语大学外国语言研究所教授）2024 年 4 月 8 日辛顿获得尤利西斯奖章，以表彰他对计算机科学人工智能领...

阅读原文

AIGC动态

2年前 (2024)

微软发长文炮轰谷歌：不遗余力诋毁我们；抖音：严厉打击利用AI骗取老年人互动；苹果公开其AI背后技术，邀请研究人员访问丨AI情报局

要闻提示1.字节招兵买马，拟在欧洲设立 AI 研发中心 2.抖音：严厉打击利用 AI 骗取老年人互动，下架违规视频、处置违规账号3.可灵 AI 收入或破千万，商业化已...

阅读原文

AIGC动态

2年前 (2024)

港科大广州2025年春季与秋季博士生/研究助理招聘-大模型、AI4SCI、几何机器学习等方向

香港科技大学（广州）数据智能与几何人工智能实验室（DIGAI Lab) 诚邀有志于AI前沿研究的优秀学子加入，攻读博士学位或进行访问研究。实验室专注于表示学习、...

阅读原文

AIGC动态

2年前 (2024)

至高 1.8 倍无损加速！互补量化方案的投机加速

夕小瑶科技说原创作者 | Juntao Zhao等本文作者来自香港大学和哈尔滨工业大学。其中共同第一作者分别为来自香港大学Netexplo实验室的博士生Juntao Zhao、She...

阅读原文

AIGC动态

2年前 (2024)

迈向复现 OpenAI o1 的一小步：Steiner 开源模型阶段性进展报告

讲座预告11月1日上午10点，南开大学在读博士李森茂，将以《基于扩散模型编码器模块的推理加速》为主题进行直播讲解，欢迎扫码报名~导读作者为季逸超原文来自...

阅读原文

AIGC动态

2年前 (2024)

神秘模型“小熊猫”一夜刷屏：排名超Flux、Midjourney，网友：一看就中国的

一水发自凹非寺量子位 | 公众号 QbitAI一夜之间，名为“red_panda”（小熊猫）的神秘文生图模型狠狠火了！！登顶文生图竞技场，直接将Flux、Midjourney等一...

阅读原文

AIGC动态

2年前 (2024)

免训练大模型知识编辑，吸收新数据更高效｜EMNLP'24

阿里安全投稿量子位 | 公众号 QbitAI让大模型能快速、准确、高效地吸收新知识！被EMNLP 2024收录的一项新研究，提出了一种检索增强的连续提示学习新方法，...

阅读原文

AIGC动态

2年前 (2024)

古早费曼论文手写公式也能转LaTeX，还能看懂梗图，马斯克Grok新功能上线就火了

机器之心报道编辑：张倩、陈陈Grok 大模型终于能看懂图像了。设想一下，如果我们能够将所有 LaTeX 时代之前的文本资料输入到先进的大型语言模型（LLM）中，...

阅读原文

AIGC动态

2年前 (2024)

新扩散模型OmniGen一统图像生成，架构还高度简化、易用

机器之心发布机器之心编辑部大型语言模型（LLM）的出现统一了语言生成任务，并彻底改变了人机交互。然而，在图像生成领域，能够在单一框架内处理各种任务的...

阅读原文

AIGC动态

2年前 (2024)

权威AI开源标准1.0版发布：Llama也不算开源

机器之心报道编辑：泽南、小舟大模型开源的口号，不是随便说说的。该来的终于来了。本周，人工智能领域迎来了对于「开源」的官方定义。开放源代码促进会（O...

阅读原文

AIGC动态

2年前 (2024)

超越YOLOv10/11、RT-DETRv2/3！中科大D-FINE重新定义边界框回归任务

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

小红书大模型团队的探索与实践：从 0 到 1 构建自研 RLHF 框架

采访嘉宾 | 于子淇，小红书资深技术专家编辑 | 冬梅在人工智能技术的快速发展中，多模态大语言模型（MLLM）以其强大的图文理解、创作、知识推理及指令遵...

阅读原文

AIGC动态

2年前 (2024)

一个模型走天下！智源提出全新扩散架构OmniGen，AI生图进入「一键生成」时代

新智元报道编辑：编辑部 HYZ 【新智元导读】LLM统一了语言生成任务，图像生成可以吗？就在刚刚，智源推出了全新扩散模型架构OmniGen，单个模型就能生成图像，...

阅读原文

AIGC动态

2年前 (2024)

超越Transformer，全面升级！MIT等华人团队发布通用时序TimeMixer++架构，8项任务全面领先

新智元报道编辑：LRST 【新智元导读】TimeMixer++是一个创新的时间序列分析模型，通过多尺度和多分辨率的方法在多个任务上超越了现有模型，展示了时间序列分...

阅读原文

AIGC动态

2年前 (2024)

1…21 222324 25…483