标签:模型

刷榜「代码生成」任务!复旦等发布StepCoder框架:从编译器反馈信号中强化学习

新智元报道编辑:LRS 【新智元导读】StepCoder将长序列代码生成任务分解为代码完成子任务课程来缓解强化学习探索难题,对未执行的代码段以细粒度优化;还开源...
阅读原文

大型 AI 生成模型时代的开放和可重复性研究 |NVIDIA GTC24 大会预告

3月18-21日,NVIDIA GTC 2024 大会即将举行! 与由业界大咖、开发人员、研究人员和商业策略专家组成的梦之队交流,共同塑造 AI 和加速计算的未来。 从备受期...
阅读原文

微调与RAG的优缺点分析

智猩猩与智东西将于4月18-19日在北京共同举办2024中国生成式AI大会,阿里巴巴通义千问大模型技术负责人周畅,潞晨科技创始人尤洋,生数科技CEO唐家渝,优必选...
阅读原文

智谱AI:国产全自研大模型商业化落地新解法

放眼当下的科技浪潮,AI大模型无疑是一年多来持续引人注目的焦点。基于大模型的算法推理,30秒即可生成完美可用的Word、PPT文档,工作时长不必再以小时计算;...
阅读原文

今日arXiv最热大模型论文:超越LoRA,北京大学提出预训练模型非梯度优化法

夕小瑶科技说 原创编辑 | 松果 引言:探索大型语言模型中低秩适应的新方法在自然语言处理领域,大语言模型(LLMs)的迅猛发展带来了前所未有的性能提升。然而...
阅读原文

苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人

机器之心报道 机器之心编辑部苹果也在搞自己的大型多模态基础模型,未来会不会基于该模型推出相应的文生图产品呢?我们拭目以待。 今年以来,苹果显然已经加...
阅读原文

能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径

文本大模型卷出新高度,Claude 3 在数学、编程、多语言理解、视觉等多个维度超越 GPT-4 和上线不足一个月的 Gemini 1.0 Ultra。「日新月异」已经不足以形容当...
阅读原文

中国的 OpenAI 们怎么赚钱?这家公司先走一步

AI 润物 细无声电影《奥本海默》开场第一幕,出现了一段序言:「普罗米修斯盗取了众神的火焰,并将其交给人类。他也因此被缚于岩石之上,遭受永世的折磨」。 ...
阅读原文

透过科大讯飞的“AI+”行业实地战,新质生产力变革的未来之路

▲图片由AI生成 两会政府工作报告首提“AI+”,千行百业竞发,讯飞星火军团打头阵。 作者|三北 编辑|漠影 近日,“人工智能+(AI+)”在2024年两会中首次被写进政...
阅读原文

OpenAI机器人活了!说话做事太像人,2分半视频震撼世界

OpenAI机器人来了,说话竟然会“结巴”,AI负责人深度拆解背后技术。 作者|云鹏 编辑|李水青 OpenAI大模型加持,Figure机器人再次颠覆了我们的想象! ▲测试员说...
阅读原文

Claude 3大模型引起学界关注,业内人士:或将开启科研新范式

来源:DeepTech深科技 破解量子算法、破译古老语言、用几个小时给出科学家花费数月才能得到的研究方案……自 AI 初创公司 Anthropic 于太平洋时间 2024 年 3 月...
阅读原文

OpenAI宿敌发布Claude 3 Haiku:速度最快,价格亲民|甲子光年

Anthropic形容它为:我们迄今为止最快的模型。编译|栗子 传闻中的GPT-4.5 Turbo暂时还没来,我们倒是先等来了Claude 3 Haiku。 北京时间3月14日,OpenAI最能...
阅读原文

今日arXiv最热NLP大模型论文:大模型把《算法导论》学明白了!

夕小瑶科技说 原创编辑 | Tscom 引言:探索自然语言描述算法的执行能力在计算机科学的发展历程中,能够理解和执行自然语言描述的程序一直是一个长期追求的目...
阅读原文

UC伯克利:用大模型预测未来,准确率超越人类!

夕小瑶科技说 原创编辑 | 谢年年近年来,语言模型在文本生成、翻译、情感分析等领域大放异彩,但利用语言模型做预测的任务还比较少。这里的预测任务指的是根...
阅读原文

阿里数赛首次向AI开放!知乎网友:给AI捏了把汗,该防止人类

新智元报道编辑:编辑部 【新智元导读】一年一度的阿里全球数学竞赛又开始了。本届最大的亮点,首次向硅基AI开放,最高可摘得1万美金大奖。不用等了,带着你...
阅读原文