标签:模型
神秘GPT模型引爆社区,GPT-4.5、GPT-5谣言满天飞,奥特曼在线围观
机器之心报道 编辑:杜伟、陈萍这场等待「GPT-5」的游戏啥时候才能结束?GPT-5 啥时候来?估计是 AI 领域最关心的问题之一了。是像 Sora 一样毫无预兆的发布...
「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么?
机器之心报道 机器之心编辑部前段时间,微软搞了个乌龙:隆重地开源了 WizardLM-2,又在不久后撤回得干干净净。 据现在可以查到的 WizardLM-2 发布信息,这是...
在12个视频理解任务中,Mamba先打败了Transformer
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
万兴科技朱伟:Sora至今没有商业化,视频模型成熟需要周期丨GenAICon 2024
60秒视频一键生成,天幕音视频大模型已开启公测。 2024中国生成式AI大会于4月18-19日在北京举行,在大会首日的主会场大模型专场上,万兴科技副总裁朱伟以《音...
昆仑万维方汉:将技术红利转为市场红利,拿到垂直领域SOTA是前提丨GenAICon 2024
中国研发能在垂直领域取得全球的SOTA。 2024中国生成式AI大会于4月18-19日在北京举行,在大会首日的主会场开幕式上,昆仑万维董事长兼CEO方汉以《从天工SkyMu...
智子引擎发布多模态大模型 Awaker:MOE、自主更新、写真视频效果优于 Sora
在 4 月 27 日召开的中关村论坛通用人工智能平行论坛上,人大系初创公司智子引擎隆重发布全新的多模态大模型 Awaker 1.0。 相对于智子引擎前代的 ChatImg 序...
ChatGPT 的对话框过时了?这款 AI 产品提供了一种很新的方式
拒绝 让大脑 困在聊天框「Message ChatGPT...」 当我们开启某个话题前,ChatGPT 空白的输入框里默认写着这一句话。 和 ChatGPT 的交互,就像和朋友的聊天,你...
26岁带着百人团队冲刺大模型,面壁智能天才CTO:高效比参数更重要
出品|InfQ 《大模型领航者》 访谈主持|霍太稳,极客邦科技创始人兼 CEO 访谈嘉宾|曾国洋,面壁智能 CTO 作者|褚杏娟 “尽管有所谓的‘百模大战’,但实际上...
大模型的“瘦身”:巨头逐鹿轻量化大模型 | 大模型一周大事
大模型的快节奏发展,让了解最新技术动态、积极主动学习成为每一位从业者的必修课。InfoQ 研究中心期望通过每周更新大模型行业最新动态,为广大读者提供全面...
探索 Copilot 创新实践:腾讯、字节跳动、PingCAP 与第四范式共聚 AICon
在这个技术日新月异的时代,人工智能和机器学习正在彻底改变我们处理数据和进行业务决策的方式。尤其是大语言模型(LLM)的兴起,为多个行业带来了翻天覆地的...
苹果与 OpenAI 重启谈判,Siri 或引入 ChatGPT,网友:国行用文心一言?
整理 | 华卫 据外媒报道,苹果正在就 iPhone 集成聊天机器人功能,加紧与 OpenAI 的谈判。有知情人士透露,两家公司已开始讨论可能达成的协议条款,以及如何...
全球首个自主进化多模态MoE震撼登场!写真视频击败Sora,人大系团队自研底座VDT
新智元报道编辑:编辑部 【新智元导读】人大系初创公司智子引擎发布的全新多模态大模型Awaker 1.0,直接迈向了AGI!它是业界首个真正实现自主更新的大模型,...
「专业智能体指导」让小模型学会数学推理!微调Mistral-7B实现86.81%准确率
新智元报道编辑:LRS 【新智元导读】小模型也能解锁数学能力,无需多模型集成,7B模型在GSM 8 k数据集上性能超越70B!对于小型语言模型(SLM)来说,数学应用...
全面解析RLHF,PPO,DPO,Flash Attention,增量学习等大模型算法
随着大模型的飞速发展,在短短一年间就有了大幅度的技术迭代更新,从LoRA、QLoRA、AdaLoRa、ZeroQuant、Flash Attention、KTO、PPO、DPO、蒸馏技术到模型增量...
今日arXiv最热NLP大模型论文:超越GPT-4,清华发布网页导航智能体AutoWebGLM
夕小瑶科技说 原创作者 | Tscom随着大语言模型(LLMs)的发展,Agent在网络导航等任务中展现出了前所未有的能力。想象一下,一个基于LLM的Agent能够在你享用...