标签:模型
实时音视频领域拓荒者的十年
谁能抓住这波实时对话式AI的机遇?作者丨张 进 编辑丨陈彩娴 2015 年,声网将WebRTC大会引入中国,筹办了第一届面向国内开发者、业务人员和用户的RTC(实时视...
AI + 影视,学会「避坑」再「吟诗 」丨CNCC 2024
AI 到底能不能在影视界玩出新花样?作者丨郑佳美 编辑丨马晓宁 “在影视行业,越专业的人越觉得 AI 就是个傻瓜相机!它只会产生一些让人「致幻」的 demo,实际...
曝MiniMax年营收或超7000万美金,旗下应用Talkie爆火;雷军回应AI语音恶搞:很困扰,希望大家别玩了丨AI情报局
要闻提示1.曝MiniMax今年收入预计7千万美元,旗下应用Talkie爆火产生大量广告收入,引发角色陪伴类AI应用复刻热潮 2.雷军 AI 语音被恶搞!雷军首次回应:让自...
Copilot放大招!接入Claude和Gemini,Cursor地位不保?
夕小瑶科技说 原创作者 | 小鹿家人们,在昨天举行的GitHub Universe年度大会,Github宣布了两件大事! 宣布人工智能编程助手Copilot,不再只绑定OpenAI的GPT...
中国存储厂,杀入顶分桌
如果不是 2016 年,AI 在围棋上大放异彩,关于高性能存储的故事本不会这么复杂——它应该是一场玩家数量极其有限的牌局,由英特尔、IBM、DataDirect Networks、...
统一图像生成,无需繁杂插件!智源发布扩散模型框架OmniGen
允中 发自 凹非寺量子位 | 公众号 QbitAI多模态模型,统一图像生成。 最新扩散模型框架来了。 智源研究院推出OmniGen,它能天然支持各种图像生成任务,架构高...
突破短视频局限!MMBench 团队构建中长视频开放问答评测基准,全面评估多模态大模型视频理解能力
新宇投稿 凹非寺量子位 | 公众号 QbitAIGPT-4o 四月发布会掀起了视频理解的热潮,而开源领军者Qwen2也对视频毫不手软,在各个视频评测基准上狠狠秀了一把肌肉...
Copilot一夜杀死编程助手,GitHub官宣接入Claude+Gemini!OpenAI沦为备胎
新智元报道编辑:编辑部 LHYj 【新智元导读】OpenAI再也不是微软的唯一解。第十届GitHub开发者大会上,微软官宣GitHub Copilot同时接入Claude 3.5 Sonnet和Ge...
o1之后,GitHub又接入Claude、Gemini,网友:也杀不死Cursor
机器之心报道 编辑:陈陈那些转到 Cursor 的用户,会不会又被吸引过来呢?从今天起,GitHub Copilot 用户可以有更多模型选择了。 包括 Anthropic 的 Claude 3...
Runway CEO:AI公司的时代已经结束了
机器之心报道 编辑:佳琪、小舟今年的大模型,上半年异常热闹,下半年有些凉凉。 做底层大模型研发,就像一场旷日持久的马拉松,研发成本高、技术门槛高,迭...
国产最强语音大模型诞生,MaskGCT宣布开源,声音效果媲美人类
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
多模态大模型: 盘点&Highlights part2——Qwen-VL系列
讲座预告11月1日上午10点,南开大学在读博士李森茂,将以《基于扩散模型编码器模块的推理加速》为主题进行直播讲解,欢迎扫码报名~导读Hi大家好,我叫延捷,...
NeurIPS 2024收录!基于扩散模型编码器模块的推理加速丨一作、南开大学博士生李森茂讲座预告
最近,文本到图像的扩散模型取得了显着的进步。值得注意的是,Stable Diffusion和DeepFloyd-IF是当前开源社区中最成功的两个扩散模型。这些模型基于UNet架构...
对标Hugging Face?GitHub Models新增OpenAI o1/Llama 3.2等, 新功能支持模型并排比较
作者:李姝,李宝珠 编辑:李宝珠 北京时间 10 月 30 日,GitHub Universe 2024 如约而至,而今年正值大会十周年纪念日。本文将从 GitHub 发布的 AI 新进展入...
杰弗里·辛顿:从小语言到大语言,人工智能究竟如何理解人类?
来源:返朴 演讲:杰弗里·辛顿 翻译:陈国华(北京外国语大学外国语言研究所教授)2024 年 4 月 8 日辛顿获得尤利西斯奖章,以表彰他对计算机科学人工智能领...