标签：模型

在线教程 | 重回霸主地位，Stable Diffusion 3.5 轻松生成多元化风格图像

HyperAI超神经教程版块现已上线「Stable-Diffusion-3.5-Large 图像生成 Demo」，无需输入任何命令，一键克隆即可快速体验！今年 6 月，Stability AI 隆重发布...

阅读原文

AIGC动态

2年前 (2024)

GPT-4o、NotebookLM带来的AI语音新变化，声网们是怎么想的？

GPT-4o 的语音演示，引燃了行业对于 AI 产品语音实时交互的想象，完全实时、可随时打断的 AI 助手，正成为新的趋势。而 Google Labs 推出的 NotebookLM，则...

阅读原文

AIGC动态

2年前 (2024)

实时音视频领域拓荒者的十年

谁能抓住这波实时对话式AI的机遇？作者丨张进编辑丨陈彩娴 2015 年，声网将WebRTC大会引入中国，筹办了第一届面向国内开发者、业务人员和用户的RTC（实时视...

阅读原文

AIGC动态

2年前 (2024)

AI + 影视，学会「避坑」再「吟诗」丨CNCC 2024

AI 到底能不能在影视界玩出新花样？作者丨郑佳美编辑丨马晓宁 “在影视行业，越专业的人越觉得 AI 就是个傻瓜相机！它只会产生一些让人「致幻」的 demo，实际...

阅读原文

AIGC动态

2年前 (2024)

曝MiniMax年营收或超7000万美金，旗下应用Talkie爆火；雷军回应AI语音恶搞：很困扰，希望大家别玩了丨AI情报局

要闻提示1.曝MiniMax今年收入预计7千万美元，旗下应用Talkie爆火产生大量广告收入，引发角色陪伴类AI应用复刻热潮 2.雷军 AI 语音被恶搞！雷军首次回应：让自...

阅读原文

AIGC动态

2年前 (2024)

Copilot放大招！接入Claude和Gemini，Cursor地位不保？

夕小瑶科技说原创作者 | 小鹿家人们，在昨天举行的GitHub Universe年度大会，Github宣布了两件大事！宣布人工智能编程助手Copilot，不再只绑定OpenAI的GPT...

阅读原文

AIGC动态

2年前 (2024)

中国存储厂，杀入顶分桌

如果不是 2016 年，AI 在围棋上大放异彩，关于高性能存储的故事本不会这么复杂——它应该是一场玩家数量极其有限的牌局，由英特尔、IBM、DataDirect Networks、...

阅读原文

AIGC动态

2年前 (2024)

统一图像生成，无需繁杂插件！智源发布扩散模型框架OmniGen

允中发自凹非寺量子位 | 公众号 QbitAI多模态模型，统一图像生成。最新扩散模型框架来了。智源研究院推出OmniGen，它能天然支持各种图像生成任务，架构高...

阅读原文

AIGC动态

2年前 (2024)

突破短视频局限！MMBench 团队构建中长视频开放问答评测基准，全面评估多模态大模型视频理解能力

新宇投稿凹非寺量子位 | 公众号 QbitAIGPT-4o 四月发布会掀起了视频理解的热潮，而开源领军者Qwen2也对视频毫不手软，在各个视频评测基准上狠狠秀了一把肌肉...

阅读原文

AIGC动态

2年前 (2024)

o1之后，GitHub又接入Claude、Gemini，网友：也杀不死Cursor

机器之心报道编辑：陈陈那些转到 Cursor 的用户，会不会又被吸引过来呢？从今天起，GitHub Copilot 用户可以有更多模型选择了。包括 Anthropic 的 Claude 3...

阅读原文

AIGC动态

2年前 (2024)

Runway CEO：AI公司的时代已经结束了

机器之心报道编辑：佳琪、小舟今年的大模型，上半年异常热闹，下半年有些凉凉。做底层大模型研发，就像一场旷日持久的马拉松，研发成本高、技术门槛高，迭...

阅读原文

AIGC动态

2年前 (2024)

国产最强语音大模型诞生，MaskGCT宣布开源，声音效果媲美人类

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

Copilot一夜编程助手，GitHub官宣接入Claude+Gemini！OpenAI沦为备胎

新智元报道编辑：编辑部 LHYj 【新智元导读】OpenAI再也不是微软的唯一解。第十届GitHub开发者大会上，微软官宣GitHub Copilot同时接入Claude 3.5 Sonnet和Ge...

阅读原文

AIGC动态

2年前 (2024)

多模态大模型: 盘点&Highlights part2——Qwen-VL系列

讲座预告11月1日上午10点，南开大学在读博士李森茂，将以《基于扩散模型编码器模块的推理加速》为主题进行直播讲解，欢迎扫码报名~导读Hi大家好，我叫延捷，...

阅读原文

AIGC动态

2年前 (2024)

NeurIPS 2024收录！基于扩散模型编码器模块的推理加速丨一作、南开大学博士生李森茂讲座预告

最近，文本到图像的扩散模型取得了显着的进步。值得注意的是，Stable Diffusion和DeepFloyd-IF是当前开源社区中最成功的两个扩散模型。这些模型基于UNet架构...

阅读原文

AIGC动态

2年前 (2024)

1…20 212223 24…483