阶跃同时开源视频生成+实时语音模型,我愿称之「多模态界的Deepseek」

原标题:阶跃同时开源视频生成+实时语音模型,我愿称之「多模态界的Deepseek」 文章来源:夕小瑶科技说 内容字数:6015字中国开源大模型的崛起:阶跃星辰的惊...
阅读原文

人大李崇轩教授:自回归是否是通往语言智能的唯一路径?

本文旨在分享LLaDA [2,3]的研究历程以及我对生成模型的最新理解。
阅读原文

Finedefics

Finedefics 是北京大学彭宇新教授团队推出的细粒度多模态大模型,提升多模态大语言模型(MLLMs)在细粒度视觉识别(FGVR)任务中的表现。模型通过引入对象的...
阅读原文

Step-Audio

Step-Audio是阶跃星辰团队推出的首个产品级的开源语音交互模型,能根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地进行高...
阅读原文

Nephola

Nephola 是 PsychAI 推出的心理陪伴型 AI 应用,专注于情绪管理和心理健康。通过四大性格独特的 AI 智能体(Lolo、Momo、Bobo、Dodo)为用户提供情感陪伴和心...
阅读原文

profile picture Maker

profile picture Maker(PFPMaker)是基于人工智能技术的免费在线头像制作工具。能快速去除照片背景,提供丰富的编辑功能,帮助用户轻松创建个性化头像。用户...
阅读原文

Shallow Research

Shallow Research 是秘塔AI搜索推出的一种新的研究模式,能快速信息收集与初步分析,在短时间内完成对大量资料的整理和基础结论的提炼。Shallow Research 用“...
阅读原文

马斯克发布Grok3:多项测试超越DeepSeek,展现强劲竞争力

原标题:马斯克发布Grok3:多项测试超越DeepSeek,展现强劲竞争力 文章来源:AI范儿 内容字数:1325字xAI发布Grok-3:大语言模型性能新标杆 xAI近日发布了新...
阅读原文

DeepSeek,根之技术

人若无根,身似浮萍;\x0d\x0a国若无根,繁华若梦。
阅读原文