标签:智能对话

GameGen-O

GameGen-O 是腾讯推出的一款基于 Transformer 架构的游戏视频生成模型,专门用于生成开放世界视频游戏。模型能模拟游戏引擎的多种功能,包括生成游戏角色、动...
阅读原文

M2UGen

M2UGen是先进的多模态音乐理解和生成框架,由腾讯PCG ARC实验室与新加坡国立大学联合推出。结合了大型语言模型(LLM)的能力,能处理包括文本、图像、视频和...
阅读原文

PoseTalk

PoseTalk 是基于文本和音频的姿势控制和运动细化方法的开源项目,用于一次性生成会说话的头部视频。从图像、驱动音频和驱动姿势合成说话人脸视频,为用户提供...
阅读原文

BeaGo

BeaGo是零一万物推出的AI搜索助手,提供快速、可靠且高质量的搜索体验。支持文字搜索,解读图像,生成直观且信息丰富的答案。BeaGo的特色在于智能理解能力,...
阅读原文

ANTO

ANTO是一款开源的Windows桌面字幕翻译工具,用于翻译SRT格式的视频字幕文件。集成多种翻译引擎,如谷歌翻译、DeepL、微软翻译、百度翻译和有道翻译等,用户根...
阅读原文

AMD-135M

AMD-135M是AMD推出的首款小型语言模型(SLM),为特定用例提供性能与资源消耗之间的平衡。基于LLaMA2模型架构,在AMD Instinct MI250加速器上训练,基于670亿...
阅读原文

商汤小浣熊

商汤小浣熊是商汤科技推出的“小浣熊”系列AI智能助手,已为数十万用户提供了数十亿次智能辅助服务,其中包括代码小浣熊和办公小浣熊,分别助力开发者轻松驾驭...
阅读原文

Aria

Aria是由Rhymes AI团队推出全球首个开源多模态原生混合专家(MoE)模型,能理解和处理文本、代码、图像和视频等多种输入模态。模型在多模态和语言任务上展现...
阅读原文

揽睿星舟

揽睿星舟是一个云端AI训推一体算力平台,由翼方健数自主研发。提供高性价比的GPU计算资源、开箱即用的训推环境及AI工具链,旨在解决AI协作过程中的安全信任问...
阅读原文

Loong

Loong是由香港大学和字节跳动联合推出的一种新型长视频生成模型,能生成外观一致、动态丰富、场景过渡自然的分钟级长视频。模型基于自回归大型语言模型(LLM...
阅读原文

Agent-S

Agent-S 是创新的代理框架,旨在基于图形用户界面(GUI)实现人机交互的自动化。Agent-S 基于模拟人类的操作方式,用鼠标和键盘直接与计算机交互,处理复杂的...
阅读原文

Baichuan-Omni

Baichuan-Omni 是由百川智能推出的一款开源的 7B 多模态大型语言模型(MLLM),能同时处理和分析图像、视频、音频和文本等多种模态的数据。Baichuan-Omni 提...
阅读原文

LOKI

LOKI是由中山大学和上海AI Lab联合提出的合成数据检测基准,旨在全面评估大型多模态模型(LMMs)在识别视频、图像、3D、文本和音频等多种模态合成数据的能力...
阅读原文

SaRA

SaRA是一种新型的预训练扩散模型微调方法,由上海交通大学和腾讯优图实验室共同推出。基于重新激活预训练过程中看似无效的参数,让模型能适应新任务。SaRA基...
阅读原文

Dippy

Dippy是创新的AI平台,基于在智能手机主屏幕上添加虚拟角色,为用户提供个性化的AI伴侣体验。虚拟角色能与用户进行互动对话,随着时间推移学习和适应用户的个...
阅读原文