标签:数据可视化

MoshiVis

MoshiVis 是 Kyutai 推出的开源多模态语音模型,基于 Moshi 实时对话语音模型开发,增加了视觉输入功能。能实现图像的自然、实时语音交互,将语音和视觉信息...

Cube 3D

Cube 3D 是 Roblox 推出的AI 3D生成大模型,基于 AI 技术高效生成 3D 模型和环境。Cube 3D支持直接从文本描述生成完整的 3D 对象,与游戏引擎兼容。Cube 3D能...
阅读原文

Gemini Embedding

Gemini Embedding 是 Google 推出的先进的文本嵌入模型,基于将文本转化为高维数值向量,捕捉其语义和上下文信息。Gemini Embedding基于 Gemini 模型训练,具...
阅读原文

AppAgentX

AppAgentX 是西湖大学推出的新型自我进化式 GUI(图形用户界面)代理框架,基于从执行历史中抽象出高级动作提升代理在智能手机交互中的效率和智能性。AppAgen...
阅读原文

VDraw

VDraw是基于AI技术的信息图表生成工具,帮助用户将文字、文件或视频内容快速转化为专业且个性化的视觉内容。用户能对生成的图表进行个性化定制,包括修改颜色...
阅读原文

Ideogram 2a

Ideogram 2a 是 AI 图像生成公司 Ideogram 最新发布的文生图模型,模型在 Ideogram 2.0 的基础上进行了优化,主打高效性和实用性,生成速度显著提升,成本降...
阅读原文

TongGeometry

TongGeometry 是北京通用AI研究院和北京大学AI研究所联合推出的基于树搜索的几何模型,专门用在提出和解决奥林匹克级别的几何问题。TongGeometry基于高效的搜...
阅读原文

匡优Excel

匡优Excel是智能 Excel 分析工具。通过自然语言交互的方式,帮助用户快速完成Excel数据的处理和分析。用户只需用简单的中文提问或下达指令,例如“计算本月销...
阅读原文

VisoMaster

VisoMaster 是基于 AI 技术的换脸和编辑软件,功能强大操作简便。支持图片、视频以及直播换脸,能生成自然逼真的换脸效果,应用于娱乐、影视制作等领域。支持...
阅读原文

Onlook

Onlook是开源的视觉编辑工具,专为 React 应用程序设计,帮助设计师和开发人员更高效地协作。支持用户在浏览器中直接修改 React 应用的 UI,实时查看效果,将...
阅读原文

REEF

REEF(Representation Encoding Fingerprints)是用于大型语言模型(LLM)的指纹识别技术。通过在模型训练过程中嵌入特定的编码信息,为每个模型生成一个唯一...
阅读原文

VideoPhy

VideoPhy是UCLA和谷歌研究研究院联合推出的,首个评估视频生成模型物理常识能力的基准测试,能衡量模型生成的视频是否遵循现实世界的物理规则。VideoPhy基准...
阅读原文

Lookie

Lookie是AI穿搭应用,支持用户上传照片创建数字分身,试穿各种潮流服饰,并提供穿搭建议。Lookie拥有近30种风格的服饰库,覆盖实用穿搭、职场、生活、约会等...
阅读原文

MetaMorph

MetaMorph是多模态大模型(MLLM),通过指令微调(Instruction Tuning)实现视觉理解和生成。它提出了一种名为Visual-Predictive Instruction Tuning(VPiT)...
阅读原文

Postnitro:智能AI轮播图生成器助您轻松创建专业视觉内容

Postnitro是AI轮播图生成器,旨在帮助用户快速创建吸引人的社交媒体内容。基于先进的AI技术,提供智能设计预设和可定制模板,让用户能轻松生成多语言的轮播图...
阅读原文
1234