标签:用户行为预测

Weights

Weights 是AI创作平台,基于AI技术创作各种类型的多媒体内容。用户在平台上免费创建多种作品,包括语音翻唱、合唱、文字转语音、图片、视频、音乐,及与 AI ...
阅读原文

TANGOFLUX

TANGOFLUX是高效的文本到音频生成模型,是新加坡科技设计大学(SUTD)和NVIDIA共同推出的。模型拥有约5.15亿参数,能在单个A40 GPU上仅用3.7秒生成长达30秒的...
阅读原文

TryOffAnyone

TryOffAnyone是能将穿着服装的人物照片转换成平铺的服装展示图的AI工具。基于先进的Latent Diffusion Models技术,自动识别并提取照片中的服装区域,然后将其...
阅读原文

DynamicControl

DynamicControl是腾讯优图联合南洋理工、浙大等研究机构推出的集成多模态大语言模型(MLLM)推理能力的文本生成图像(T2I)任务新框架。DynamicControl通过自...
阅读原文

联通元景

联通元景(UniT2IXL)是中国联通AI推出的中文原生文生图模型,完全在国产昇腾AI基础软硬件平台上实现训练和推理。模型采用复合语言编码模块,优化中文长文本...
阅读原文

SmartPrep.AI

SmartPrep.AI是全球首个大模型原生教学辅助平台,为学校提供助教Agent,帮助教师高效备课,给学生提供定制化学伴,基于AI技术简化教师的备课流程,提高教学效...
阅读原文

PC Agent

PC Agent是上海交通大学和Generative AI Research Lab (GAIR)联合推出的先进AI系统。系统基于模拟人类认知过程,执行如组织研究材料、起草报告和创建演示文稿...
阅读原文

Granite 3.1

Granite 3.1是IBM推出的新一代语言模型,具有强大的性能和更长的上下文处理能力。Granite 3.1模型家族有 4 种不同的尺寸和 2 种架构:密集模型2B和8B参数模型...
阅读原文

SLEA.AI:快速定制个性化LOGO的智能解决方案

SLEA.AI 是免费的AI Logo生成器,帮助用户快速创建专业级别的Logo设计。通过人工智能技术,让用户只需输入品牌名称和行业类型,在几秒钟内生成多个定制化的Lo...
阅读原文

ERA-42

ERA-42是北京星动纪元推出的端到端原生机器人大模型,与自研的五指灵巧手星动XHAND1结合,能完成100多种复杂灵巧操作任务。ERA-42无需预编程,具备快速学习新...
阅读原文

Placer.ai:多行业位置与客流量数据洞察分析工具

Placer.ai是基于位置和客流量数据进行AI商业分析工具,通过结合人工智能和匿名数据,为零售、娱乐、消费品、房地产、金融服务和医疗等多个行业提供位置基础分...

Insight-V:多模态模型提升长链视觉推理能力的创新解决方案

Insight-V是南洋理工大学、腾讯公司和清华大学的研究者们共同推出的多模态模型,能提升多模态大型语言模型在长链视觉推理方面的能力。基于可扩展的数据生成流...
阅读原文

FineWeb 2:多语言预训练数据集助力全球NLP应用的创新与发展

FineWeb 2是Hugging Face推出的多语言预训练数据集,覆盖超过1000种语言。FineWeb 2基于定制化的数据管道处理,包括语言识别、去重、内容过滤和PII匿名化,适...
阅读原文

SPDL:高效便捷的开源AI模型数据加载解决方案助力深度学习创新

SPDL(Scalable and Performant Data Loading)是 Meta AI 推出的开源数据加载工具,能提高 AI 模型训练效率。基于多线程技术,实现高吞吐量数据加载,减少计...
阅读原文

TPDM:创新时间预测扩散模型推动高校科研合作与发展

TPDM(Time Prediction Diffusion Model)是西湖大学MAPLE实验室、南方科技大学、北京大学及西湖大学高等研究院先进技术研究所联合推出的图像生成模型,能自...
阅读原文
1234569