标签:用户行为预测
Granite 3.1
Granite 3.1是IBM推出的新一代语言模型,具有强大的性能和更长的上下文处理能力。Granite 3.1模型家族有 4 种不同的尺寸和 2 种架构:密集模型2B和8B参数模型...
SLEA.AI:快速定制个性化LOGO的智能解决方案
SLEA.AI 是免费的AI Logo生成器,帮助用户快速创建专业级别的Logo设计。通过人工智能技术,让用户只需输入品牌名称和行业类型,在几秒钟内生成多个定制化的Lo...
Placer.ai:多行业位置与客流量数据洞察分析工具
Placer.ai是基于位置和客流量数据进行AI商业分析工具,通过结合人工智能和匿名数据,为零售、娱乐、消费品、房地产、金融服务和医疗等多个行业提供位置基础分...
Insight-V:多模态模型提升长链视觉推理能力的创新解决方案
Insight-V是南洋理工大学、腾讯公司和清华大学的研究者们共同推出的多模态模型,能提升多模态大型语言模型在长链视觉推理方面的能力。基于可扩展的数据生成流...
FineWeb 2:多语言预训练数据集助力全球NLP应用的创新与发展
FineWeb 2是Hugging Face推出的多语言预训练数据集,覆盖超过1000种语言。FineWeb 2基于定制化的数据管道处理,包括语言识别、去重、内容过滤和PII匿名化,适...
SPDL:高效便捷的开源AI模型数据加载解决方案助力深度学习创新
SPDL(Scalable and Performant Data Loading)是 Meta AI 推出的开源数据加载工具,能提高 AI 模型训练效率。基于多线程技术,实现高吞吐量数据加载,减少计...
TPDM:创新时间预测扩散模型推动高校科研合作与发展
TPDM(Time Prediction Diffusion Model)是西湖大学MAPLE实验室、南方科技大学、北京大学及西湖大学高等研究院先进技术研究所联合推出的图像生成模型,能自...
EfficientTAM:Meta AI推出创新视频对象分割与跟踪模型,提升视觉内容分析能力
EfficientTAM是Meta AI推出的轻量级视频对象分割和跟踪模型,能解决SAM 2模型在移动设备上部署时的高计算复杂度问题。基于用简单的非层次化Vision Transforme...
CAT4D:基于单目视频技术的创新4D场景生成方法解析
CAT4D是Google DeepMind、哥伦比亚大学和加州大学圣地亚哥分校共同推出的,能从单目视频创建4D场景(动态3D)表示。CAT4D基于多视图视频扩散模型,能在任意指...
GenFM:多语音AI播客功能助力个性化内容创作
GenFM是ElevenLabs公司推出的创新AI功能,支持将用户上传的PDF、文章和电子书等文本内容转换成多角色播客音频。这项服务支持32种语言,包括英语、中文等,基...
iDP3:革新3D视觉策略提升视觉体验与精准度
iDP3(Improved 3D Diffusion Policy)是斯坦福大学联合多所高校推出的3D视觉运动策略,能提升人形机器人在多样化环境中的自主操作能力。与传统3D策略不同,i...
Fancy123:创新3D网格生成技术实现高效建模与精准细节捕捉
Fancy123是华中科技大学和华南理工大学推出的3D网格生成技术,基于即插即用的变形技术从单张图片生成高质量的3D网格。该方法包含两个增强模块和反投影操作,...
Optima:提升通信效率与任务管理的创新训练框架
Optima是清华大学推出的优化基于大型语言模型(LLM)的多智能体系统(MAS)的框架。基于一个迭代的生成、排名、选择和训练范式,显著提高通信效率和任务效果...