标签:用户行为预测

FineWeb 2:多语言预训练数据集助力全球NLP应用的创新与发展

FineWeb 2是Hugging Face推出的多语言预训练数据集,覆盖超过1000种语言。FineWeb 2基于定制化的数据管道处理,包括语言识别、去重、内容过滤和PII匿名化,适...
阅读原文

SPDL:高效便捷的开源AI模型数据加载解决方案助力深度学习创新

SPDL(Scalable and Performant Data Loading)是 Meta AI 推出的开源数据加载工具,能提高 AI 模型训练效率。基于多线程技术,实现高吞吐量数据加载,减少计...
阅读原文

TPDM:创新时间预测扩散模型推动高校科研合作与发展

TPDM(Time Prediction Diffusion Model)是西湖大学MAPLE实验室、南方科技大学、北京大学及西湖大学高等研究院先进技术研究所联合推出的图像生成模型,能自...
阅读原文

EfficientTAM:Meta AI推出创新视频对象分割与跟踪模型,提升视觉内容分析能力

EfficientTAM是Meta AI推出的轻量级视频对象分割和跟踪模型,能解决SAM 2模型在移动设备上部署时的高计算复杂度问题。基于用简单的非层次化Vision Transforme...
阅读原文

CAT4D:基于单目视频技术的创新4D场景生成方法解析

CAT4D是Google DeepMind、哥伦比亚大学和加州大学圣地亚哥分校共同推出的,能从单目视频创建4D场景(动态3D)表示。CAT4D基于多视图视频扩散模型,能在任意指...
阅读原文

GenFM:多语音AI播客功能助力个性化内容创作

GenFM是ElevenLabs公司推出的创新AI功能,支持将用户上传的PDF、文章和电子书等文本内容转换成多角色播客音频。这项服务支持32种语言,包括英语、中文等,基...
阅读原文

iDP3:革新3D视觉策略提升视觉体验与精准度

iDP3(Improved 3D Diffusion Policy)是斯坦福大学联合多所高校推出的3D视觉运动策略,能提升人形机器人在多样化环境中的自主操作能力。与传统3D策略不同,i...
阅读原文

Fancy123:创新3D网格生成技术实现高效建模与精准细节捕捉

Fancy123是华中科技大学和华南理工大学推出的3D网格生成技术,基于即插即用的变形技术从单张图片生成高质量的3D网格。该方法包含两个增强模块和反投影操作,...
阅读原文

Optima:提升通信效率与任务管理的创新训练框架

Optima是清华大学推出的优化基于大型语言模型(LLM)的多智能体系统(MAS)的框架。基于一个迭代的生成、排名、选择和训练范式,显著提高通信效率和任务效果...
阅读原文

Sweep AI:智能AI软件开发平台提升效率与用户体验的创新解决方案

Sweep AI是基于AI技术的软件平台,能提升软件开发效率和质量。基于集成大型语言模型(LLM)和高级代码分析工具,为开发者提供代码搜索、重构、测试和文档生成...
阅读原文

ProductScope:提升销量的AI驱动产品摄影与亚马逊列表优化解决方案

ProductScope是专为电子商务品牌、设计师和营销人员设计的多功能AI工具。提供产品摄影、亚马逊列表优化和客户洞察分析的解决方案。平台旨在简化产品设计、营...
阅读原文

MobA:智能移动体引领未来科技的便捷生活

MobA(Mobile Agent)是上海交通大学团队推出的新型移动智能体,基于多模态大型语言模型(MLLMs)提升移动设备的自动化任务执行能力。MobA采用两级架构:高级...
阅读原文

DELIFT:数据驱动的高效语言模型指令微调技术提升智能交互体验

DELIFT(Data Efficient Language model Instruction Fine-Tuning)是新型算法,用在优化大型语言模型(LLMs)在指令调优、任务特定微调和持续微调三个关键阶...
阅读原文

AutoConsis:美团与复旦大学携手推出UI内容一致性AI检测工具,助力提升用户体验

AutoConsis是UI内容一致性智能检测,是美团技术团队与复旦大学联合推出的。工具基于深度学习和大型语言模型自动识别和提取界面中的关键数据,检测并识别数据...
阅读原文

Postnitro:智能AI轮播图生成器助您轻松创建专业视觉内容

Postnitro是AI轮播图生成器,旨在帮助用户快速创建吸引人的社交媒体内容。基于先进的AI技术,提供智能设计预设和可定制模板,让用户能轻松生成多语言的轮播图...
阅读原文
12346