标签:用户行为预测
AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!
这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...
Placer.ai:多行业位置与客流量数据洞察分析工具
Placer.ai是基于位置和客流量数据进行AI商业分析工具,通过结合人工智能和匿名数据,为零售、娱乐、消费品、房地产、金融服务和医疗等多个行业提供位置基础分...
Insight-V:多模态模型提升长链视觉推理能力的创新解决方案
Insight-V是南洋理工大学、腾讯公司和清华大学的研究者们共同推出的多模态模型,能提升多模态大型语言模型在长链视觉推理方面的能力。基于可扩展的数据生成流...
FineWeb 2:多语言预训练数据集助力全球NLP应用的创新与发展
FineWeb 2是Hugging Face推出的多语言预训练数据集,覆盖超过1000种语言。FineWeb 2基于定制化的数据管道处理,包括语言识别、去重、内容过滤和PII匿名化,适...
SPDL:高效便捷的开源AI模型数据加载解决方案助力深度学习创新
SPDL(Scalable and Performant Data Loading)是 Meta AI 推出的开源数据加载工具,能提高 AI 模型训练效率。基于多线程技术,实现高吞吐量数据加载,减少计...
TPDM:创新时间预测扩散模型推动高校科研合作与发展
TPDM(Time Prediction Diffusion Model)是西湖大学MAPLE实验室、南方科技大学、北京大学及西湖大学高等研究院先进技术研究所联合推出的图像生成模型,能自...
EfficientTAM:Meta AI推出创新视频对象分割与跟踪模型,提升视觉内容分析能力
EfficientTAM是Meta AI推出的轻量级视频对象分割和跟踪模型,能解决SAM 2模型在移动设备上部署时的高计算复杂度问题。基于用简单的非层次化Vision Transforme...
CAT4D:基于单目视频技术的创新4D场景生成方法解析
CAT4D是Google DeepMind、哥伦比亚大学和加州大学圣地亚哥分校共同推出的,能从单目视频创建4D场景(动态3D)表示。CAT4D基于多视图视频扩散模型,能在任意指...
GenFM:多语音AI播客功能助力个性化内容创作
GenFM是ElevenLabs公司推出的创新AI功能,支持将用户上传的PDF、文章和电子书等文本内容转换成多角色播客音频。这项服务支持32种语言,包括英语、中文等,基...
iDP3:革新3D视觉策略提升视觉体验与精准度
iDP3(Improved 3D Diffusion Policy)是斯坦福大学联合多所高校推出的3D视觉运动策略,能提升人形机器人在多样化环境中的自主操作能力。与传统3D策略不同,i...
Fancy123:创新3D网格生成技术实现高效建模与精准细节捕捉
Fancy123是华中科技大学和华南理工大学推出的3D网格生成技术,基于即插即用的变形技术从单张图片生成高质量的3D网格。该方法包含两个增强模块和反投影操作,...
Optima:提升通信效率与任务管理的创新训练框架
Optima是清华大学推出的优化基于大型语言模型(LLM)的多智能体系统(MAS)的框架。基于一个迭代的生成、排名、选择和训练范式,显著提高通信效率和任务效果...
Sweep AI:智能AI软件开发平台提升效率与用户体验的创新解决方案
Sweep AI是基于AI技术的软件平台,能提升软件开发效率和质量。基于集成大型语言模型(LLM)和高级代码分析工具,为开发者提供代码搜索、重构、测试和文档生成...
ProductScope:提升销量的AI驱动产品摄影与亚马逊列表优化解决方案
ProductScope是专为电子商务品牌、设计师和营销人员设计的多功能AI工具。提供产品摄影、亚马逊列表优化和客户洞察分析的解决方案。平台旨在简化产品设计、营...
MobA:智能移动体引领未来科技的便捷生活
MobA(Mobile Agent)是上海交通大学团队推出的新型移动智能体,基于多模态大型语言模型(MLLMs)提升移动设备的自动化任务执行能力。MobA采用两级架构:高级...
DELIFT:数据驱动的高效语言模型指令微调技术提升智能交互体验
DELIFT(Data Efficient Language model Instruction Fine-Tuning)是新型算法,用在优化大型语言模型(LLMs)在指令调优、任务特定微调和持续微调三个关键阶...