AI工具

SLEA.AI

SLEA.AI 是免费的AI Logo生成器,帮助用户快速创建专业级别的Logo设计。通过人工智能技术,让用户只需输入品牌名称和行业类型,在几秒钟内生成多个定制化的Lo...
阅读原文

AI Chinese

AI Chinese是嗨你好教育推出的AI双语教学中文学习平台,基于AI技术为外国人提供在线中文学习解决方案。平台模拟中国真人老师在线授课,在TikTok用短视频和直...
阅读原文

Wavy

Wavy是AI驱动的照片编辑应用,基于先进的AI技术,将用户的照片转换成具有艺术感的杰作。Wavy主要功能包括AI艺术生成器、视觉放大、即时艺术创作、照片提升和...
阅读原文

WIME

WIME是上海微盟企业发展有限公司推出的AI电商内容创作平台,专为电商和新媒体领域设计。基于AI技术,帮助用户一键生成多风格图片和文案,实现从创意到成品的...
阅读原文

AgentScope:阿里开源多智能体开发平台实现高效协作与智能决策

AgentScope是阿里巴巴集团开源的多智能体开发平台,帮助开发者轻松构建和部署多智能体应用。AgentScope提供高易用性、高鲁棒性和分布式支持,内置多种模型API...
阅读原文

VisionFM:少样本多疾病诊断的智能眼科AI模型

VisionFM(伏羲慧眼)是多模态多任务的视觉基础模型,专为通用眼科人工智能而设计。通过预训练3.4百万张来自560,457个个体的眼科图像,覆盖广泛的眼科疾病、...
阅读原文

InvSR

InvSR是创新的图像超分辨率模型,基于扩散模型的逆过程恢复高分辨率图像。用大型预训练扩散模型中丰富的图像先验,改善超分辨率的效果。InvSR的核心在于深度...
阅读原文

DisPose

DisPose是北京大学、中国科学技术大学、清华大学和香港科技大学的研究团队共同推出的,提高人物图像动画质量的控制技术,基于从骨骼姿态和参考图像中提取有效...
阅读原文

MetaMorph

MetaMorph是多模态大模型(MLLM),通过指令微调(Instruction Tuning)实现视觉理解和生成。它提出了一种名为Visual-Predictive Instruction Tuning(VPiT)...
阅读原文

Bamba-9B:Mamba2架构驱动的高效解码语言模型展现卓越性能与灵活应用

Bamba-9B是IBM、普林斯顿大学、卡内基梅隆大学和伊利诺伊大学香槟分校联合推出的,基于Mamba2架构的仅解码语言模型模型。模型在完全开放的数据集上训练,能提...
阅读原文

AI Chinese:与中国老师实时互动,轻松掌握中文技巧与文化精髓

AI Chinese是嗨你好教育推出的AI双语教学中文学习平台,基于AI技术为外国人提供在线中文学习解决方案。平台模拟中国真人老师在线授课,在TikTok用短视频和直...
阅读原文

HelloMeme:面部表情与姿态迁移技术驱动的Stable Diffusion 1.5模型实现全新创作体验

HelloMeme是基于最新的Diffusion生成技术的框架,实现表情与姿态的迁移,HelloMeme集成空间编织注意力(Spatial Knitting Attentions)机制,基于Stable Diff...
阅读原文

ERA-42:星动纪元全新端到端原生机器人大模型实现智能化交互与高效任务执行

ERA-42是北京星动纪元推出的端到端原生机器人大模型,与自研的五指灵巧手星动XHAND1结合,能完成100多种复杂灵巧操作任务。ERA-42无需预编程,具备快速学习新...
阅读原文

Baichuan4-Finance:全链路金融领域智能增强大模型助力精准决策与风险管理

Baichuan4-Finance是百川智能推出的全链路金融领域增强大模型,包括Baichuan4-Finance-Base和Baichuan4-Finance。基于Baichuan4-Turbo,用领域自约束训练,在...
阅读原文

VSI-Bench

VSI-Bench(Visual-Spatial Intelligence Benchmark)是李飞飞、谢赛宁及他们的研究团队推出的视觉空间智能基准测试集,研究者构建用在评估多模态大型语言模...
阅读原文
1234133