AI工具

MagicDriveDiT:高分辨率自动驾驶长视频生成技术创新与应用

MagicDriveDiT是香港中文大学、香港科技大学、华为云和华为诺亚方舟实验室共同推出基于DiT架构的新型视频生成方法,专为自动驾驶应用设计,实现高分辨率和长...
阅读原文

Dia:智能网络助手提升效率与自动化处理网络任务

Dia是The Browser Company推出的新型AI网络浏览器,Dia的核心特色是深度集成AI技术,简化用户的日常网络活动。Dia浏览器将AI融入浏览器环境,提供智能写作辅...
阅读原文

EfficientTAM:Meta AI推出创新视频对象分割与跟踪模型,提升视觉内容分析能力

EfficientTAM是Meta AI推出的轻量级视频对象分割和跟踪模型,能解决SAM 2模型在移动设备上部署时的高计算复杂度问题。基于用简单的非层次化Vision Transforme...
阅读原文

Amazon Nova:亚马逊全新多模态生成大模型引领文本、图像与视频创作新时代

Amazon Nova 是亚马逊云服务(AWS)推出的新一代AI基础模型系列,提供行业领先的性能和成本效益。该系列包括专门处理文本的Amazon Nova Micro、多模态的Amazo...
阅读原文

Radiant Photo:全面提升您的照片质量的AI编辑软件

Radiant Photo 是 Radiant Imaging Labs 推出的先进照片编辑软件,基于智能 AI 技术优化照片,提供完美的色彩再现和快速的图像处理。软件支持手动调整和自动...
阅读原文

HunyuanVideo:腾讯发布130亿参数开源视频生成模型,赋能创作新纪元

HunyuanVideo是腾讯开源的视频生成模型,拥有130亿参数,是目前参数量最大的开源视频模型之一。HunyuanVideo具备物理模拟、高文本语义还原度、动作一致性和电...
阅读原文

JoinMC:智能客服助力跨境营销提升客户互动与销售转化

JoinMC是AI出海营销助手,专为跨境营销定制。基于1个大语言模型、2大核心逻辑(专属知识库的构建和AI场景识别),整合社交媒体、邮件、电商和物流四大渠道,...
阅读原文

Codel:多功能AI代理工具助力终端、浏览器及编辑器高效执行复杂任务

Codel是全自主AI代理工具,能在沙盒化的Docker环境中执行复杂任务和项目。Codel具备自主操作能力,内置浏览器和文本编辑器,所有操作记录存储于PostgreSQL数...
阅读原文

Lobe Vidol:智能交互平台让你与虚拟人和3D模型实时对话探索新世界

Lobe Vidol是开源的数字人创作平台,让每个人都能轻松创建和互动自己的虚拟偶像。Lobe Vidol提供流畅的对话体验、背景设置、动作姿势库、优雅的用户界面、角...
阅读原文

GPT学术优化:多功能开源项目助力学术研究与写作的高效创新工具

GPT学术优化(GPT Academic)是功能丰富的开源项目,专为学术研究和写作设计。GPT学术优化集成一键论文翻译、源代码解析、互联网信息获取、Latex文章校对、论...
阅读原文

KickRender:高效AI渲染工具助力快速实现专业级3D效果

KickRender是AI驱动3D渲染工具,能简化加速渲染过程。KickRender支持从Rhino等软件直接导入视图,支持从Archicad、Revit、SketchUp等软件上传JPG或PNG图像进...
阅读原文

研学智得AI:智能学术助手提升文献阅读与写作效率

研学智得AI是中国知网推出的AI学术文献阅读与写作辅助工具。研学智得AI基于渐进式阅读和矩阵式阅读模式提升阅读效率,自动提取文献研究要素构建文献矩阵,帮...
阅读原文

HiFiVFS:高保真视频换脸技术引领视觉

HiFiVFS(High Fidelity Video Face Swapping)是腾讯和VIVO公司推出的高保真视频换脸框架,HiFiVFS基于Stable Video Diffusion(SVD)框架,用多帧输入和时...
阅读原文

MVGenMaster:多视角融合的智能扩散模型提升数据分析与生成能力

MVGenMaster是复旦大学、阿里巴巴达摩院和湖潘实验室共同推出的多视图扩散模型,基于增强3D先验处理多样化的新视角合成(NVS)任务。模型基于度量深度和相机...
阅读原文

360Zhinao2-7B:360智脑大模型升级版全面提升智能交互与数据处理能力

360Zhinao2-7B是360自研的AI大模型360智脑7B参数升级版,涵盖基础模型及多种上下文长度的聊天模型。360Zhinao2-7B模型是继360Zhinao1-7B之后的重要更新,基于...
阅读原文