AI工具

Step-Audio

Step-Audio是阶跃星辰团队推出的首个产品级的开源语音交互模型,能根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地进行高...
阅读原文

Nephola

Nephola 是 PsychAI 推出的心理陪伴型 AI 应用,专注于情绪管理和心理健康。通过四大性格独特的 AI 智能体(Lolo、Momo、Bobo、Dodo)为用户提供情感陪伴和心...
阅读原文

profile picture Maker

profile picture Maker(PFPMaker)是基于人工智能技术的免费在线头像制作工具。能快速去除照片背景,提供丰富的编辑功能,帮助用户轻松创建个性化头像。用户...
阅读原文

Shallow Research

Shallow Research 是秘塔AI搜索推出的一种新的研究模式,能快速信息收集与初步分析,在短时间内完成对大量资料的整理和基础结论的提炼。Shallow Research 用“...
阅读原文

Matrix3D

Matrix3D 是南京大学、苹果公司和香港科技大学合作推出的新型的统一摄影测量模型,能在一个模型中完成多个摄影测量子任务,包括姿态估计、深度预测和新视图合...
阅读原文

ImageRAG

ImageRAG 是基于检索增强生成(Retrieval-Augmented Generation, RAG)的图像生成技术,通过动态检索相关图像来提升文本到图像(T2I)模型生成罕见或未见概念...
阅读原文

X-R1

X-R1是基于强化学习的低成本训练框架,能加速大规模语言模型的后训练(Scaling Post-Training)开发。X-R1用极低的成本训练0.5B(5亿参数)规模的R1-Zero模型...
阅读原文

Step-Video-T2V

Step-Video-T2V 是阶跃星辰团队推出的开源文本到视频预训练模型,拥有 300 亿参数,能生成长达 204 帧的高质量视频。模型基于深度压缩的变分自编码器(Video-...
阅读原文

unsloth

unsloth 是开源的大型语言模型(LLM)微调工具,基于优化计算步骤和 GPU 内核,显著提升模型训练速度减少内存使用。Unsloth支持多种主流 LLM,如 Llama-3、Mi...
阅读原文

腾讯混元T1

T1(Thinker)是腾讯混元推出的最新深度思考模型,已正式上线接入腾讯元宝。模型专注于逻辑推理和深度思考,支持联网搜索功能,能从互联网信源、微信公众号、...
阅读原文

MatChat AI

MatChat AI 是松山湖材料实验室主导推出的材料科学领域AI工具。MatChat AI基于大语言模型和增强搜索技术,整合超过28万篇材料科学、物理、化学领域的专业论文...
阅读原文

ConsistentDreamer

ConsistentDreamer 是华为慕尼黑研究中心提出的新型图像到 3D 资产生成技术,通过单张图像生成视图一致的 3D 网格。方法通过多视图先验图像引导的高斯优化,...
阅读原文

FoloUp

FoloUp 是开源的AI语音面试平台,能帮助企业高效地进行招聘面试。FoloUp能根据职位描述自动生成定制化的面试问题,基于AI技术与候选人进行自然、对话式的语音...
阅读原文

FoloUp

FoloUp 是开源的AI语音面试平台,能帮助企业高效地进行招聘面试。FoloUp能根据职位描述自动生成定制化的面试问题,基于AI技术与候选人进行自然、对话式的语音...
阅读原文

FoloUp

FoloUp 是开源的AI语音面试平台,能帮助企业高效地进行招聘面试。FoloUp能根据职位描述自动生成定制化的面试问题,基于AI技术与候选人进行自然、对话式的语音...
16970717273233