自监督触觉表示,用于基于视觉的触觉传感。
现代Python数据框库,专为人工智能设计。
一个完全由你掌控数据的「被动记录」项目。
开创性的质量与成本新标准的图谱增强型检索增强生成模型
基于大型语言模型的主动式代理,预测用户需求并主动提供帮助。
高质量合成数据生成与结构化数据提取工具
一个用于多模型嵌入的图形库,支持多种模型和数据类型的可视化
一个AI驱动的数据科学团队,帮助用户更快地完成常见数据科学任务。
开源项目,复现OpenAI的Sora模型
扩展LLaVA模型,集成Phi-3和LLaMA-3,提升视觉与语言模型的交互能力。
旨在帮助我们理解AI代理的工程化提示项目。
Pyramid-Flow的ComfyUI包装节点,用于高效视觉生成。
深度学习算法与大模型面试指南,持续更新的面试题目集合。
找到人工智能、机器学习、自然语言处理和数据科学等领域的最佳AI工作和职业机会。
商业领域基础模型与代理
新一代生成式AI模型
先进的通用机器人代理
AI模型部署和推理优化的专家
在浏览器中直接运行先进的机器学习模型。
文本到视频生成的创新框架
开源视频生成模型
视频生成模型Sora的存档库
快速因果视频生成器,实现即时视频生成。
大型多模态模型中视频理解的探索
一款用于离线语音转录的GUI工具
基于羊驼模型的大型语音生成模型
300行代码实现基于LLM的语音转录。
最新多模态检查点,提升语音理解能力。
会议语音转文本并自动生成摘要的AI工具
使用OpenAI实时API与文档进行语音聊天
高效、多语种的语音合成模型
快速、准确、免费的音频转文字服务