标签:实时分析

WPS接入DeepSeek,秒变办公神器!

WPS 大家经常用来日常写作,虽然本身提供了AI功能,但可惜需要会员,本文教你三分钟接入最火的DeepSeek,让WPS秒变办公神器。 DeepSeek API申请地址:http:/...
阅读原文

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

MoshiVis

MoshiVis 是 Kyutai 推出的开源多模态语音模型,基于 Moshi 实时对话语音模型开发,增加了视觉输入功能。能实现图像的自然、实时语音交互,将语音和视觉信息...

ReCamMaster

ReCamMaster 是浙江大学、快手科技等联合推出的视频重渲染框架,能根据新的相机轨迹重新生成视频内容。通过预训练模型和帧维度条件机制,结合多相机同步数据...
阅读原文

DualPipe

DualPipe 是DeepSeek开源的创新的双向流水线并行技术,主要用于提升大规模深度学习模型的训练效率。核心思想是将模型的训练过程分为两个独立的管道——前向计算...
阅读原文

NVIDIA-Ingest

NVIDIA-Ingest是英伟达开源的用于解析复杂、混乱的非结构化PDF和其他企业文档的微服务集合。NVIDIA-Ingest能将文档转换为元数据和文本,便于嵌入到检索系统中...
阅读原文

MultiBooth

MultiBooth是清华大学深圳国际研究生院、 Meta、香港科技大学等机构推出的多概念图像生成方法,能从文本中生成包含多个用户指定概念的图像。MultiBooth将生成...
阅读原文

FastExcel

FastExcel是基于Java的开源库,提供快速、简洁且能解决大文件内存溢出问题的Excel处理工具。FastExcel兼容EasyExcel,提供性能优化、bug修复,新增如读取指定...
阅读原文

Momen:全面无代码开发平台助力AI应用快速构建与全栈支持

Momen是无代码全栈Web应用构建平台,支持用户无需编程知识即可设计、构建和部署定制化的Web应用。平台提供直观的可视化界面,覆盖从前端设计到后端逻辑的完整...
阅读原文

JanusFlow:多模态理解与生成任务的统一框架DeepSeek的开源实现

JanusFlow是DeepSeek推出的 Janus 系列,用在多模态理解和生成任务的模型,整合自回归语言模型与校正流技术,在单一模型中实现图像理解和生成。框架基于解耦...
阅读原文

BrushNet

BrushNet是由腾讯PCG部门的ARC实验室与香港大学的研究人员推出的一个基于扩散模型的即插即用的图像照片修复(Inpainting)模型,通过分解的双分支架构来有效...
阅读原文

Composio

Composio 是一个AI智能体开发辅助工具,提供100+集成工具,简化了 AI Agent的开发和部署,支持开发者通过一行代码调用多种工具和框架,如 OpenAI 和 Claude、...
阅读原文

Object Cutter

Object Cutter 是基于AI的智能图像处理工具,通过文字指令或框选操作自动识别抠出图像中的特定对象。工具基于深度学习技术,实现高精度的图像分割,即使是细...
阅读原文

GraphMaker

GraphMaker 是一款基于AI技术的图表制作工具,能理解自然语言指令,帮助用户快速将数据以图表形式可视化。用户只需上传电子表格数据,用自然语言描述图表类型...
阅读原文

FocuSee

FocuSee是一款智能化屏幕录制软件,通过自动缩放、光标跟踪和动态变焦效果,将普通的屏幕录制转换成引人注目的专业视频。用户无需进行复杂的后期编辑,可生成...
阅读原文

Pyramid-Flow

Pyramid-Flow是一种先进的视频生成模型,由北京大学、快手科技和北京邮电大学的研究人员联合推出。模型根据文本提示生成长达10秒、分辨率高达1280x768、帧率2...
阅读原文

Reworkd

Reworkd是一家专注于自动化网络数据提取的人工智能公司。提供一个创新平台,运用先进的AI技术自动生成和修复抓取代码,以应对网站结构变化带来的挑战。无需编...
阅读原文
12