标签:智能语音识别

WPS接入DeepSeek,秒变办公神器!

WPS 大家经常用来日常写作,虽然本身提供了AI功能,但可惜需要会员,本文教你三分钟接入最火的DeepSeek,让WPS秒变办公神器。 DeepSeek API申请地址:http:/...
阅读原文

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

2025全球AI应用行业季度报告(PDF文件)

全球AI应用行业季度报告深入剖析全球AI应用行业现状与发展趋势。从多个维度展开,首先呈现了中国和海外AI应用在2025年3月的月活跃用户规模及季度增长率,揭示...
阅读原文

LTXV-13B

LTXV-13B 是Lightricks推出的开源 AI 视频生成模型,拥有 130 亿参数。具备极高的生成速度,比同类产品快 30 倍,能在普通消费级显卡(如 4090/5090)上运行...
阅读原文

讯飞星辰MaaS

讯飞星辰MaaS是科大讯飞推出的AI大模型定制微调平台,创建你的专属定制大模型。讯飞星辰MaaS汇集20多个行业内知名的优质模型,如星火大模型、Llama3、DeepSee...
阅读原文

LiveCC

LiveCC 是新加坡国立大学Show Lab 团队联合字节跳动推出的实时视频解说模型,基于自动语音识别(ASR)字幕进行大规模训练。LiveCC像专业解说员一样快速分析视...
阅读原文

Skywork-R1V 2.0

Skywork-R1V 2.0 是昆仑万维最新开源的多模态推理模型,专为复杂推理任务设计,具备强大的视觉与文本推理能力。模型基于混合强化学习和多模态奖励模型(Skywo...
阅读原文

Eagle 2.5

Eagle 2.5是英伟达推出的视觉语言模型,专注于长上下文多模态学习的 AI 模型,参数规模仅为 8B。参数量较小,但在处理高分辨率图像和长视频序列方面表现出色...
阅读原文

灵格AI英语

灵格AI英语是AI英语学习应用。灵格AI英语结合用户喜爱的视频内容,基于智能AI导师提供全方位语言学习服务,包括基础知识教学、语言点解析、跟读纠音、互动对...
阅读原文

Pad.ws

Pad.ws 是创新的在线开发环境,结合了白板功能与完整的 IDE 工具。基于浏览器运行,无需安装额外软件,用户可以随时随地通过任何设备访问。将交互式白板与代...
阅读原文

天翼AI开放平台

天翼AI开放平台是中国电信正式上线的AI技术服务平台。平台以中国电信自研的星辰大模型为技术底座,提供从AI技术能力展示到产品体验、接入使用的全流程服务。
阅读原文

Trae 插件

Trae 插件是 Trae 旗下新一代 AI 编程助手(原 MarsCode 编程助手),以插件形态集成在本地 IDE 之中,兼容性强、使用灵活。提升开发效率和代码质量。支持100...
阅读原文

Skywork-OR1

Skywork-OR1(Open Reasoner 1)是昆仑万维推出的开源高性能推理模型系列,模型突破大模型在逻辑推理和复杂任务求解方面的能力瓶颈。Skywork-OR1包含三款模型,...
阅读原文

BabelDOC

BabelDOC 是开源的智能 PDF 翻译工具,专为科学论文翻译设计。能在原文旁生成翻译文本,形成双语对照,无需切换窗口,方便阅读。能完整保留数学公式、表格和...

Dolphin

Dolphin是清华大学电子工程系语音与音频技术实验室联合海天瑞声共同推出的面向东方语言的语音大模型。支持40个东方语种的语音识别,中文语种涵盖22种方言(含...
阅读原文

AI速搭

AI速搭是百度智能云推出的低代码开发平台,帮助企业快速搭建和部署智能应用。基于AI技术的能力,用户可以通过可视化界面进行操作,无需编写大量代码,可快速...
阅读原文

OLMo 2 32B

OLMo 2 32B 是 Allen Institute for AI(Ai2)推出的最新开源语言模型,是 OLMo 2 系列的重要成果。拥有 320 亿参数,是首个在多技能学术基准测试中超越 GPT-...
阅读原文
1235