标签:多语言支持
PaliGemma 2:DeepMind推出性视觉语言模型,实现跨媒体理解与生成
PaliGemma 2是Google DeepMind基于Gemma 2语言模型家族推出的新一代视觉语言模型(VLM),作为PaliGemma模型的升级版。结合SigLIP-So400m视觉编码器和不同规...
ClearerVoice-Studio:智能语音处理框架助力多场景应用的高效解决方案
ClearerVoice-Studio 是阿里巴巴达摩院通义实验室开源的语音处理框架,集成语音增强、分离和音视频说话人提取等功能。框架基于复数域深度学习算法,有效消除...
InsCode AI IDE:CSDN与华为云携手推出智能编程助手,助力开发者高效编码与问题解决
InsCode AI IDE是CSDN、GitCode和华为云CodeArts IDE联合推出的AI增强型跨平台集成开发环境。InsCode AI IDE集成AI编程能力,帮助开发者更高效地编写、调试和...
Micro LLAMA:探索LLAMA 3模型的核心原理与应用特点
Micro LLAMA是精简的教学版LLAMA 3模型实现,能帮助学习者理解大型语言模型架构。整个项目仅约180行代码,便于理解和学习。Micro LLAMA用的是LLAMA 3中最小的...
GenCast:DeepMind推出的性AI气象预测模型提气预报精准度与效率
GenCast是DeepMind推出的革命性AI气象预测模型,基于扩散模型技术,提供长达15天的全球天气预报。GenCast在97.2%的预测任务中超越全球顶尖的中期天气预报系统...
Muse:智能音乐创作工具助你轻松生成个性化 MIDI 文件
Muse是为Ableton设计的AI音乐创作工具,能够根据文本提示生成MIDI文件,支持用户自定义音乐元素如调性、音阶、旋律、和弦等。Muse简化音乐创作流程,适合新手...
Project IDE:智能无代码应用编辑器助力快速构建个性化应用
Project IDE是扣子平台推出的零代码AI应用开发功能,支持用户基于可视化界面编排业务逻辑和设计用户界面,无需编写代码构建完整的AI应用。Project IDE集成UI ...
potis.ai:智能面试助手提升面试效率与精准度的创新解决方案
potis.ai 是基于AI技术的招聘平台,专为远程团队吸引和筛选顶尖人才而设计。基于自动化行为面试、智能面试协助和人才评分系统来提高招聘效率,节省时间和成本...
I2V-01-Live:海螺AI创新图生视频模型助力创意内容生成与视觉表现提升
I2V-01-Live是海螺AI推出的图生视频模型,能将静态二维图像转化为动态视频。模型基于深度学习技术,增强动作的流畅度和生动性,让人物或对象的动作更加自然和...
Dia:智能网络助手提升效率与自动化处理网络任务
Dia是The Browser Company推出的新型AI网络浏览器,Dia的核心特色是深度集成AI技术,简化用户的日常网络活动。Dia浏览器将AI融入浏览器环境,提供智能写作辅...
Amazon Nova:亚马逊全新多模态生成大模型引领文本、图像与视频创作新时代
Amazon Nova 是亚马逊云服务(AWS)推出的新一代AI基础模型系列,提供行业领先的性能和成本效益。该系列包括专门处理文本的Amazon Nova Micro、多模态的Amazo...
Codel:多功能AI代理工具助力终端、浏览器及编辑器高效执行复杂任务
Codel是全自主AI代理工具,能在沙盒化的Docker环境中执行复杂任务和项目。Codel具备自主操作能力,内置浏览器和文本编辑器,所有操作记录存储于PostgreSQL数...
360Zhinao2-7B:360智脑大模型升级版全面提升智能交互与数据处理能力
360Zhinao2-7B是360自研的AI大模型360智脑7B参数升级版,涵盖基础模型及多种上下文长度的聊天模型。360Zhinao2-7B模型是继360Zhinao1-7B之后的重要更新,基于...
Co-op Translator:开源多语言翻译工具助力开发者轻松实现跨语言沟通
Co-op Translator是微软推出的开源翻译工具,基于Azure AI服务实现项目文档和图像中文本的自动化多语言翻译。仅需一条命令,Co-op Translator能分析项目内容...
Aisou.ai:精准实时商业数据分析平台助力决策优化与市场洞察
Aisou.ai 是专注于商业信息的智能搜索问答平台,基于大语言模型(LLM)和检索增强生成(RAG)技术,结合商业信息数据库,为用户提供精准、实时的商业数据查询...