标签:自然语言处理

AGUVIS

AGUVIS是香港大学、Salesforce 联合推出的统一的纯视觉框架,专为自主GUI智能体设计,能在各种平台(如网页、桌面、移动设备)上操作。AGUVIS基于图像观察和...
阅读原文

DRT-o1

DRT-o1是腾讯研究院推出的一系列AI模型,通过长链思考推理(CoT)技术显著提升了文学作品的翻译质量,尤其在处理比喻和隐喻等修辞手法时。模型能更深入地理解...
阅读原文

ChiChat

ChiChat是AI驱动的智能助手平台,提供个人知识库、语音处理和创意图像生成服务。ChiChat集成多个前沿模型,用户能用自然语言与智能系统互动。ChiChat支持o1和...
阅读原文

ASAL

ASAL(Automated Search for Artificial Life)是用基础模型自动化搜索人工生命(ALife)系统。ASAL是Sakana AI及MIT、OpenAI等机构联合推出的,主要基于三种...
阅读原文

Freed

Freed 是AI医疗文档助手,基于先进的语音识别和自然语言处理技术,自动捕捉和转写医生与患者的对话内容,快速生成符合医疗规范的临床文档。Freed能减轻医生的...
阅读原文

QVQ

QVQ是阿里基于Qwen2-VL-72B构建的开源多模态推理模型,结合视觉理解和复杂问题解决能力,提升人工智能的认知能力。QVQ在视觉推理任务中展现出增强的能力,尤...
阅读原文

Midscene.js

Midscene.js是基于AI技术的自动化SDK,通过用大型语言模型(LLM)简化UI自动化测试中的命令。用户用自然语言描述交互步骤或预期数据格式,Midscene.js将执行...
阅读原文

Wavy:智能图像处理应用,轻松实现图像增强与艺术风格转换

Wavy是AI驱动的照片编辑应用,基于先进的AI技术,将用户的照片转换成具有艺术感的杰作。Wavy主要功能包括AI艺术生成器、视觉放大、即时艺术创作、照片提升和...
阅读原文

ArkoAI:高效生成高质量建筑渲染图的AI工具兼容建模软件

ArkoAI是基于AI技术的渲染平台,能与Rhino3D、Revit和SketchUp等多种建模软件兼容。用户只需输入设计概念词汇,ArkoAI能快速生成高品质的效果图,极大地简化...
阅读原文

LeviTor:创新3D目标轨迹控制视频合成技术提升视觉效果与交互体验

LeviTor是南京大学、蚂蚁集团、浙江大学等机构推出的图像到视频合成技术,结合深度信息和K-means聚类点控制视频中3D物体的轨迹,无需显式的3D轨迹跟踪。LeviT...
阅读原文

Univer:智能办公助手全面提升Word和Excel文档处理效率

Univer是开源的全栈框架,支持创建和编辑电子表格、文档及幻灯片,为用户提供统一且强大的办公解决方案。Univer能在浏览器和Node.js环境中运行,易于集成到各...
阅读原文

WIME

WIME是上海微盟企业发展有限公司推出的AI电商内容创作平台,专为电商和新媒体领域设计。基于AI技术,帮助用户一键生成多风格图片和文案,实现从创意到成品的...
阅读原文

MetaMorph

MetaMorph是多模态大模型(MLLM),通过指令微调(Instruction Tuning)实现视觉理解和生成。它提出了一种名为Visual-Predictive Instruction Tuning(VPiT)...
阅读原文

AI Chinese:与中国老师实时互动,轻松掌握中文技巧与文化精髓

AI Chinese是嗨你好教育推出的AI双语教学中文学习平台,基于AI技术为外国人提供在线中文学习解决方案。平台模拟中国真人老师在线授课,在TikTok用短视频和直...
阅读原文

ERA-42:星动纪元全新端到端原生机器人大模型实现智能化交互与高效任务执行

ERA-42是北京星动纪元推出的端到端原生机器人大模型,与自研的五指灵巧手星动XHAND1结合,能完成100多种复杂灵巧操作任务。ERA-42无需预编程,具备快速学习新...
阅读原文
1252627282967