标签:上下文理解
AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!
这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...
什么是注意力机制(Attention Mechanism) – AI百科知识
注意力机制(Attention Mechanism)是深度学习中的一种技术,模仿人类视觉注意力的功能,使模型能识别并集中处理输入数据中最重要的部分。这种机制在图像识别...
QAnything – 网易有道推出的开源本地知识库问答引擎
QAnything是网易有道推出的基于子曰教育大模型自研的RAG(检索增强生成)引擎,为企业或个人提供了一个免费开源的本地知识库问答解决方案,支持各种文件格式...
ReplaceAnything – 阿里推出的AI替换图片中物体的开源框架
ReplaceAnything是由阿里巴巴智能计算研究院推出的一款开源AI图像内容替换框架,利用先进的人工智能技术,能够实现对照片或图像中物体的智能替换。用户可以通...
Perplexity – AI搜索引擎,使用聊天的方式进行搜索
Perplexity AI是一款聊天机器人式的搜索引擎,允许用户用自然语言提出问题,并使用生成式AI技术从各种来源收集获取信息并给出答案。该AI搜索引擎将人工智能与...
MetaGPT – 多个AI智能体协作分工的框架
MetaGPT是一个创新的元编程框架,结合了大语言模型和多智能体协作系统,旨在通过模拟人类工作流程来解决复杂问题。该框架的核心在于将标准化操作程序(SOPs)...
Grok-1 – 马斯克旗下xAI开源的大模型,参数量3140亿
Grok-1 是由马斯克旗下的人工智能初创公司 xAI 开发的一款大型语言模型,是一个混合专家(MoE)模型,拥有 3140 亿参数,使其成为目前参数量最大的开源大语言...
Champ – 基于3D的人物图片转视频动画模型
Champ是由阿里巴巴、复旦大学和南京大学的研究人员共同提出的一种基于3D的将人物图片转换为视频动画的模型,该方法结合了3D参数化模型(特别是SMPL模型)和潜...
GPT-4o – OpenAI最新发布的多模态AI大模型
GPT-4o是OpenAI最新推出的一款先进的人工智能模型,具备强大的多模态推理能力,能够处理语音、文本和视觉信息。该模型能够实时响应用户输入,并且在音频交互...
GLM-4-long – 智谱AI推出的200万字长文本模型(已开放API)
GLM-4-long 是智谱AI推出的200万字长文本模型,现已在 智谱AI开放平台 BigModel 上开放API调用。支持超长输入专为处理超长文本和记忆型任务设计,上下文长度...
Grok-2 – xAI公司推出的新一代AI模型
Grok-2是xAI公司推出的新一代AI模型,提供卓越的聊天、编程和推理能力。在学术基准测试中,Grok-2在GPQA、MMLU、MMLU-Pro和MATH等领域的表现超越了前代Grok-1...
NextChat – 一键搭建私人ChatGPT网页应用的开源项目
NextChat是一个基于 Next.js 和 Vercel 的开源项目,支持用户将 ChatGPT 等 AI 大模型集成到自己的网页应用中。NextChat不仅提供了现成的代码库,还支持一键...
OmniCorpus – 百亿级多模态数据集,支持中英双语
OmniCorpus是一个大规模多模态数据集,包含86亿张图像和16960亿个文本标记,支持中英双语。由上海人工智能实验室联合多所知名高校及研究机构共同构建。OmniCo...
STranslate – 多功能免费AI翻译工具,支持离线OCR识别
STranslate是专为Windows用户设计的多功能翻译和OCR工具。支持多种语言翻译,具备划词、截图、监听剪贴板等多种翻译方式,并提供多家翻译服务接口。还拥有基...
什么是自注意力(Self-Attention) – AI百科知识
自注意力(Self-Attention)是一种高级的注意力机制,支持模型在处理序列数据时,对序列内部的不同部分进行关联和加权,从而捕捉序列内部的长距离依赖关系。...
什么是嵌入表示(Embedding Representations) – AI百科知识
嵌入表示(Embedding Representations)是将实体(如单词、图像或用户)映射到连续的向量空间的过程,这些向量捕捉实体的内在属性和相互关系。在自然语言处理...
12