标签:知识图谱构建

Frames:突破创意界限的AI图像生成模型全面提升视觉艺术创作体验

Frames是Runway推出的最新AI图像生成模型,在风格控制和视觉保真度方面取得巨大进步。Frames能维持风格一致性,支持广泛的创意探索,为项目建立特定外观,并...
阅读原文

知周AI笔记:多功能本地AI笔记软件助你高效组织与管理信息

知周AI笔记是多功能本地AI笔记,轻量级的本地Markdown笔记软件,AI助理;AI续写; AI一键生成小红书/论文/大纲/竞品分析等文案。支持Markdown语法,提供实时...
阅读原文

BALROG:评估大型语言模型与视觉语言模型在复杂动态环境中推理能力的基准测试工具

BALROG是评估大型语言模型(LLMs)和视觉语言模型(VLMs)在游戏上的推理能力,特别是模型在动态环境中的规划、空间推理和探索能力。基于一系列挑战性的游戏...
阅读原文

Luzia

Luzia 是一款面向西语和葡语市场的 AI 聊天机器人,由西班牙初创公司 Amperity 开发。在 WhatsApp 和 Telegram 上推出后又推出了独立应用程序。Luzia 以其人...
阅读原文

QA-MDT

QA-MDT(Quality-aware Masked Diffusion Transformer)是由中国科学技术大学和科大讯飞联合推出的开源音乐生成模型。模型基于文本描述生成高质量且音乐性强...
阅读原文

OLMo

OLMo(Open Language Model)是由Allen AI(AI2,艾伦AI研究所)开发的一个完全开源开放的大型语言模型(LLM)框架,设计初衷是为了通过开放研究,促进学术界...
阅读原文

AskHackers

AskHackers是一个面向开发者的AI搜索工具,专注于技术领域的问答。通过分析Hacker News的评论区,基于AI技术自动生成问题的答案,为用户提供了一种新的获取编...
阅读原文

LongVILA

LongVILA是一个面向长视频理解的视觉语言AI模型,由英伟达、MIT、UC 伯克利、得克萨斯大学奥斯汀分校共同开发。通过算法和系统的共同设计,实现了在大量GPU上...
阅读原文

XVERSE-MoE-A36B

XVERSE-MoE-A36B是由元象推出的中国最大的MoE(Mixture of Experts,混合专家模型)开源大模型。模型具有2550亿的总参数和360亿的激活参数,性能上与超过100B...
阅读原文

LVCD

LVCD(Large Video Color Diffusion)是一个专为动画视频线稿上色设计的视频扩散框架,能将黑白线稿自动转化为彩色动画视频。LVCD使用了一种先进的扩散模型,...
阅读原文

MemFree

MemFree是一款开源的混合AI搜索引擎,通过整合多种AI模型和搜索引擎,提供高效、多样化的搜索体验。可以用文本、图像、文件和网页等多种方式进行搜索和提问,...
阅读原文

Open NotebookLM

Open NotebookLM 是一个开源的AI工具,基于最新的开源AI模型,如Llama 3.1 405B、MeloTTS和Bark,将PDF文档转换成播客形式的音频内容。工具适合将书面信息转...
阅读原文

IterComp

IterComp是一个由清华大学、北京大学、LibAI Lab、中国科学技术大学、牛津大学和普林斯顿大学的研究人员联合推出的文本到图像生成框架。基于迭代反馈学习机制...
阅读原文

mPLUG-DocOwl 1.5

mPLUG-DocOwl 1.5是由阿里巴巴集团推出的多模态大型语言模型,专注于OCR-free(无需光学字符识别)的文档理解。模型基于统一结构学习,强化对文本丰富图像如...
阅读原文

Wiseone

Wiseone是AI浏览器扩展程序,能提高用户的网络搜索和阅读效率。基于AI技术提供一站式解决方案,帮助用户在信息爆炸的时代更好地获取处理和吸收知识。Wiseone...
阅读原文
123