连接结构化图数据与非结构化文本数据
原标题:AI预测论文能不能中,8B超越70B大模型,港大发布图文融合多智能体GraphAgent
文章来源:量子位
内容字数:9934字
港大黄超教授团队提出GraphAgent:AI预测论文能否中
香港大学黄超教授团队研发了一种名为GraphAgent的多智能体自动化框架,能够预测学术论文的录取可能性,并具备更广泛的预测和生成能力。该框架通过融合大语言模型(LLM)和图语言模型的优势,在处理结构化图数据和非结构化文本数据方面取得了显著成果,并在零样本学习和跨域泛化等方面展现出优势。
1. GraphAgent的核心挑战与架构
现实世界的数据呈现出结构化和非结构化数据的混合特性,GraphAgent旨在解决以下三大挑战:异构数据融合、多层次关系理解和任务多元化。为了应对这些挑战,GraphAgent采用了一个由三大核心智能体组成的框架:
- 图生成智能体 (Graph Generator Agent):负责构建语义知识图谱 (SKG),通过两阶段迭代机制从非结构化文本中提取和整合深层语义信息。首先,它采用自适应分层策略识别知识实体;然后,它增强知识表示的丰富度和准确性,构建完整的知识联系。
- 任务规划智能体 (Task Planning Agent):作为框架的决策核心,它通过三阶段处理机制完成复杂任务的规划和分解。包括意图识别与任务制定、图结构标准化处理以及图文特征融合。
- 任务执行智能体 (Task Execution Agent):作为框架的核心执行单元,它通过三维处理架构实现任务的精准执行和性能优化。包括智能化任务处理机制、深度图指令对齐技术和渐进式学习策略。
这三大智能体协同运作,实现了图结构与语义信息的深度融合,支持预测型和生成型等多样化任务。
2. GraphAgent的实验结果与优势
研究团队在六个基准数据集上对GraphAgent进行了评估,涵盖了节点分类、文本生成、论文录用预测等任务。结果显示,GraphAgent在各种任务中均取得了优异的性能,仅用8B参数规模就达到了与GPT-4、Gemini等大型封闭源模型相当的性能水平。
GraphAgent的主要优势体现在以下几个方面:
- 卓越的零样本学习和跨域泛化能力:在低资源场景下表现出色,并在不同数据集上展现了强大的迁移学习能力。
- 高效的语义理解能力:能够精准把握复杂语义依赖关系,在各项评估指标上超越了Llama3-70b和Qwen2-72b等大规模模型。
- 强大的文本生成能力:在图增强文本生成任务中,其困惑度(PPL)等核心指标显著优于基线模型,并在与GPT-4的对比中展现出优势。
3. 未来研究方向
团队未来的研究方向包括:多模态能力拓展(将视觉信息整合到框架中)、模型性能优化(模型压缩和计算资源优化)以及应用场景扩展(科学研究辅助和商业智能分析等)。
总而言之,GraphAgent是一个具有创新性的多智能体框架,它在预测和生成任务中展现了强大的能力,为人工智能在学术研究和商业领域的应用提供了新的可能性。
联系作者
文章来源:量子位
作者微信:
作者简介:追踪人工智能新趋势,关注科技行业新突破
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...