
AI与数据分析的深度融合,一直是业界探索的焦点。Tomoro,一款集大数据分析引擎、表格化UI与AI于一体的创新型数据工具,旨在打破数据分析的门槛,让普通用户也能轻松驾驭海量数据。其核心亮点在于熟悉的表格操作、无边界的数据引入能力,以及由AI驱动的数据分析工作台。而Lumos,作为Tomoro内部强大的数据智能体,以多智能体架构为基础,致力于解决复杂场景下的专业分析难题,并不断优化用户体验。本文将深入剖析Lumos实现其强大能力的技术思路与实践经验,为对Data Agent应用前景充满好奇的读者提供深刻洞见。
Tomoro:大数据分析的革新之路
产品定位:AI赋能的全领域数据分析助手
Tomoro的愿景是成为一线数据分析师的得力伙伴,让他们能够轻松应对全领域的数据分析任务。通过融合大数据分析能力、直观的表格交互以及智能AI技术,Tomoro旨在实现数据的真正平权,大幅提升数据分析的效率,弥合技术鸿沟。其核心在于“大数据 + 表格 + AI”的协同作用,构建一个能够覆盖从数据引入到报告交付的全流程解决方案。
产品思考:化繁为简,回归用户习惯
在多年的数据分析工具实践中,我们发现实现“零门槛大数据自助分析”的关键在于结合用户熟悉且久经验证的交互形态。Excel表格分析的强大生命力证明了这一点。Tomoro正是基于这一洞察,将AI能力注入到熟悉的表格操作中,打造一个既能满足复杂分析需求,又易于上手的AI驱动数据分析工作台。
产品能力:全流程化繁为简
Tomoro致力于提供简单、直观的数据分析体验。它支持无边界的数据引入,无论是传统数据仓库、分析平台数据,还是多模态数据(如带数据的截图、PDF报告),都能轻松整合。用户可以像操作Excel一样,进行直观的表格分析,包括枚举值筛选、分组聚合、AI函数生成列操作以及多表关联等。同时,它还支持交叉透视表、高阶数据可视化(比肩Tableau)以及分析报告和仪表盘的自动生成与更新,并内嵌AI能力以提升使用体验和效率。
技术思路:环境、Agent与情景的协同
Tomoro的技术架构围绕三个核心要素构建:
- Tomoro环境: 被设计为一个高效、易用的工作台,既支持用户交互,也支持Data Agent的调用。它包含可交互的GUI、OpenAPI、强大的分析引擎和工具集、丰富的元数据和数据资产,以及完善的安全管控。
- Lumos数据智能体: 作为Tomoro的“数据伙伴”,Lumos具备思考、规划、使用工具(包括SQL、Python编码和外部API)以及与用户对齐的能力。它能够理解复杂分析需求、业务背景和环境信息,并能以问答、报告或洞察等形式交付有效成果。
- 用户分析情景: 涵盖从思路分解、数据预处理、探索洞察、高级分析到结果呈现的全流程。尽管Lumos致力于自动化分析,但考虑到当前模型能力的局限性,用户通过环境操作来验证Agent结果的能力至关重要,这有助于建立AI信任并为AI提供学习机会。
实用性驱动的技术方案设计
Tomoro的技术落地遵循实用性驱动的原则:
- AI场景分析与设计: 优先识别AI在数据分析流程中能够显著提升效率和用户体验的场景,如分析引导、页面操作提效、数据准备辅助等。
- Lumos Agent设计: 基于AI场景需求,设计Lumos的核心原子能力(如表格理解、问题推荐、数据洞察等)以及对公共能力(如环境信息、工具服务)的需求。
- 分析环境设计: 在充分考虑AI辅助需求的前提下,对分析环境进行定制和优化,确保其对AI友好且易于集成。
Lumos落地实践:多智能体架构的深度解析
Lumos的角色定位:人机协同的数据伙伴
在Tomoro的生态中,Lumos扮演着至关重要的角色,旨在通过人机协同的方式,帮助一线非技术用户克服数据分析中的技术和经验障碍。例如,一位电商运营同学,即使不熟悉SQL,也能在Lumos的协助下,对海量(3.5亿行)动销商品数据进行深入分析,定位问题并制定运营策略。
多智能体架构的优势
Lumos之所以采用多智能体架构,是因为复杂的数据分析任务往往涉及多个子任务,需要专业化处理。这种设计能够更好地适应复杂场景,解决专业领域问题,并避免单一Agent负担过重,从而保证了系统的灵活性和专业性。
解决多智能体一致性问题
为了解决多智能体协作中的一致性问题,Lumos引入了共享工作记忆机制。这意味着各个Agent能够观察到彼此的目标、计划、结果和状态,确保信息对齐。同时,任务按顺序执行,确保下游任务能够有效利用上游结果。虽然顺序执行会损失一定的并行效率,但通过优化关键查询和计算工具的效率,可以弥补用户体验上的损失。
极致查询与计算工具响应
为了实现亿级数据查询的“本地化”速度,Tomoro与Mixquery引擎协作,构建了分级计算框架。该框架通过存储、计算和多级缓存的设计,加速不同数据源和规模数据的计算。主要手段包括场景预计算、内存数据库、托管式高性能引擎以及Python计算加速。这不仅提升了Agent的执行速度,也使得用户能够更便捷地验证Agent结果,从而增强AI信任度。
AI Coding与工具调用的权衡
在AI Coding和工具调用之间,Tomoro优先选择工具调用,并在工具存在局限性时,再启用AI Coding。以绘图为例,最初仅依赖AI Coding效果不佳,切换到MCP工具后体验大幅提升。最终方案是结合使用,并建立反馈机制,持续监控AI Coding生成的图表类型,驱动工具迭代,以实现大部分高频图表被有效覆盖。
共建专家Agent,满足复杂业务需求
对于指标异动归因、实验效果分析等高度专业化的复杂场景,Tomoro通过与业务方共建专家Agent来实现。通过将业务特定工作流和知识融入Agent,避免了Master Agent的知识负担。系统的高度开放性支持业务自定义高级工具和Workflow共建,从而满足多样化的业务分析需求。
提升用户提问有效性
为了提高用户提问的有效性,Tomoro引入了问题推荐和澄清能力。基于表的推荐能够帮助用户快速提问并激发分析创意。多轮问题推荐结合上下文信息,引导用户进行更深层次的分析。而澄清能力则能避免用户宽泛的问题导致无效回答,确保Lumos生成更精准、有价值的反馈。
Agent分析能力的有效测评
有效的测评是Lumos持续迭代的关键。Tomoro构建了产品能力测评和Agent能力测评双体系。通过对数据分析的“分析认知”进行分解,并持续完善和扩充Benchmark数据集合,以确保对数据领域问题的全面覆盖,并持续引导Agent能力的提升。
工程结构优化,保障Data Agent稳定性
在工程层面,Tomoro通过合理的应用层划分、公共层引入和模型层设计原则,为Data Agent提供了足够的防御和支持,确保了Agent层面的灵活、可靠和有序迭代。
下一步计划与合作展望
Tomoro Lumos数据智能体未来将重点优化业务知识、工具引入和业务场景应用验证,并深化与更多业务的协作,持续提升智能体效果。欢迎访问官网,体验大数据分析的新方式,共同探索AI分析的无限可能。