腾讯的这款AI数据智能体工具Lumos，颠覆了传统的数据分析

AI与数据分析的深度融合，一直是业界探索的焦点。Tomoro，一款集大数据分析引擎、表格化UI与AI于一体的创新型数据工具，旨在打破数据分析的门槛，让普通用户也能轻松驾驭海量数据。其核心亮点在于熟悉的表格操作、无边界的数据引入能力，以及由AI驱动的数据分析工作台。而Lumos，作为Tomoro内部强大的数据智能体，以多智能体架构为基础，致力于解决复杂场景下的专业分析难题，并不断优化用户体验。本文将深入剖析Lumos实现其强大能力的技术思路与实践经验，为对Data Agent应用前景充满好奇的读者提供深刻洞见。

Tomoro：大数据分析的革新之路

产品定位：AI赋能的全领域数据分析助手

Tomoro的愿景是成为一线数据分析师的得力伙伴，让他们能够轻松应对全领域的数据分析任务。通过融合大数据分析能力、直观的表格交互以及智能AI技术，Tomoro旨在实现数据的真正平权，大幅提升数据分析的效率，弥合技术鸿沟。其核心在于“大数据 + 表格 + AI”的协同作用，构建一个能够覆盖从数据引入到报告交付的全流程解决方案。

产品思考：化繁为简，回归用户习惯

在多年的数据分析工具实践中，我们发现实现“零门槛大数据自助分析”的关键在于结合用户熟悉且久经验证的交互形态。Excel表格分析的强大生命力证明了这一点。Tomoro正是基于这一洞察，将AI能力注入到熟悉的表格操作中，打造一个既能满足复杂分析需求，又易于上手的AI驱动数据分析工作台。

产品能力：全流程化繁为简

Tomoro致力于提供简单、直观的数据分析体验。它支持无边界的数据引入，无论是传统数据仓库、分析平台数据，还是多模态数据（如带数据的截图、PDF报告），都能轻松整合。用户可以像操作Excel一样，进行直观的表格分析，包括枚举值筛选、分组聚合、AI函数生成列操作以及多表关联等。同时，它还支持交叉透视表、高阶数据可视化（比肩Tableau）以及分析报告和仪表盘的自动生成与更新，并内嵌AI能力以提升使用体验和效率。

技术思路：环境、Agent与情景的协同

Tomoro的技术架构围绕三个核心要素构建：

Tomoro环境： 被设计为一个高效、易用的工作台，既支持用户交互，也支持Data Agent的调用。它包含可交互的GUI、OpenAPI、强大的分析引擎和工具集、丰富的元数据和数据资产，以及完善的安全管控。
Lumos数据智能体： 作为Tomoro的“数据伙伴”，Lumos具备思考、规划、使用工具（包括SQL、Python编码和外部API）以及与用户对齐的能力。它能够理解复杂分析需求、业务背景和环境信息，并能以问答、报告或洞察等形式交付有效成果。
用户分析情景： 涵盖从思路分解、数据预处理、探索洞察、高级分析到结果呈现的全流程。尽管Lumos致力于自动化分析，但考虑到当前模型能力的局限性，用户通过环境操作来验证Agent结果的能力至关重要，这有助于建立AI信任并为AI提供学习机会。

实用性驱动的技术方案设计

Tomoro的技术落地遵循实用性驱动的原则：

AI场景分析与设计： 优先识别AI在数据分析流程中能够显著提升效率和用户体验的场景，如分析引导、页面操作提效、数据准备辅助等。
Lumos Agent设计： 基于AI场景需求，设计Lumos的核心原子能力（如表格理解、问题推荐、数据洞察等）以及对公共能力（如环境信息、工具服务）的需求。
分析环境设计： 在充分考虑AI辅助需求的前提下，对分析环境进行定制和优化，确保其对AI友好且易于集成。

Lumos落地实践：多智能体架构的深度解析

Lumos的角色定位：人机协同的数据伙伴

在Tomoro的生态中，Lumos扮演着至关重要的角色，旨在通过人机协同的方式，帮助一线非技术用户克服数据分析中的技术和经验障碍。例如，一位电商运营同学，即使不熟悉SQL，也能在Lumos的协助下，对海量（3.5亿行）动销商品数据进行深入分析，定位问题并制定运营策略。

多智能体架构的优势

Lumos之所以采用多智能体架构，是因为复杂的数据分析任务往往涉及多个子任务，需要专业化处理。这种设计能够更好地适应复杂场景，解决专业领域问题，并避免单一Agent负担过重，从而保证了系统的灵活性和专业性。

解决多智能体一致性问题

为了解决多智能体协作中的一致性问题，Lumos引入了共享工作记忆机制。这意味着各个Agent能够观察到彼此的目标、计划、结果和状态，确保信息对齐。同时，任务按顺序执行，确保下游任务能够有效利用上游结果。虽然顺序执行会损失一定的并行效率，但通过优化关键查询和计算工具的效率，可以弥补用户体验上的损失。

极致查询与计算工具响应

为了实现亿级数据查询的“本地化”速度，Tomoro与Mixquery引擎协作，构建了分级计算框架。该框架通过存储、计算和多级缓存的设计，加速不同数据源和规模数据的计算。主要手段包括场景预计算、内存数据库、托管式高性能引擎以及Python计算加速。这不仅提升了Agent的执行速度，也使得用户能够更便捷地验证Agent结果，从而增强AI信任度。

AI Coding与工具调用的权衡

在AI Coding和工具调用之间，Tomoro优先选择工具调用，并在工具存在局限性时，再启用AI Coding。以绘图为例，最初仅依赖AI Coding效果不佳，切换到MCP工具后体验大幅提升。最终方案是结合使用，并建立反馈机制，持续监控AI Coding生成的图表类型，驱动工具迭代，以实现大部分高频图表被有效覆盖。