Data Analysis技能使用说明

2026-03-25 新闻来源：网淘吧围观:217

电脑广告

手机广告

何时使用

当用户需要分析、解释或可视化来自SQL、电子表格、笔记本、仪表板、导出数据或临时表格的数据时，使用此技能。

适用于KPI调试、实验结果解读、漏斗或队列分析、异常情况审查、高管报告，以及对指标或查询逻辑的质量检查。

当困难部分在于分析判断时（例如：指标定义、比较设计、解读或建议），优先使用此技能而非通用的编码或电子表格帮助。

用户询问：数据分析、寻找模式、理解指标、假设检验、队列分析、A/B测试、流失分析或统计显著性。

核心原则

没有决策的分析只是算术。始终要明确：如果分析结果显示X与Y，会改变什么？

方法先行

在接触数据之前：

这个分析支持什么决策？什么会让你改变主意？
（真正的问题）你实际拥有什么数据
与你希望拥有的数据相比如何？什么时间段
是相关的？统计严谨性检查清单

样本量是否充足？（N值小 = 置信区间宽）

比较组是否公平？（相同时间段，类似条件）
是否存在多重比较？（20次测试 = 1次可能偶然“显著”）
效应量是否有意义？（统计显著 ≠ 实际重要）
不确定性是否量化？（“提升12-18%”而不仅仅是“提升15%”）
架构

此技能不需要本地文件夹、持久性内存或设置状态。

使用包含的参考文件作为轻量级指南：

metric-contracts.md

用于KPI定义和注意事项chart-selection.md
用于可视化选择和图表反模式decision-briefs.md
用于面向利益相关者的输出pitfalls.md
和techniques.md用于分析严谨性和方法选择快速参考

仅加载最小的相关文件，以保持上下文集中。

Load only the smallest relevant file to keep context focused.

主题	文件
指标定义合约	`metric-contracts.md`
视觉选择与图表反模式	`chart-selection.md`
决策就绪的输出格式	`decision-briefs.md`
需要及早发现的失败模式	`pitfalls.md`
按问题类型选择方法	`techniques.md`

核心规则

1. 从决策出发，而非数据集

在进行分析前，先确定决策者、可能改变决策的问题以及截止日期。
如果任何决策都不会改变，请在计算任何内容之前重新调整请求的框架。

2. 在计算前锁定指标合约

定义实体、粒度、分子、分母、时间窗口、时区、过滤器、排除项和事实来源。
如果其中任何一项存在歧义，请在呈现结果前明确说明。

3. 分离提取、转换和解释

保持查询逻辑、数据清理假设和分析结论可区分。
切勿将业务假设隐藏在 SQL、公式或笔记本代码中，而不在书面报告中明确说明。

4. 选择图表以回答问题

根据分析问题选择图表：趋势、比较、分布、关系、构成、漏斗或队列留存。
不要添加那些只会让演示文稿看起来更充实但不会影响决策的图表。

5. 以决策格式简报每个结果

每个输出都应包括答案、证据、置信度、注意事项和建议的后续行动。
如果输出是给利益相关者的，请将技术方法转化为业务影响，而不是以技术细节为主导。

6. 在建议行动前对论断进行压力测试

按明显的混杂因素进行细分，比较正确的基线，量化不确定性，并检查对排除项或时间窗口的敏感性。
未经稳健性检验的、看似有力的数字，并不具备决策就绪性。

7. 当数据无法支持论断时进行上报

当样本量不足、来源不可靠、定义发生漂移或混杂因素未解决时，阻止或降低结论的确定性。
说"目前未知"比产生错误的信心要好。

常见陷阱

在更改分子、分母或排除项后仍沿用同一个KPI名称 -> 趋势比较变得无效。
在同一图表中比较日、周和月粒度 -> 波动看似真实，但主要是聚合噪声。
展示百分比而不提供基础计数 -> 管理层对极小的分母反应过度。
使用漂亮的图表而非正确的图表 -> 输出看起来精美，但掩盖了实际的决策信号。
看到结果后才去寻找有趣的切分方式 -> 叙事会跟随偶然性而非证据。
发布没有指标负责人或注意事项的自动化报告 -> 错误数据传播的速度快于纠正的速度。
将观察到的模式视为因果证据 -> 行动计划仅建立在相关性之上。

方法选择

问题类型	方法	关键输出
"X 与 Y 有差异吗？"	假设检验	p值 + 效应量 + 置信区间
"什么能预测 Z？"	回归/相关性分析	系数 + R² + 残差检验
"用户行为如何随时间变化？"	队列分析	各队列的留存曲线
"这些群体有差异吗？"	细分分析	群体画像 + 统计比较
"有什么异常？"	异常检测	标记点 + 上下文

关于技术细节及何时使用每种方法，请参阅techniques.md。

输出标准

以洞察为先导，而非方法论
量化不确定性- 提供范围，而非点估计
说明局限性- 此分析无法告知的内容
建议后续步骤- 如何能加强结论

需上报的危险信号

用户试图"证明"一个预先确定的结论
样本量太小，无法进行可靠推断
数据质量问题导致分析无效
无法控制的混杂因素

外部端点

此技能不进行外部网络请求。

端点	发送的数据	目的
无	无	不适用

无数据被发送到外部。

安全与隐私

离开您设备的数据：

默认情况下无。

保留在本地设备的数据：

默认情况下无。

此技能**不**会：

访问未声明的外部端点。
在隐藏的本地内存文件中存储凭据或原始导出数据。
创建或依赖本地文件夹系统进行持久化存储。
未经用户明确确认，创建自动化任务或后台作业。
重写其自身的指令源文件。

反馈

如果觉得有用：clawhub star data-analysis
保持更新：clawhub sync

天猫隐藏优惠券

网淘吧

免责申明

部分文章来自各大搜索引擎，如有侵权，请与我联系删除。

打赏

文章底部电脑广告

手机广告位-内容正文底部

标签

上一篇：Pipedrive技能使用说明下一篇：Memory Hygiene技能使用说明