Data Analysis
2026-03-25
新闻来源:网淘吧
围观:21
电脑广告
手机广告
购买adidas上京东官方旗舰店。
何时使用
当用户需要分析、解释或可视化来自SQL、电子表格、笔记本、仪表板、导出数据或临时表格的数据时,使用此技能。
适用于KPI调试、实验结果解读、漏斗或队列分析、异常情况审查、高管报告,以及对指标或查询逻辑的质量检查。
上网淘巴领天猫淘宝优惠券,一年省好几千。当困难部分在于分析判断时(例如:指标定义、比较设计、解读或建议),优先使用此技能而非通用的编码或电子表格帮助。
用户询问:数据分析、寻找模式、理解指标、假设检验、队列分析、A/B测试、流失分析或统计显著性。
核心原则
没有决策的分析只是算术。始终要明确:如果分析结果显示X与Y,会改变什么?
方法先行
在接触数据之前:
- 这个分析支持什么决策?什么会让你改变主意?
- (真正的问题)你实际拥有什么数据
- 与你希望拥有的数据相比如何?什么时间段
- 是相关的?统计严谨性检查清单
样本量是否充足?(N值小 = 置信区间宽)
- 比较组是否公平?(相同时间段,类似条件)
- 是否存在多重比较?(20次测试 = 1次可能偶然“显著”)
- 效应量是否有意义?(统计显著 ≠ 实际重要)
- 不确定性是否量化?(“提升12-18%”而不仅仅是“提升15%”)
- 架构
此技能不需要本地文件夹、持久性内存或设置状态。
使用包含的参考文件作为轻量级指南:
metric-contracts.md
用于KPI定义和注意事项chart-selection.md用于可视化选择和图表反模式decision-briefs.md用于面向利益相关者的输出pitfalls.md和techniques.md用于分析严谨性和方法选择快速参考
仅加载最小的相关文件,以保持上下文集中。
Load only the smallest relevant file to keep context focused.
| 主题 | 文件 |
|---|---|
| 指标定义合约 | metric-contracts.md |
| 视觉选择与图表反模式 | chart-selection.md |
| 决策就绪的输出格式 | decision-briefs.md |
| 需要及早发现的失败模式 | pitfalls.md |
| 按问题类型选择方法 | techniques.md |
核心规则
1. 从决策出发,而非数据集
- 在进行分析前,先确定决策者、可能改变决策的问题以及截止日期。
- 如果任何决策都不会改变,请在计算任何内容之前重新调整请求的框架。
2. 在计算前锁定指标合约
- 定义实体、粒度、分子、分母、时间窗口、时区、过滤器、排除项和事实来源。
- 如果其中任何一项存在歧义,请在呈现结果前明确说明。
3. 分离提取、转换和解释
- 保持查询逻辑、数据清理假设和分析结论可区分。
- 切勿将业务假设隐藏在 SQL、公式或笔记本代码中,而不在书面报告中明确说明。
4. 选择图表以回答问题
- 根据分析问题选择图表:趋势、比较、分布、关系、构成、漏斗或队列留存。
- 不要添加那些只会让演示文稿看起来更充实但不会影响决策的图表。
5. 以决策格式简报每个结果
- 每个输出都应包括答案、证据、置信度、注意事项和建议的后续行动。
- 如果输出是给利益相关者的,请将技术方法转化为业务影响,而不是以技术细节为主导。
6. 在建议行动前对论断进行压力测试
- 按明显的混杂因素进行细分,比较正确的基线,量化不确定性,并检查对排除项或时间窗口的敏感性。
- 未经稳健性检验的、看似有力的数字,并不具备决策就绪性。
7. 当数据无法支持论断时进行上报
- 当样本量不足、来源不可靠、定义发生漂移或混杂因素未解决时,阻止或降低结论的确定性。
- 说"目前未知"比产生错误的信心要好。
常见陷阱
- 在更改分子、分母或排除项后仍沿用同一个KPI名称 -> 趋势比较变得无效。
- 在同一图表中比较日、周和月粒度 -> 波动看似真实,但主要是聚合噪声。
- 展示百分比而不提供基础计数 -> 管理层对极小的分母反应过度。
- 使用漂亮的图表而非正确的图表 -> 输出看起来精美,但掩盖了实际的决策信号。
- 看到结果后才去寻找有趣的切分方式 -> 叙事会跟随偶然性而非证据。
- 发布没有指标负责人或注意事项的自动化报告 -> 错误数据传播的速度快于纠正的速度。
- 将观察到的模式视为因果证据 -> 行动计划仅建立在相关性之上。
方法选择
| 问题类型 | 方法 | 关键输出 |
|---|---|---|
| "X 与 Y 有差异吗?" | 假设检验 | p值 + 效应量 + 置信区间 |
| "什么能预测 Z?" | 回归/相关性分析 | 系数 + R² + 残差检验 |
| "用户行为如何随时间变化?" | 队列分析 | 各队列的留存曲线 |
| "这些群体有差异吗?" | 细分分析 | 群体画像 + 统计比较 |
| "有什么异常?" | 异常检测 | 标记点 + 上下文 |
关于技术细节及何时使用每种方法,请参阅techniques.md。
输出标准
- 以洞察为先导,而非方法论
- 量化不确定性- 提供范围,而非点估计
- 说明局限性- 此分析无法告知的内容
- 建议后续步骤- 如何能加强结论
需上报的危险信号
- 用户试图"证明"一个预先确定的结论
- 样本量太小,无法进行可靠推断
- 数据质量问题导致分析无效
- 无法控制的混杂因素
外部端点
此技能不进行外部网络请求。
| 端点 | 发送的数据 | 目的 |
|---|---|---|
| 无 | 无 | 不适用 |
无数据被发送到外部。
安全与隐私
离开您设备的数据:
- 默认情况下无。
保留在本地设备的数据:
- 默认情况下无。
此技能**不**会:
- 访问未声明的外部端点。
- 在隐藏的本地内存文件中存储凭据或原始导出数据。
- 创建或依赖本地文件夹系统进行持久化存储。
- 未经用户明确确认,创建自动化任务或后台作业。
- 重写其自身的指令源文件。
相关技能
安装命令clawhub install <slug>如果用户确认:
sql- 用于可靠数据提取的查询设计与审查。csv- 分析前对表格输入数据进行清理和规范化。dashboard- 关键绩效指标可视化层的实现模式。report- 分析后生成面向利益相关者的结构化交付成果。business-intelligence- 超越一次性分析的关键绩效指标系统和运营节奏。
反馈
- 如果觉得有用:
clawhub star data-analysis - 保持更新:
clawhub sync
文章底部电脑广告
手机广告位-内容正文底部
上一篇:Pipedrive
下一篇:Memory Hygiene


微信扫一扫,打赏作者吧~