网淘吧来吧,欢迎您!

返回首页 微信
微信
手机版
手机版

tushare技能使用说明

2026-03-27 新闻来源:网淘吧 围观:20
电脑广告
手机广告

tushare-data

把自然语言财经数据请求,转成可执行的 Tushare 数据工作流。

这是一个面向自然语言的金融数据研究技能。

这个技能的用途

使用这个技能的典型场景:

  • 查看某只股票、指数、ETF 的近期走势
  • 查询公司基本资料、估值、财务趋势
  • 对多个标的进行横向比较
  • 查看资金流向、北向资金、龙虎榜、板块强弱
  • 梳理公告、新闻、研究报告、政策线索
  • 查看 CPI / PPI / PMI / 社会融资规模 / 利率等宏观数据
  • 导出 CSV / parquet 文件供后续分析或回测使用
  • 生成简洁的研究摘要,而非仅输出原始字段表

先理解用户要解决什么问题,再去选择接口、获取数据、整理数据、解释数据、交付结果。


何时使用

当用户表达以下意图时,优先使用本技能:

行情 / 趋势

  • 看一下 XX 最近怎么样
  • XX 这段时间涨得怎么样
  • 今年以来表现如何
  • 最近有没有放量
  • 这只股票最近强不强

财务 / 估值 / 公司质量

  • 看一下 XX 的财报
  • 最近几个季度的利润趋势
  • 财务质量怎么样
  • 现金流好不好
  • 现在估值算高吗
  • 帮我看 PE / PB / ROE / 毛利率

对比 / 排行 / 筛选

  • XX 和 YY 谁更强
  • 帮我横向比较一下
  • 哪些公司利润增长更快
  • 帮我筛一下高 ROE 低负债
  • 给我排个前十

板块 / 指数 / 主题

  • 最近哪个板块最强
  • 半导体最近怎么样
  • 机器人为什么涨
  • 指数成分股有哪些
  • 哪些主题最热

资金流 / 情绪

  • 最近资金在买什么
  • 北向资金最近流向哪里
  • 哪个板块最吸金
  • 主力资金流入最多的是谁
  • 龙虎榜上有什么看点

公告 / 新闻 / 研报 / 政策

  • 最近有什么公告
  • 帮我梳理下 XX 公告
  • 最近有没有什么催化
  • 最近新闻面怎么样
  • 最近有什么重要政策

宏观 / 跨市场

  • 最近宏观环境怎么样
  • CPI / PMI 最近怎么看
  • 当前市场风格偏什么
  • 大盘环境偏多还是偏空
  • 港股 / 美股 / 美债最近怎么样

数据导出 / 研究准备

  • 给我导出一份行情数据
  • 把近两年日线拉成 CSV
  • 生成可回测的数据表
  • 拉一个研究表供后续分析

这个技能不适合做什么

这个技能不适合:

  • 直接给出买卖建议或替代投资顾问
  • 自动下单或执行交易
  • 需要毫秒级实时交易决策的场景
  • 复杂回测引擎、组合优化系统本身的实现(那是另一个工程)
  • 在没有 Tushare 权限/积分支持的情况下强行伪造数据

如果数据权限不够、接口不可用或时间范围不合理,要明确说出限制,不要硬编。


自然语言触发指南

即使用户完全不说tushare、金融、宏观只要意图符合以下含义,这些术语也应触发此技能。

常见口语触发

  • 看看这个股票最近怎么样
  • 给我快速研究一下 XX
  • 上次说的那只票现在什么情况
  • 帮我看下财报
  • 最近哪个板块最强
  • 北向最近在买什么
  • 有什么催化消息
  • 这个公司值不值得重点看
  • 给我拉份数据
  • 导出成 CSV
  • 帮我筛一批票
  • 把这几个公司对比一下

中文自然语言优先原则

用户说人话时,先理解任务,不要先回到接口名和字段名。 优先将:

  • “最近” 解释为合理时间窗
  • “财报” 解释为最近 8 个季度 / 最近年度
  • “强不强” 解释为走势 + 相对强弱 + 活跃度
  • “资金关注” 解释为净流入、活跃成交、龙虎榜/北向等可用口径

如果任务有多个合理解释,再进行最小澄清。


环境检查

在真正请求数据之前,先做前置校验:

  1. 检查 Python 是否可用,版本要求 3.7+
  2. 检查tushare包是否已安装。
  3. 检查TUSHARE_TOKEN是否存在。
  4. 必要时做一次轻量接口冒烟测试(如交易日历 / 基础接口)
  5. 如用户请求高权限接口,提前提示可能存在积分/权限限制

若缺失 token,直接提示最短修复路径,例如:

export TUSHARE_TOKEN=your_token

不要等到主查询跑失败了才暴露环境问题。


意图分类

先识别任务类型,再决定接口组合。

1. 行情 / 趋势

典型问题:

  • 最近走势怎么样
  • 今年涨了多少
  • 最近波动大不大
  • 最近有没有放量

常用接口:

  • daily
  • pro_bar
  • weekly
  • monthly
  • stk_mins
  • rt_k/rt_min(如确需实时口径且权限允许)
  • daily_basic

2. 基本资料 / 标的识别

典型问题:

  • 这是什么公司 / 什么指数 / 什么基金
  • 是创业板吗 / 是 ST 吗 / 什么时候上市

常用接口:

  • stock_basic
  • fund_basic
  • index_basic
  • stock_company
  • stock_st/st

3. 财务 / 公司质量

典型问题:

  • 最近几个季度利润趋势
  • 最近几个季度营收和净利润趋势
  • 财务质量怎么样
  • ROE / 毛利率 / 现金流如何

常用接口:

  • income(营收 / 净利润趋势优先)
  • fina_indicator(ROE / 毛利率 / 净利率等质量指标补充)
  • 资产负债表
  • 现金流量表
  • 预测
  • 快报
  • 披露日期

4. 估值 / 基本面指标

典型问题:

  • 现在估值高不高
  • 谁更便宜
  • PE / PB / 股息率如何

常用接口:

  • daily_basic
  • fina_indicator

5. 资金流 / 市场行为

典型问题:

  • 北向最近买什么
  • 主力资金流向
  • 龙虎榜情况

常用接口:

  • moneyflow
  • moneyflow_hsgt
  • hsgt_top10
  • top_list
  • top_inst
  • moneyflow_ind_dc
  • moneyflow_mkt_dc

6. 板块 / 指数 / 主题

典型问题:

  • 最近哪个板块最强
  • 行业轮动如何
  • 某板块有哪些成分股

常用接口:

  • index_basic
  • index_daily
  • index_classify
  • index_member_all
  • sw_daily
  • ths_index
  • ths_member
  • dc_index
  • dc_member

7. 打板 / 情绪 / 活跃度

典型问题:

  • 今天涨停梯队
  • 连板结构
  • 炸板率 / 情绪强弱

常用接口:

  • limit_list_d
  • limit_step
  • kpl_list
  • dc_hot
  • ths_hot

8. 公告 / 新闻 / 研报 / 政策

典型问题:

  • 最近有什么公告或催化
  • 最近有什么研究报告
  • 最近政策面发生了什么

常用接口:

  • anns_d
  • news
  • major_news
  • research_report
  • npr
  • irm_qa_sh
  • irm_qa_sz

9. 宏观 / 跨市场

典型问题:

  • CPI / PMI / 社融 / M2
  • 利率与收益率曲线
  • 港股 / 美股 / 美债数据

常用接口:

  • cn_cpi
  • cn_ppi
  • cn_pmi
  • cn_gdp
  • cn_m
  • sf_month
  • shibor
  • shibor_lpr
  • us_tycr
  • us_daily
  • hk_daily
  • index_global

10. 导出 / 研究准备

典型问题:

  • 导出某标的一段时间行情
  • 生成回测用数据表
  • 输出 CSV / parquet

常用接口:

  • 取决于上游任务,核心是统一输出规则与命名规范

实体解析规则

标的解析

  • 优先识别股票名、股票代码、指数名、ETF 名、基金名
  • 对中文简称先尝试匹配标准对象
  • 若重名或多解,列出候选并做最小澄清
  • 证券代码内部统一为标准格式,如:600519.SH、000001.SZ

市场识别

  • 默认先按 A 股理解,除非用户明确提到港股 / 美股 / 基金 / 债券 / 期货
  • 指数、ETF、个股要分开判断,不要混用接口

时间默认值

若用户没有明确给时间范围,使用合理默认:

  • “最近走势” → 默认近 20 个交易日
  • “这段时间 / 最近一段时间” → 默认近 3 个月
  • "财报 / 业绩" → 默认最近8个季度 + 最近年度
  • "资金流最近如何" → 默认近5~20个交易日,按任务粒度调整
  • "宏观最近如何" → 默认看最近6~12期

板块口径默认值

若用户只说"板块 / 行业 / 概念"但未指定分类体系:

  • 行业优先用申万 / 中信等较稳定口径
  • 概念优先同花顺 / 东方财富等主题口径
  • 若结论依赖具体口径差异,要明确说明使用了哪种分类

输入规范化规则

在请求数据前先做规范化:

  • 日期统一为YYYYMMDD
  • 检查start_date <= end_date
  • 用户输入未来日期时,自动裁剪到最近可用日期并提示
  • 裸代码如000001不要盲猜,能补全则说明补全规则,不能补全则澄清
  • 对冲突参数(如trade_date与start_date/end_date同时给)要先裁决,不要直接乱传

数据获取规则

文档先行

Before writing the request code, first confirm:

  • Whether the interface name is correct
  • Required parameters
  • Optional parameters
  • Return fields
  • Credits / Rate limits

Do not rely solely on memory to write field names.

Field confirmation

Forfieldsparameters, prioritize using known field whitelists or interface documentation for confirmation. If a user requests a field that does not exist, clearly state so rather than blindly searching.

Default segmented fetching

Do not pull all long-range data at once. Suggestions:

  • Daily / Weekly / Monthly data: Slice by year or quarter
  • Financial reports: Slice by year / reporting period
  • Minute data: Slice by month / week
  • Large batch of multiple securities: Batch by security + segment by date

Retry and rate limiting

  • Perform limited retries only for transient errors (network jitter, timeouts, 429)
  • Do not blindly retry for parameter errors, insufficient permissions, or field errors
  • Add throttling during batch fetching to avoid hitting rate limits due to high frequency

Segment merging

After segmented fetching:

  • Merge
  • Deduplicate
  • Sort by primary key
  • 记录失败分段
  • 若部分成功,要明确告诉用户哪些段失败了

输出约定

除非用户明确只要原始表,否则优先按这个结构输出:

  1. 一句话结论
  2. 数据范围与口径
  3. 关键指标 / 关键表格
  4. 异常点 / 风险点 / 解释限制
  5. 如有本地输出,给出文件路径

结果交付形态

按任务复杂度选择:

  • 小结果:Markdown 摘要 + 简短表格
  • 中等数据表:CSV
  • 大规模 / 后续分析:Parquet
  • 需要可复用流程:附 Python 脚本
  • 需要可视化时:输出图表 PNG 或说明可绘制图表

元信息

生成数据文件时,尽量同时记录:

  • 接口名
  • 请求参数
  • 拉取时间
  • 数据行数
  • 字段列表
  • 是否存在失败分段 / 缺失

工作流模板

下面这些模板,是本技能的核心。 不要直接从接口想起,而要从任务模板想起。

1. 单标的行情分析

适用:

  • 看看 XX 最近怎么样
  • 这只股票最近强不强
  • 今年以来表现如何

默认流程:

  1. 解析标的
  2. 确定时间范围
  3. 获取行情数据 + 必要基础指标
  4. 总结区间涨跌、成交活跃度、高低点、波动情况
  5. 输出一句结论 + 关键数字

2. 多标的横向对比

适用:

  • XX 和 YY 谁更强
  • 把这几家公司对比一下

默认流程:

  1. 锁定对象
  2. 统一时间口径
  3. 选取 3~5 个关键指标
  4. 输出对比表
  5. 给出“谁在哪方面更强”的总结

3. 财务质量快照

适用:

  • 看看 XX 的财报
  • 最近几个季度利润趋势
  • 财务质量怎么样

默认流程:

  1. 提取最近8个季度及最近年度财务核心数据
  2. 区分营收、利润、毛利率、ROE、现金流
  3. 标出改善/恶化/波动点
  4. 说明累计值、单季值、同比口径

4. 估值分析/筛选

适用场景:

  • 当前估值是否偏高
  • 哪只股票更便宜
  • 筛选低估值高股息标的

默认流程:

  1. 明确标的池范围
  2. 提取daily_basic等估值指标数据
  3. 必要时关联财务质量分析
  4. 输出排序结果、极值、口径说明

5. 资金流追踪

适用场景:

  • 近期资金在买入哪些标的
  • 北向资金近期流向何处
  • 主力资金净流入最多的标的

默认流程:

  1. 明确资金口径(北向/主力/龙虎榜/板块资金)
  2. 确定时间窗口
  3. 提取净流入/活跃成交/持续性数据
  4. 结合价格表现联动解释
  5. 避免将单日噪声误判为趋势

6. 板块 / 题材轮动分析

适用:

  • 最近哪个板块最强
  • 机器人最近强在哪
  • 某概念板块里有哪些成分股

默认流程:

  1. 确定分类口径
  2. 拉取板块区间表现
  3. 必要时联动成分股、资金流、涨停梯队
  4. 输出强势板块排行与代表标的

7. 公告 / 新闻 / 事件梳理

适用:

  • 最近有什么公告
  • 有没有什么催化
  • 最近新闻面怎么样

默认流程:

  1. 明确对象和时间窗
  2. 拉取公告 / 新闻 / 研报 / 政策数据
  3. 去噪,提炼 3~5 条主线
  4. 区分事实、公告、媒体解读
  5. 必要时结合股价异动做弱因果解释

8. 数据导出与研究准备

适用:

  • 拉一份 CSV
  • 做回测数据表
  • 导出某段时间的行情/财务数据

默认流程:

  1. 明确数据范围、频率、字段
  2. 采用分段策略取数
  3. 清洗、去重、统一字段类型
  4. 输出 CSV / parquet
  5. 给出文件路径和元信息

9. 综合研究简报

适用:

  • 给我快速研究一下 XX
  • 做个投资者视角简报
  • 先给个全景判断

默认流程:

  1. 一句话结论
  2. 行情表现
  3. 财务趋势
  4. 估值水平
  5. 资金流情况
  6. 公告 / 新闻催化
  7. 风险点
  8. 值得继续深挖的问题

数据质量规则

拉取完成后,至少做这些检查:

  • 模式/结构校验
  • 关键字段存在性检查
  • 主键去重
  • 固定排序
  • 日期标准化
  • 数值字段类型规范化

Handling Empty Results

An empty table does not necessarily indicate failure; it is important to distinguish between:

  • Non-trading days
  • No data within the specified interval
  • Stock not yet listed
  • Parameter errors
  • Insufficient API permissions

Do not attribute all empty results to "API malfunction."


Cache and Reuse Rules

To ensure the skill can be reused over the long term, priority should be given to supporting:

  • Caching of basic tables (such asstock_basic, trading calendars, and basic index information)
  • Incremental updates instead of full reloads each time
  • Resumable execution for large tasks
  • Standardized naming for result files

Recommended naming format:

  • daily_600519.SH_20230101_20231231_20260322.csv
  • fina_indicator_300750.SZ_20260322.parquet

When cache hits occur, it is best to indicate which data comes from the cache and which is newly fetched.


Error Handling

Prioritize outputting errors in "plain language + layered debugging details."

User-visible layer

  • Token not configured
  • The current API may require higher credits/permissions
  • 时间范围过大,已自动改为分段拉取
  • 股票名称不唯一,请确认是哪一个
  • 当前结果为空,可能因为该日期非交易日 / 标的未上市 / 无权限

调试层

必要时补:

  • 接口名
  • 参数
  • 失败分段
  • 异常原文

部分成功原则

如果部分分段失败,不要说“成功完成”。 应明确说:

  • 哪些部分成功
  • 哪些部分失败
  • 是否已生成不完整结果

推荐的最小接口集

主技能正文不要塞几百个接口。 优先记住处理80%常用任务的核心接口集:

  • stock_basic
  • trade_cal
  • daily
  • pro_bar
  • daily_basic
  • fina_indicator
  • income
  • balancesheet
  • cashflow
  • forecast
  • express
  • 资金流向
  • 沪深港通资金流向
  • 沪深港通十大成交股
  • 龙虎榜
  • 指数基本信息
  • 指数日线行情
  • 指数分类
  • 申万行业日线行情
  • 同花顺概念指数
  • 同花顺概念成分股
  • 每日涨跌停统计
  • 个股涨跌停明细
  • 新闻
  • 重大新闻
  • 研究报告
  • 每日公告
  • 中国居民消费价格指数
  • 中国制造业采购经理指数
  • 美国国债收益率

全部数据接口,请参考references/数据接口.md。


最佳实践

  • 先理解任务,再选接口
  • 能少取就少取,先核心数据,再扩展
  • 先给结论,再给证据
  • 默认使用通俗易懂的语言,避免直接罗列字段名称
  • 对于“最近 / 财报 / 强不强 / 资金关注”这类模糊的中文表述,应建立合理的默认解释口径
  • 处理大型任务时,应先提供执行计划,再开始执行
  • 导出任务时,尽量保留脚本、元数据和文件路径,以便后续复用

示例

个股行情

  • 查看宁德时代最近三个月的股价走势
  • 贵州茅台今年以来上涨了多少
  • 招商银行近两年的最大回撤大约是多少

财务 / 估值

  • 查看比亚迪最近8个季度的营业收入和净利润趋势
  • 贵州茅台目前的估值算高吗
  • 帮我筛选出高净资产收益率(ROE)且低负债率的公司

对比分析

  • 比较一下贵州茅台、五粮液、泸州老窖近一年的股价涨幅和估值情况
  • 对比一下沪深300指数、中证500指数和创业板指数今年的市场表现

资金流向 / 板块分析

  • 今天北向资金净流入最多的股票有哪些
  • 近期哪个板块表现最强
  • 半导体板块最近一个月的表现强不强

公告 / 事件

  • 帮我梳理一下寒武纪近期的重要公告
  • 最近机器人板块有什么消息面的催化剂

宏观数据

  • 查看一下近期的消费者价格指数(CPI)、生产者价格指数(PPI)和采购经理指数(PMI)的变化情况
  • 当前市场风格偏成长还是价值

导出

  • 把沪深300成分股近两年日线导成 CSV
  • 下载宁德时代 2020 到现在的复权行情
  • 把最近 3 年 ROE、PE、PB、营收增速拉成一个表

快速规则

当用户在说:

  • 看走势
  • 查财报
  • 比较公司
  • 看板块
  • 看资金流
  • 梳理公告新闻
  • 看宏观
  • 拉数据导出

就不要先想“有哪些接口”。 先想:这是什么任务?默认该走哪条数据工作流?结果应该怎样交付才真正有用?

天猫隐藏优惠券

网淘吧

免责申明
部分文章来自各大搜索引擎,如有侵权,请与我联系删除。
打赏
文章底部电脑广告
手机广告位-内容正文底部

相关文章

您是本站第291475名访客 今日有273篇新文章/评论