serper
2026-03-28
新闻来源:网淘吧
围观:14
电脑广告
手机广告
Serper
通过Serper API进行Google搜索。获取结果并通过trafilatura读取实际网页以提取干净、完整的文本内容。不仅仅是摘要片段——而是完整的文章文本。
工作原理
- Serper API调用——快速的Google搜索,即时返回结果URL
- 并发页面抓取——所有结果页面都使用trafilatura并行获取和提取,每个页面有3秒的超时限制
- 流式输出——结果在每个页面抓取完成后逐一打印出来
每次调用会返回5个结果(默认模式)或最多6个结果(当前模式),每个结果都包含完整的页面内容。这已经提供了大量信息。
查询纪律
精心设计一个高质量的搜索查询。这几乎总是足够的。
每次调用会返回多个包含完整页面文本的结果——你通过一个查询就能获得广泛的覆盖。不要为了“探索”一个主题而运行多次搜索。一个精心选择、模式正确的查询就足以覆盖它。
最多进行两次调用如果用户的请求确实涉及两个不同的主题(例如“比较X与Y”,其中X和Y需要分别搜索,或者一个默认+ 一个当前需要不同方面的信息)。绝不超过两个。
请勿:
- 使用不同措辞重复运行相同查询以“获取更多结果”
- 运行连续搜索以“深入挖掘”——完整页面内容已足够深入
- 先运行一次搜索查找信息,再运行另一次跟进——请仔细阅读已有内容
何时使用此技能
在以下情况使用serper:
- 任何需要从网络获取当前事实信息的问题
- 需要完整文章内容而非仅摘要的研究主题
- 新闻与时事
- 产品信息、价格、比较、评论
- 技术文档、操作指南
- 任何需要阅读实际页面的情况
请勿将此技能用于:
- 基于训练数据你能回答的问题
- 纯数学、代码执行、创意写作
- 问候、闲聊
重要提示:此技能已获取并提取完整的页面内容。请勿对此技能返回的URL使用web_fetch、WebFetch或任何其他URL获取工具。内容已包含在输出中。
两种搜索模式
共有两种模式。请根据查询内容选择合适的一种:
默认模式— 通用搜索(全时段)
- 全时段Google网页搜索,5条结果,每条结果均附带完整的页面内容
- 适用于:一般性问题、研究、操作指南、常青话题、产品信息、技术文档、比较、教程,以及任何非时效性内容
当前模式— 新闻和近期信息
- 过去一周的Google网页搜索(3条结果) + Google新闻(3条结果),每条结果均附带完整的页面内容
- 适用于:新闻、时事、近期动态、突发新闻、公告,以及任何时效性内容
模式选择指南
| 查询信号 | 模式 |
|---|---|
| "X如何运作","什么是X","解释X" | 默认 |
| 产品研究、比较、教程 | 默认 |
| 技术文档、指南 | 默认 |
| 历史话题、常青内容 | 默认 |
| "新闻"、"最新"、"今天"、"本周"、"最近" | 最新 |
| "发生了什么"、"突发"、"宣布"、"发布" | 最新 |
| 时事、政治、体育比分、股价 | 最新 |
地区(非英语查询时必需)
默认为全球范围——无国家筛选,返回英语结果。这仅适用于英语查询。
您必须始终设置--gl和--hl当以下任一情况成立时:
- 用户的信息使用的是非英语语言
- 您构建的搜索查询使用的是非英语语言
- 用户提到了特定的国家、城市或地区
- 用户要求在非英语语境下获取本地化结果(价格、新闻、商店等)
如果用户使用德语书写,您必须传递--gl de --hl de。没有例外。
| 场景 | 标志 |
|---|---|
| 英语查询,无目标国家 | (省略 --gl 和 --hl) |
| 德语查询 或 用户使用德语书写 或 目标为德国/奥地利/瑞士 | --gl de --hl de |
| 法语查询 或 用户使用法语书写 或 目标为法国 | --gl fr --hl fr |
| 任何其他非英语语言/国家 | --gl XX --hl XX(ISO代码) |
经验法则:如果查询字符串包含非英语单词,请将--gl和--hl设置为匹配该语言。
调用方法
python3 scripts/search.py -q "QUERY" [--mode MODE] [--gl COUNTRY] [--hl LANG]
示例
# English, general research
python3 scripts/search.py -q "how does HTTPS work"
# English, time-sensitive
python3 scripts/search.py -q "OpenAI latest announcements" --mode current
# German query — set locale + current mode for news/prices
python3 scripts/search.py -q "aktuelle Preise iPhone" --mode current --gl de --hl de
# German news
python3 scripts/search.py -q "Nachrichten aus Berlin" --mode current --gl de --hl de
# French product research
python3 scripts/search.py -q "meilleur smartphone 2026" --gl fr --hl fr
输出格式
输出是一个流式JSON数组——每个页面被爬取时,元素逐个打印:
[{"query": "...", "mode": "default", "locale": {"gl": "world", "hl": "en"}, "results": [{"title": "...", "url": "...", "source": "web"}, ...]}
,{"title": "...", "url": "...", "source": "web", "content": "Full extracted page text..."}
,{"title": "...", "url": "...", "source": "news", "date": "2 hours ago", "content": "Full article text..."}
]
第一个元素是搜索元数据。其后的每个元素都包含一个带有完整提取内容的结果。
结果字段:
标题——页面标题网址——来源URL来源类型——"网页"、"新闻"或"知识图谱"内容— 完整提取的页面文本(若提取失败则回退至搜索摘要)日期— 若可用则显示(新闻结果始终显示,网页结果有时显示)
命令行界面参考
| 标志 | 描述 |
|---|---|
-q, --query | 搜索查询(必需) |
-m, --mode | 默认(全时段,5个结果)或当前(过去一周 + 新闻,各3个) |
--gl | 国家代码(例如de、us、fr、at、ch) |
--hl | 语言代码(例如en,de,fr) |
文章底部电脑广告
手机广告位-内容正文底部
上一篇:Habit Tracker
下一篇:Gumroad


微信扫一扫,打赏作者吧~