网淘吧来吧,欢迎您!

serper

2026-03-28 新闻来源:网淘吧 围观:14
电脑广告
手机广告

Serper

通过Serper API进行Google搜索。获取结果并通过trafilatura读取实际网页以提取干净、完整的文本内容。不仅仅是摘要片段——而是完整的文章文本。

工作原理

  1. Serper API调用——快速的Google搜索,即时返回结果URL
  2. 并发页面抓取——所有结果页面都使用trafilatura并行获取和提取,每个页面有3秒的超时限制
  3. 流式输出——结果在每个页面抓取完成后逐一打印出来

每次调用会返回5个结果(默认模式)或最多6个结果(当前模式),每个结果都包含完整的页面内容。这已经提供了大量信息。


查询纪律

精心设计一个高质量的搜索查询。这几乎总是足够的。

每次调用会返回多个包含完整页面文本的结果——你通过一个查询就能获得广泛的覆盖。不要为了“探索”一个主题而运行多次搜索。一个精心选择、模式正确的查询就足以覆盖它。

最多进行两次调用如果用户的请求确实涉及两个不同的主题(例如“比较X与Y”,其中X和Y需要分别搜索,或者一个默认+ 一个当前需要不同方面的信息)。绝不超过两个。

请勿:

  • 使用不同措辞重复运行相同查询以“获取更多结果”
  • 运行连续搜索以“深入挖掘”——完整页面内容已足够深入
  • 先运行一次搜索查找信息,再运行另一次跟进——请仔细阅读已有内容

何时使用此技能

在以下情况使用serper:

  • 任何需要从网络获取当前事实信息的问题
  • 需要完整文章内容而非仅摘要的研究主题
  • 新闻与时事
  • 产品信息、价格、比较、评论
  • 技术文档、操作指南
  • 任何需要阅读实际页面的情况

请勿将此技能用于:

  • 基于训练数据你能回答的问题
  • 纯数学、代码执行、创意写作
  • 问候、闲聊

重要提示:此技能已获取并提取完整的页面内容。请勿对此技能返回的URL使用web_fetch、WebFetch或任何其他URL获取工具。内容已包含在输出中。


两种搜索模式

共有两种模式。请根据查询内容选择合适的一种:

默认模式— 通用搜索(全时段)

  • 全时段Google网页搜索,5条结果,每条结果均附带完整的页面内容
  • 适用于:一般性问题、研究、操作指南、常青话题、产品信息、技术文档、比较、教程,以及任何非时效性内容

当前模式— 新闻和近期信息

  • 过去一周的Google网页搜索(3条结果) + Google新闻(3条结果),每条结果均附带完整的页面内容
  • 适用于:新闻、时事、近期动态、突发新闻、公告,以及任何时效性内容

模式选择指南

查询信号模式
"X如何运作","什么是X","解释X"默认
产品研究、比较、教程默认
技术文档、指南默认
历史话题、常青内容默认
"新闻"、"最新"、"今天"、"本周"、"最近"最新
"发生了什么"、"突发"、"宣布"、"发布"最新
时事、政治、体育比分、股价最新

地区(非英语查询时必需)

默认为全球范围——无国家筛选,返回英语结果。这仅适用于英语查询。

您必须始终设置--gl--hl当以下任一情况成立时:

  • 用户的信息使用的是非英语语言
  • 您构建的搜索查询使用的是非英语语言
  • 用户提到了特定的国家、城市或地区
  • 用户要求在非英语语境下获取本地化结果(价格、新闻、商店等)

如果用户使用德语书写,您必须传递--gl de --hl de。没有例外。

场景标志
英语查询,无目标国家(省略 --gl 和 --hl)
德语查询 或 用户使用德语书写 或 目标为德国/奥地利/瑞士--gl de --hl de
法语查询 或 用户使用法语书写 或 目标为法国--gl fr --hl fr
任何其他非英语语言/国家--gl XX --hl XX(ISO代码)

经验法则:如果查询字符串包含非英语单词,请将--gl--hl设置为匹配该语言。


调用方法

python3 scripts/search.py -q "QUERY" [--mode MODE] [--gl COUNTRY] [--hl LANG]

示例

# English, general research
python3 scripts/search.py -q "how does HTTPS work"

# English, time-sensitive
python3 scripts/search.py -q "OpenAI latest announcements" --mode current

# German query — set locale + current mode for news/prices
python3 scripts/search.py -q "aktuelle Preise iPhone" --mode current --gl de --hl de

# German news
python3 scripts/search.py -q "Nachrichten aus Berlin" --mode current --gl de --hl de

# French product research
python3 scripts/search.py -q "meilleur smartphone 2026" --gl fr --hl fr


输出格式

输出是一个流式JSON数组——每个页面被爬取时,元素逐个打印:

[{"query": "...", "mode": "default", "locale": {"gl": "world", "hl": "en"}, "results": [{"title": "...", "url": "...", "source": "web"}, ...]}
,{"title": "...", "url": "...", "source": "web", "content": "Full extracted page text..."}
,{"title": "...", "url": "...", "source": "news", "date": "2 hours ago", "content": "Full article text..."}
]

第一个元素是搜索元数据。其后的每个元素都包含一个带有完整提取内容的结果。

结果字段:

  • 标题——页面标题
  • 网址——来源URL
  • 来源类型——"网页""新闻""知识图谱"
  • 内容— 完整提取的页面文本(若提取失败则回退至搜索摘要)
  • 日期— 若可用则显示(新闻结果始终显示,网页结果有时显示)

命令行界面参考

标志描述
-q, --query搜索查询(必需)
-m, --mode默认(全时段,5个结果)或当前(过去一周 + 新闻,各3个)
--gl国家代码(例如deusfratch
--hl语言代码(例如en,de,fr)
免责申明
部分文章来自各大搜索引擎,如有侵权,请与我联系删除。
打赏
文章底部电脑广告
手机广告位-内容正文底部
上一篇:Habit Tracker 下一篇:Gumroad

相关文章

您是本站第320406名访客 今日有98篇新文章/评论