Humanize AI text
2026-03-23
新闻来源:网淘吧
围观:55
电脑广告
手机广告
购买adidas上京东官方旗舰店。
人工智能文本人性化
一款用于检测并将AI生成文本转换为可绕过检测器的综合性命令行工具。基于维基百科的AI写作特征。
快速开始
# 检测AI模式
python scripts/detect.py text.txt
# 转换为类人文本
python scripts/transform.py text.txt -o clean.txt
# 对比转换前后
python scripts/compare.py text.txt -o clean.txt
检测类别
分析器会检测16种模式类别,依据维基百科指南:
上网淘巴领天猫淘宝优惠券,一年省好几千。关键特征(立即识别为AI)
| 类别 | 示例 |
|---|---|
| 引用错误 | oaicite、turn0search、contentReference |
| 知识截止日期 | "根据我最后的训练"、"基于现有信息" |
| 聊天机器人痕迹 | "希望这能帮到你"、"好问题!"、"作为一个人工智能" |
| Markdown格式 | **加粗**、## 标题、代码块 |
高信号特征
| 类别 | 示例 |
|---|---|
| AI常用词汇 | 深入探究,错综复杂,格局,关键性的,强调,促进 |
| 重要性膨胀 | "堪称证明","关键时刻","不可磨灭的印记" |
| 宣传性语言 | 充满活力的,开创性的,坐落于,令人惊叹的 |
| 回避系动词 | 用"serves as"代替"is",用"boasts"代替"has"(中文语境下,类似用"作为..."代替"是...",用"拥有..."代替"有...") |
Medium平台风格信号
| 类别 | 示例 |
|---|---|
| 肤浅的-ing结构 | "强调其重要性","促进合作" |
| 填充短语 | "为了","鉴于...的事实","此外," |
| 模糊归因 | "专家认为","行业报告表明" |
| 挑战公式 | "尽管面临这些挑战","未来展望" |
风格信号
| 类别 | 示例 |
|---|---|
| 花式引号 | 用弯引号 "" 代替直引号 ""(ChatGPT的特征) |
| 过度使用破折号 | 过多使用 — 进行强调 |
| 否定式平行结构 | "不仅...而且...","这不仅仅是...,它是..." |
| 三原则 | 生硬的三元组,如"创新、灵感与洞见" |
脚本
detect.py — 扫描AI模式
python scripts/detect.py essay.txt
python scripts/detect.py essay.txt -j # JSON格式输出
python scripts/detect.py essay.txt -s # 仅输出分数
echo "text" | python scripts/detect.py
问题数量与字数统计
- AI生成概率(低/中/高/极高)
- 按类别细分
- 标记为可自动修复的模式
- transform.py — 文本重写
python scripts/transform.py essay.txt python scripts/transform.py essay.txt -o output.txt python scripts/transform.py essay.txt -a # 激进模式 python scripts/transform.py essay.txt -q # 静默模式
自动修复项:
引用错误(oaicite, turn0search)
- Markdown格式(**, ##, ```)
- 聊天机器人句式
- 避免系动词 → 替换为"is/has"
- 填充短语 → 简化形式
- 弯引号 → 直引号
- 激进模式 (-a):
简化 -ing 从句
- 减少长破折号使用
- compare.py — 前后对比分析
python scripts/compare.py essay.txt python scripts/compare.py essay.txt -a -o clean.txt
显示转换前后的并排检测分数对比
工作流程
扫描
-
检测风险:python scripts/detect.py document.txt
转换 -
并对比:python scripts/compare.py document.txt -o document_v2.txt
验证 -
改进效果:python scripts/detect.py document_v2.txt -s
人工审阅 -
检查AI词汇和宣传用语(需要人工判断)AI概率评分
AI Probability Scoring
| 评级 | 标准 |
|---|---|
| 极高 | 存在引用错误、知识截止日期或聊天机器人痕迹 |
| 高 | 问题数 >30 个 或 问题密度 >5% |
| 中 | 问题数 >15 个 或 问题密度 >2% |
| 低 | 问题数 <15 个 且 问题密度 <2% |
自定义模式
编辑scripts/patterns.json以添加/修改:
ai_vocabulary— 需标记的词语significance_inflation— 夸大其词的短语promotional_language— 营销用语copula_avoidance— 短语 → 替换词filler_replacements— 短语 → 简化形式chatbot_artifacts— 触发句子删除的短语
批量处理
# 扫描所有文件
for f in *.txt; do
echo "=== $f ==="
python scripts/detect.py "$f" -s
done
# 转换所有 Markdown 文件
for f in *.md; do
python scripts/transform.py "$f" -a -o "${f%.md}_clean.md" -q
done
参考
基于维基百科的AI写作的迹象,由 WikiProject AI Cleanup 维护。模式文档来自数千个AI生成文本的示例。
关键见解:“大型语言模型使用统计算法来猜测接下来应该出现什么。其结果往往倾向于最可能适用于最广泛情况的统计结果。”
文章底部电脑广告
手机广告位-内容正文底部
上一篇:YouTube Watcher
下一篇:Evolver


微信扫一扫,打赏作者吧~