Question 1

什么是同形字？

Accepted Answer

同形文字是一种看起来像来自不同脚本或编码的另一个字符的字符，例如类似于拉丁语“a”的西里尔文“а”。攻击者在欺骗域、用户名和消息中使用它们。该工具用代码点和替换来显示这些字符。

Question 2

这与 Unicode 标准化有何不同？

Accepted Answer

Unicode 规范化（例如 NFKC）以标准方式折叠兼容性和宽度变体。该工具将 NFKC 与一个小的显式易混淆映射相结合，以便您了解每个字符被标记的原因 — 这比普通的 unicode 标准化工具传递更有用。

Question 3

严格的 ASCII 模式会改变合法的非英语文本吗？

Accepted Answer

严格 ASCII 回退会替换捆绑的易混淆映射中出现的字符或 NFKC 下的更改。其他非 ASCII 字母保持不变。如果合法文本包含这些映射字符，则仍然可能会发生更改，因此请检查分析列表。

Question 4

我的文本会发送到服务器吗？

Accepted Answer

不会。页面加载后，检测和转换仅使用 JavaScript。此易混淆转换器不会上传您的粘贴进行分析。

Question 5

这能抓住所有恶搞吗？

Accepted Answer

不。覆盖范围是确定性的且基于地图，而不是机器学习。它有助于常见的相似字符技巧，但并不是完整的安全审核。

Question 6

生成同形文字模式有什么作用？

Accepted Answer

它将输入中的 ASCII 字母和数字替换为来自用于清理的同一捆绑映射的确定性相似值，这对于在授权环境中构建测试字符串非常有用（例如审核 QA）。它不是为了模仿或绕过保护。

同形字转换器 — 检测并清理 Unicode 易混淆字符

这个同形文字转换器的作用