AI开源项目开源项目

sensitive-word开源项目 – 高性能敏感词过滤工具

基于 DFA 算法实现高性能 Java 敏感词过滤工具框架,目前敏感词库内容已收录 6W+。

标签:

AI交流(进群备注:sensitive-word)

基于 DFA 算法实现高性能 Java 敏感词过滤工具框架,目前敏感词库内容已收录 6W+。

sensitive-word的特点:

  • 1. 6W+ 词库,且不断优化更新。
  • 2. 基于 fluent-api 实现,使用优雅简洁。
  • 3. 基于 DFA 算法,性能为 7W+ QPS,应用无感。
  • 4. 支持敏感词的判断、返回、脱敏等常见操作。
  • 5. 支持常见的格式转换,如全角半角互换、英文大小写互换、忽略重复词等。
  • 6. 支持敏感词检测、邮箱检测、数字检测、网址检测等。
  • 7. 支持自定义替换策略。
  • 8. 支持用户自定义敏感词和白名单。
  • 9. 支持数据的数据动态更新(用户自定义),实时生效。
  • 10. 支持敏感词的标签接口。
  • 11. 支持跳过一些特殊字符,让匹配更灵活。

sensitive-word的功能:

  • 1. 检测文本中的敏感词并返回结果。
  • 2. 在用户输入时实时脱敏处理。
  • 3. 进行格式转换,如全角半角互换。
  • 4. 自定义敏感词和白名单进行过滤。
  • 5. 动态更新敏感词库以适应新的需求。

相关导航

暂无评论

暂无评论...