敏感词过滤
敏感词过滤是微语客服系统的重要安全功能,能够自动检测和处理访客或客服人员发送的不当内容,包括政治敏感、色情低俗、辱骂攻击等不文明字眼,营造健康的沟通环境。
版本说明
社区版不支持,请升级到企业版或平台版。请替换licenseKey
功能概述
核心能力
-
实时过滤
- 消息发送前自动检测敏感词
- 支持中英文及多语言敏感词识别
- 毫秒级响应,不影响聊天体验
-
智能识别
- 变体检测(如:拼音、谐音、符号替换)
- 上下文语义分析
- 多种规避手段识别
-
灵活处理
- 敏感词替换(星号、马赛克等)
- 消息拦截阻止发送
- 敏感等级分类处理
应用场景
访客端过滤
- 防止恶意骚扰:过滤辱骂、攻击性言论
- 维护平台形象:阻止色情、低俗内容
- 合规要求:符合网络安全法规要求
客服端过滤
- 规范服务用语:避免不当表达影响企业形象
- 防范法律风险:过滤可能引起纠纷的敏感表述
- 提升服务质量:引导使用专业、友好的沟通方式
敏感词分类
按内容类型分类
1. 政治敏感词
包含政治相关的敏感内容:
- 政治人物:涉及政治人物的不当言论
- 政治事件:敏感政治事件相关词汇
- 地区敏感:涉及敏感地区的争议性表述
2. 色情低俗词
包含不健康的色情内容:
- 色情描述:直接的色情描述词汇
- 性暗示:间接的性暗示内容
- 低俗用语:粗俗、不雅的表达
3. 辱骂攻击词
包含人身攻击和辱骂内容:
- 人身攻击:针对个人的恶意攻击
- 歧视言论:种族、性别、地域歧视
- 威胁恐吓:包含威胁性质的言论
4. 违法信息
包含违法违规内容:
- 欺诈信息:诈骗、虚假信息
- 违禁品:毒品、枪支等违禁物品
- 赌博相关:赌博、博彩相关内容
按严重程度分级
高危级别
- 处理方式:直接拦截,禁止发送
- 典型内容:严重政治敏感、极端暴力内容
- 后续动作:记录日志,可能触发人工审核
中危级别
- 处理方式:替换为星号或提示词
- 典型内容:一般性辱骂、轻度色情暗示
- 后续动作:计入统计,达到阈值触发警告
低危级别
- 处理方式:仅记录,不影响发送
- 典型内容:边缘敏感词、争议性词汇
- 后续动作:用于数据分析和趋势监控
技术实现
检测算法
1. 关键词匹配
系统支持多种匹配方式:
- 精确匹配:完全匹配敏感词汇
- 模糊匹配:支持相似词汇检测
- 正则表达式匹配:支持复杂模式匹配
2. 智能变体检测
拼音替换检测:
- 示例:SB → 煞笔 → 傻X
- 检测原理:通过拼音对比识别替换词汇
符号分隔检测:
- 示例:傻*逼 → 傻@逼 → 傻 逼
- 检测原理:去除符号后进行词汇匹配
谐音替换检测:
- 示例:沙比 → 煞笔 → 傻X
- 检测原理:通过谐音词库识别替代表达
3. 语义分析
系统提供智能语义分析能力:
- 上下文分析:结合前后文判断词汇含义
- 情感倾向分析:识别消息的情感色彩
- 意图识别:判断用户的表达意图
过滤流程
消息处理流程
实时检测功能
系统提供多种检测功能:
- 敏感词检测:识别文本中的敏感内容
- 内容过滤:自动处理敏感词汇
- 批量检测:支持多条消息同时检测
检测结果包含:
- 是否包含敏感词
- 敏感等级(高/中/低)
- 具体敏感词位置和类别
- 置信度评分
- 替代建议(如有)
管理配置
敏感词库管理
词库结构
敏感词库包含以下信息:
- 词汇内容:具体的敏感词汇
- 分类标签:政治、色情、辱骂、违法等
- 敏感等级:高危、中危、低危
- 状态管理:启用或禁用
- 创建信息:创建时间和创建人
词库操作
-
添加敏感词
- 支持单个添加和批量导入
- 自动检测重复词汇
- 支持正则表达式模式
-
编辑敏感词
- 修改敏感级别
- 更新分类标签
- 调整处理策略
-
删除敏感词
- 软删除保留历史记录
- 批量删除功能
- 删除前影响评估
过滤规则配置
全局设置
管理员可以配置以下全局参数:
- 功能开关:启用或关闭敏感词过滤
- 检测模式:严格、普通、宽松三种模式
- 默认处理方式:拦截、替换或警告
- 替换字符:自定义替换符号(如*号)
- 变体检测:是否检测变体形式
- 语义分析:是否启用智能语义分析
角色权限设置
不同角色可以设置不同的过滤标准:
- 检测严格程度:1-10级调节,数字越大越严格
- 允许的类别:设置哪些类别的敏感词生效
- 自定义规则:针对特定角色的专门处理规则
白名单管理
词汇白名单
对于某些在特定场景下不应被过滤的词汇,可以设置白名单:
- 词汇内容:不需要过滤的具体词汇
- 使用场景:适用的业务场景描述
- 白名单原因:为什么需要加入白名单
- 作用范围:全局、部门或个人范围
用户白名单
对于特定用户群体的特殊处理:
- VIP客户:放宽检测标准
- 内部测试:跳过敏感词检测
- 特殊 业务:自定义过滤规则
处理策略
访客消息处理
1. 消息拦截
高危敏感词处理:
当检测到高危敏感词时,系统会:
- 阻止消息发送
- 返回友好的错误提示
- 建议使用文明用语
- 记录拦截日志
2. 内容替换
中危敏感词处理:
当检测到中危敏感词时,系统会:
- 将敏感词替换为星号或其他符号
- 保持句子结构完整
- 允许消息正常发送
- 计入统计数据
3. 警告提示
低危敏感词处理:
当检测到低危敏感词时,系统会:
- 保持原内容不变
- 给出友好提醒
- 引导文明用语
- 记录行为数据