1.正则
2.特定关键字
3.机器学习?
对于 1,规则不好维护,并且有人想特意绕过也不是不能做到,比如使用火星文,同音字
对于 2,没有语意分析,会导致例如添加了关键字[成人]
等这人参果长成人型 这句话的成人被屏蔽
对于 3 不了解,大概是基于统计学,如果没有初始的学习数据,而且很难说得清为什么一句话被过滤出来
有没有现成的,针对中文进行拆字和注音,依据字形或读音来进行过滤
可以一定程度上减少火星文,同音字的垃圾内容
仅讨论技术
2.特定关键字
3.机器学习?
对于 1,规则不好维护,并且有人想特意绕过也不是不能做到,比如使用火星文,同音字
对于 2,没有语意分析,会导致例如添加了关键字[成人]
等这人参果长成人型 这句话的成人被屏蔽
对于 3 不了解,大概是基于统计学,如果没有初始的学习数据,而且很难说得清为什么一句话被过滤出来
有没有现成的,针对中文进行拆字和注音,依据字形或读音来进行过滤
可以一定程度上减少火星文,同音字的垃圾内容
仅讨论技术