当前位置: 首页 > news >正文

宁波企业建站系统网站域名有了 网站如何建设

宁波企业建站系统,网站域名有了 网站如何建设,网站设计制作的特点有哪些,wordpress免费虚拟主机敏感词过滤是一种在网站、应用程序或平台中实现内容审查的技术#xff0c;用于阻止用户发布包含不适当、非法或不符合政策的内容。我们在实际的网站运营过程中#xff0c;往往需要担心某些用户发布的内容中包含敏感词汇#xff0c;这些词汇往往会导致我们的网站被用户举报用于阻止用户发布包含不适当、非法或不符合政策的内容。我们在实际的网站运营过程中往往需要担心某些用户发布的内容中包含敏感词汇这些词汇往往会导致我们的网站被用户举报甚至被服务器运营商封禁、被相关部门约谈、罚款等。为了防止这种情况发生我们需要对敏感词汇进行过滤。 敏感词过滤的实现涉及多个步骤既包括技术实现也包括策略制定。以下以安企CMS的敏感词过滤设计为例展开说明。 定义敏感词库 敏感词库的构成一般包含涉及SE情的、涉及政治的、涉及FAN动暴力的、涉及广告法的词汇。根据我们网站的不同定义可以收集集中一部分获取全部的词汇。一般我们可以从网上下载或手动收集这些词汇。 在敏感词库的收集方面安企CMS设计成了手动收集系统同步双模式。默认系统没有敏感词可以选择从官网同步官网预设好的敏感词库也可以手动添加自定义的敏感词。 敏感词过滤的算法设计 针对日常的企业网站我们不必要采用上下文分析、语义分析等 AI 算法。为了简便起见我们可以使用最常见也是最简单是的关键词匹配算法为了更大的适应规则我们还可以增加使用正则匹配类的模糊匹配算法来实现。 安企CMS 采用的就是关键词匹配 正则模糊匹配双模式进行处理。具体的替换代码如下 具体代码是 GoLang 代码因为 安企CMS 是 Go 语言开发因此代码以 Go 语言为例。 func ReplaceSensitiveWords(content []byte, sensitiveWords []string) []byte {// 如果敏感词库为空或内容为空直接返回if len(sensitiveWords) 0 || len(content) 0 {return content}// 顶一个结构体用于存储替换结果type replaceType struct {Key []byteValue []byte}var replacedMatch []*replaceTypenumCount : 0//忽略所有html标签的属性这是为了防止将标签属性替换成为*导致页面出错reg, _ : regexp.Compile((?i)!?/?[a-z0-9-](\\s[^])?)content reg.ReplaceAllFunc(content, func(s []byte) []byte {key : []byte(fmt.Sprintf({$%d}, numCount))replacedMatch append(replacedMatch, replaceType{Key: key,Value: s,})numCountreturn key})// 替换所有敏感词为星号for _, word : range sensitiveWords {if len(word) 0 {continue}if bytes.Contains(content, []byte(word)) {content bytes.ReplaceAll(content, []byte(word), bytes.Repeat([]byte(*), utf8.RuneCountInString(word)))} else {// 支持正则表达式替换定义正则表达式以{开头}结束如{[1-9]\d{4,10}}if strings.HasPrefix(word, {) strings.HasSuffix(word, }) len(word) 2 {// 移除首尾花括号newWord : word[1 : len(word)-1]re, err : regexp.Compile(newWord)if err nil {content re.ReplaceAll(content, bytes.Repeat([]byte(*), utf8.RuneCountInString(word)))}continue}}}// 将上面忽略的html标签属性还原回来for i : len(replacedMatch) - 1; i 0; i-- {content bytes.Replace(content, replacedMatch[i].Key, replacedMatch[i].Value, 1)}return content }敏感词替换的时机 敏感词替换的可以在以下几种时机下进行 提交实时过滤用户在提交内容时系统会自动检测并过滤敏感词。批量过滤系统定时扫描数据库中的内容对敏感词进行批量过滤。显示时过滤在显示内容的时候系统会自动检测并过滤敏感词。 安企CMS 使用主要使用的是第三种时机方案。在页面渲染的时候系统自动过滤敏感词。这也是为了考虑有不同的数据输入来源以及敏感词库的动态更新在提交时实时过滤的话后来补充的敏感词就无法生效而批量过滤也可能经常因为不及时导致的敏感词失效。因此在显示时过滤处理更严谨一些虽然这么做会牺牲一些性能。 为了实现显示时过滤敏感词安企CMS重写了 ExecuteWriter 输出函数具体的代码如下 func (s *DjangoEngine) ExecuteWriter(w io.Writer, filename string, _ string, bindingData interface{}) error {// 如果开启了debug模式每次渲染的时候重新解析模板。if s.reload {if err : s.LoadStart(true); err ! nil {return err}}ctx : w.(iris.Context)currentSite : provider.CurrentSite(ctx)if tmpl : s.fromCache(currentSite.Id, filename); tmpl ! nil {data, err : tmpl.ExecuteBytes(getPongoContext(bindingData))if err ! nil {return err}// 对data进行敏感词替换data currentSite.ReplaceSensitiveWords(data)buf : bytes.NewBuffer(data)_, err buf.WriteTo(w)return err}// 如果模板不存在返回错误return view2.ErrNotExist{Name: filename, IsLayout: false, Data: bindingData} }以上的敏感词过滤的思路和实践。在实际使用过程中我们应该根据实际需求进行优化和调整。在机器自动过滤的基础上增加人工审核部分内容定期巡查特别是那些容易产生歧义或涉及深度语义分析的内容。 敏感词过滤是一个复杂且动态的过程既需要高效的技术手段也需要灵活应变的策略以适应不断变化的语言环境和政策要求。希望以上内容能帮助到您。
http://www.hkea.cn/news/14407527/

相关文章:

  • wordpress 站点身份微网站建设报价
  • 建设网站有哪些青岛新公司网站建设推广
  • 现在哪个网站可以做外贸柳州团购网站建设
  • 中小企业微网站建设安装完wordpress主题
  • 网站业务员怎么给客户做方案微信开放平台怎么跳过
  • 代写网站莎娜琳官方网站做水
  • 网站建设市场供需分析wordpress 分页 插件
  • 做中东市场哪个网站合适3d溜溜网装修效果图
  • 中国品牌网站建设成都网站建设优惠活动
  • 水果网站源码广西城市建设学校官方网站
  • 广州网站建设哪家公司好wordpress+for+android
  • 设计师导航网站大全做网站公司西安
  • 网站建设公司成就seo运营专员
  • 酷维网站模版wordpress去掉google字体
  • 你了解网站建设吗 软文案例东莞广告公司东莞网站建设价格
  • 怎么建设好一个外贸购物网站东莞手机网站设计公司
  • 一个合格的网站设计4a网站建设公司
  • 网站的基本建设无锡百度竞价
  • 四川网站建设服务公司找方案的网站
  • 建设西安网站获取网站漏洞后下一步怎么做
  • 网站群建设情况河北省招标投标网官网
  • 网站上的qq咨询怎么做天津平台网站建设制作
  • 淘宝客网站做的好的wordpress注册链接修改
  • 企业网站 设计需求优质网站建设在哪里
  • 宁夏城乡建设厅网站wordpress 首页模块
  • 建筑网站建设公司八爪鱼网络网站建设
  • 在网上做贸易哪个网站好谷歌平台推广外贸
  • 天津网站建设 企航互联商洛做网站的公司电话
  • 北京网站制作17页孟津网站建设
  • 设计定制型网站建设沈阳妇科医院排名最好的医院