当前位置:首页 > 知识库 > 正文内容

火车高铁采集器违禁词替换插件

5个月前 (07-01)知识库1293

这段代码运行于火车采集器(高铁采集器)中,主要作用是替换采集到文字内容中的广告违禁词,也可以同于其它作用自行修改即可,测试版本是在高铁采集器的9.8版本中,其它版本未测试。

将以下代码复制出来,粘贴在采集器-内容采集规则-数据处理-高级功能-运行C#代码,中。

替换后的结果是**,代码中的违禁词和结果客自行修改添加,总的来说还是比较简单省事的,如果采集N个站点时更是如有神助,代码会遍历所有关键词。

using System;
using System.Collections.Generic;
using System.Text.RegularExpressions;
using SpiderInterface;

class LocoyCode
{
    public string Run(string content, ResponseEntry response)
    {
        // 定义违禁词库
        var forbiddenWords = new List<string>
        {
            "最佳", "最具", "最赚", "最优秀", "最优", "最大程度", "最大", "最高级", "最高端", "最高", "最多",
            "最奢侈", "最低级", "最低", "最底", "最便宜", "史上最低价", "最流行", "最受欢迎", "最时尚", "最强",
            "最聚拢", "最符合", "最舒适", "最先进", "最先进科学", "最先进加工工艺", "最先享受", "最先",
            "最后一波", "国家级产品", "国家级", "全球级", "宇宙级", "世界级", "顶级工艺", "顶级享受",
            "顶级", "顶尖", "尖端", "领导者", "高级", "极品", "极佳", "绝佳", "绝对", "终极", "极致",
            "首个", "首选", "独家配方", "独家", "首发", "首家", "首次", "首款", "全网", "免检", "填补国内空白",
            "国家品质", "唯一", "NO.1", "TOP.1", "独一无二", "绝无仅有", "一流", "仅此一款", "老字号",
            "特供", "专供", "质量免检", "无需国家质量检测", "免抽检", "机关推荐", "史无前例", "前无古人",
            "永久", "万能", "祖传", "无敌", "高档", "正品", "超赚", "秒杀", "抢爆", "再不抢就没了", "不会再便宜了",
            "错过就没机会了", "万人疯抢", "全民疯抢", "卖疯了", "抢疯了", "免费领", "0首付", "倒计时", "仅限",
            "闪购", "随时结束", "随时涨价", "马上降价", "大牌", "金牌", "名牌", "王牌", "领袖品牌", "创领品牌",
            "领先上市", "世界领先", "遥遥领先", "领先", "领导者", "缔造者", "巨星", "著名", "掌门人", "至尊",
            "巅峰", "奢侈", "优秀", "资深", "领袖", "之王", "王者", "冠军", "完美", "国际品质", "国家领导人",
            "全国第一", "全国首家", "百分百", "最全", "百分之百", "百分之一百", "最高档", "最高端", "宝地",
            "风水宝地", "聚财纳气", "堪舆", "风水", "高贵", "首位", "首席", "首选", "首创", "首次", "首发",
            "招财进宝", "护身", "逢凶化吉", "时来运转", "万事亨通", "抗生素", "激素", "疗效显著", "卓越", "热销"
        };

        // 使用正则表达式替换违禁词
        foreach (var word in forbiddenWords)
        {
            content = Regex.Replace(content, word, "**", RegexOptions.IgnoreCase);
        }

        return content;
    }
}

代码结束

扫描二维码推送至手机访问。

版权声明:本文由康斯网发布,如需转载请注明出处。

本文链接:https://www.ksnet.vip/knowledge/39.html

“火车高铁采集器违禁词替换插件” 的相关文章

修改百度代码为延迟加载,不影响网站加载速度。

修改百度代码为延迟加载,不影响网站加载速度。

有时候百度网站统计代码会影响我们的网站加载速度,尤其是当服务器或虚拟主机带宽小的情况下更是苦不堪言。所以今天对百度网站统计代码下手了,以下是效果截图。首先创建了一个名为loadBaiduStatistics的函数,该函数用于加载百度统计代码。在函数中,创建了一个新的<script>元素,...

网站图片使用懒加载用于提高网站的访问速度

网站图片使用懒加载用于提高网站的访问速度

代码使用方法也及其简单默认的图片在代码中输出的格式是<img src="" alt="">只需要将代码中的src=""修改为data-src=""即可。使用的时候多尝试,在banner或者是Logo出尽量不要...

火车采集器常用正则表达式(高铁采集器正则表达式)

火车采集器常用正则表达式(高铁采集器正则表达式)

匹配一个或者多个连续的空格\s+匹配标题中所有的标点符号[^\w\s\。\?\!\.\?\!]匹配所有带&字面字符,[a-z]匹配大小写&[a-z]+;匹配手机号码带国际区号的、不带国际区号的、带"-"分隔符的等等(\+?86)?1[3-9]\d{1,2}-?\d...

各大银行的SWIFT/BIC代码

各大银行的SWIFT/BIC代码

SWIFT/BIC代码是由Society for Worldwide Interbank Financial Telecommunication(全球银行间金融电信协会,简称SWIFT)定义的一种标准格式的银行标识符代码(Bank Identifier Codes,简称BIC)。SWIFT代码也被称...

腾讯,搜狐,百度,IP地址查询服务的API接口

腾讯,搜狐,百度,IP地址查询服务的API接口

1. 腾讯 IP 地址查询 API:   - 接口地址: https://apis.map.qq.com/ws/location/v1/ip   - 示例请求: https://apis.map.qq.com/ws/location/v1/ip?ip=YOUR...