0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通過Java語(yǔ)言實(shí)現(xiàn)敏感詞過濾器軟件的設(shè)計(jì)

電子設(shè)計(jì) ? 作者:電子設(shè)計(jì) ? 2018-10-02 13:02 ? 次閱讀

良好的網(wǎng)絡(luò)文化對(duì)培養(yǎng)青少年的愛國(guó)意識(shí)、創(chuàng)新精神、促進(jìn)青少年良好的個(gè)性發(fā)展以及文化學(xué)習(xí)等方面都有積極的作用。但是網(wǎng)絡(luò)文化中混雜著種種不良因素,對(duì)青少年造成許多負(fù)面影響:網(wǎng)絡(luò)中的不健康內(nèi)容不利于青少年的成長(zhǎng),甚至造成許多青少年犯罪行為的不斷發(fā)生;網(wǎng)絡(luò)世界的虛擬性還會(huì)造成青少年對(duì)現(xiàn)實(shí)社會(huì)的不滿,青少年對(duì)網(wǎng)絡(luò)世界的過分迷戀會(huì)導(dǎo)致網(wǎng)絡(luò)孤獨(dú),網(wǎng)絡(luò)中多元化的內(nèi)容會(huì)導(dǎo)致青少年認(rèn)識(shí)偏差,網(wǎng)絡(luò)的隱匿性容易使青少年道德弱化[1].特別令人擔(dān)憂的是不良的網(wǎng)絡(luò)文化對(duì)青少年的犯罪起著推動(dòng)作用,值得全社會(huì)關(guān)注和重視。

本文提出了一種敏感詞過濾器軟件的設(shè)計(jì),對(duì)網(wǎng)絡(luò)中不良的內(nèi)容進(jìn)行查找、發(fā)現(xiàn),避免這些不良網(wǎng)絡(luò)文化侵蝕青少年的心靈健康。

1 敏感詞過濾器的設(shè)計(jì)原理

敏感詞過濾器的原理圖如圖1所示。其原理如下:(1)對(duì)敏感詞庫(kù)的內(nèi)容進(jìn)行分割,把敏感詞庫(kù)中所有的敏感詞或詞組分開,并把這些敏感詞或詞組存入數(shù)組中;(2)將待測(cè)文件庫(kù)中的文件進(jìn)行逐個(gè)讀取,并記錄文件的內(nèi)容;(3)在待測(cè)文件中查找是否存在剛存放敏感詞或臟詞組內(nèi)容的數(shù)組里面的內(nèi)容,如果有,進(jìn)行標(biāo)注等操作;如果沒有,繼續(xù)檢查待測(cè)文件庫(kù)中的下一個(gè)待測(cè)文件,直到待測(cè)文件庫(kù)中的待測(cè)文件都被檢查完為止;(4)輸出結(jié)果。即輸出待測(cè)文件庫(kù)中每個(gè)待測(cè)文件中包含敏感詞或臟詞組的個(gè)數(shù)及出處等信息。

2 算法實(shí)現(xiàn)

軟件開發(fā)環(huán)境:myeclipse平臺(tái),Java語(yǔ)言。首先以myeclipse平臺(tái)新建一個(gè)java project,在新建的project中需要導(dǎo)入下面相關(guān)文件:

import java.io.BufferedReader;

import java.io.File;

import java.io.FileNotFoundException;

import java.io.FileReader;

import java.io.IOException;

import java.io.InputStreamReader;

import java.util.StringTokenizer;

過濾器軟件中main函數(shù)的主要內(nèi)容如下:

public static void main(String[] args) {

BufferedReader br=new BufferedReader(new InputStreamReader(System.in));

String ans=null;

int cnt=0;//字庫(kù)中關(guān)鍵詞個(gè)數(shù)

int number=0;//敏感詞出現(xiàn)次數(shù)

String filepath=“D:\\敏感詞待測(cè)文件庫(kù)”;

//待檢測(cè)文件路徑,此文件夾下可以放若干個(gè)待檢測(cè)的文件

String fileLibrarypath=“D:\\敏感詞典\\file.txt”;

//敏感詞庫(kù)文件的存放路徑

File file = new File(filepath);

try {

//讀入用戶輸入的回車鍵信息

System.out.println(“請(qǐng)按回車鍵,查看過濾信息:”);

String str = null;

str = br.readLine();

if (str != null) {

if (!file.isDirectory()) {

System.out.println(“待檢測(cè)文件路徑

不對(duì),請(qǐng)修改路徑?!保?/p>

} else if (file.isDirectory()) {

ans=getcontent(fileLibrarypath);

int k;

StringTokenizer sst=new

StringTokenizer(ans, “|”);

k = sst.countTokens();

String[] record = new String[k];

while (sst.hasMoreElements()) {

record[cnt] = sst.nextToken();

cnt++;

}

String[] filelist = file.list();

for (int i = 0, flen = filelist.length; i

< flen; i++){

String temp = filepath +

“\\” + filelist[i];

number = searchkeyword(record,

cnt, temp);

System.out.println(“第”+(i+1) +“文件中敏感詞出現(xiàn)的次數(shù):” + number);

//字庫(kù)中關(guān)鍵詞個(gè)數(shù)

}

} else {

//提示用戶按回車鍵

System.out.println(“你還沒有輸入回

車鍵信息”);

}

}

} catch (IOException e) {

e.printStackTrace();

}

//輸出查詢結(jié)果

if (ans != null) {

System.out.println(“字庫(kù)中關(guān)鍵詞個(gè)數(shù):”+ cnt);//字庫(kù)中關(guān)鍵詞個(gè)數(shù)

System.out.println(“敏感詞庫(kù)內(nèi)容如下:”+ ans);

} else {

System.out.println(“沒有可以匹配的信息”);

//輸出敏感詞庫(kù)中的內(nèi)容

}

}

//得到指定路徑文件中的內(nèi)容

private static String getcontent(String filepath) {

String all = “”;

File file = new File(filepath);

try {

if (!file.isFile()) {

System.out.println(“文件路徑不對(duì),請(qǐng)修改路徑”);

} else {

File readfile = new File(filepath);

BufferedReader br = new BufferedReader(new FileReader(readfile));

String ss = br.readLine();

while (ss != null) {

all = all + ss;

//all中存放讀取的文件內(nèi)容信息

ss = br.readLine();

}

}

} catch (FileNotFoundException e) {

e.printStackTrace();

} catch (IOException e) {

e.printStackTrace();

}

return all;

}

//在待測(cè)文件中匹配敏感詞出現(xiàn)的次數(shù)

private static int searchkeyword(String[] str, int cnt, String filepath){

int number = 0;

String s = “”;

s = getcontent(filepath);

for (int i = 0; i < cnt; i++) {

if (s.indexOf(str[i]) > -1) {

number++;

}

}

return number;

}

至此,完成了敏感詞過濾器軟件代碼的編寫工作,接下來(lái)可以進(jìn)行run操作,即可以得到待測(cè)文件庫(kù)中的待測(cè)文件包含敏感詞次數(shù)及出處等相關(guān)信息的結(jié)果。

3 實(shí)驗(yàn)結(jié)果分析

敏感詞庫(kù)的存放路徑:D:\敏感詞典\file.txt;敏感詞庫(kù)文件中的內(nèi)容略。

待測(cè)文件庫(kù)的存放路徑:D:\敏感詞待測(cè)文件庫(kù);文件庫(kù)中存放了三個(gè)文件,分別為:test1.txt、test2.txt、test3.txt.

運(yùn)行該過濾器軟件后,得出的檢測(cè)結(jié)果如圖2所示。

由圖可以看到把待測(cè)文件中敏感詞及臟詞組出現(xiàn)的次數(shù)全部顯示出來(lái),結(jié)果與實(shí)際情況完全一致。

本文設(shè)計(jì)的敏感詞過濾器軟件,已在myeclipse環(huán)境下通過Java語(yǔ)言實(shí)現(xiàn),并對(duì)整個(gè)過濾器軟件進(jìn)行了測(cè)試,測(cè)試結(jié)果顯示該設(shè)計(jì)完全可以達(dá)到對(duì)網(wǎng)頁(yè)文件中的敏感詞進(jìn)行過濾,還能指出這些敏感詞的數(shù)目及其出處。為網(wǎng)絡(luò)管理員的管理帶來(lái)方便,并給網(wǎng)絡(luò)管理方面的編程人員提供了一個(gè)良好的開發(fā)平臺(tái)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • JAVA
    +關(guān)注

    關(guān)注

    19

    文章

    2948

    瀏覽量

    104380
  • 過濾器
    +關(guān)注

    關(guān)注

    1

    文章

    425

    瀏覽量

    19490
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    CN過濾器原理

    CN過濾器原理 CN過濾器采用整體玻璃鋼,耐酸耐堿,一般耐溫65℃。內(nèi)部裝有約半米高的懸浮介質(zhì)層。懸浮過濾介質(zhì)為1-2mm小球,采用高分子材料加工,密度大約
    發(fā)表于 02-25 15:00 ?26次下載

    基于值域二次哈希方法的布魯姆過濾器

    本文針對(duì)擴(kuò)展式布魯姆過濾器(EBF)內(nèi)存消耗過大,提出一種基于值域哈希二次過濾的布魯姆過濾器數(shù)據(jù)結(jié)構(gòu)(VHBF)和相關(guān)算法,VHBF通過在布魯姆過濾
    發(fā)表于 02-26 13:45 ?12次下載

    過濾器的作用

    本視頻主要詳細(xì)介紹了過濾器的作用,分別是濾速高、過濾效果好;強(qiáng)度高、耐腐蝕;靜電作用;過濾物質(zhì);攔截;其次介紹了水龍頭過濾器的作用,最后介紹了活性炭
    的頭像 發(fā)表于 12-12 16:23 ?4.4w次閱讀

    解密高效空氣過濾器的性能及要求

    量大燈特點(diǎn)。 高效過濾器按結(jié)構(gòu)主要分為:有隔板高效過濾器、無(wú)隔板高效過濾器、組合式高效過濾器。 產(chǎn)品關(guān)鍵:高效
    發(fā)表于 03-19 14:56 ?2006次閱讀

    創(chuàng)新陶瓷過濾器解決方案

    創(chuàng)新陶瓷過濾器解決方案
    發(fā)表于 10-27 14:56 ?16次下載

    絲扣Y過濾器

    絲扣Y過濾器是Y過濾器的一種,普通濾材是不銹鋼或者碳鋼,濾芯普通帶有不銹鋼骨架。 絲扣Y形過濾器有時(shí)也叫做·不銹鋼內(nèi)螺紋Y過濾器。? ? 特性: ? 1.絲扣Y形
    的頭像 發(fā)表于 08-13 17:24 ?4049次閱讀

    絲扣Y過濾器過濾器測(cè)試原理簡(jiǎn)介

    絲扣Y過濾器是Y過濾器的一種,普通濾材是不銹鋼或者碳鋼,濾芯普通帶有不銹鋼骨架。 絲扣Y形過濾器有時(shí)也叫做·不銹鋼內(nèi)螺紋Y過濾器。? 特性: 1.絲扣Y形
    發(fā)表于 09-05 09:27 ?2479次閱讀

    絲扣Y形過濾器

    絲扣Y形過濾器是保送介質(zhì)管道上不可短少的一種安裝,通常裝置在減壓閥、泄壓閥、定水位閥或其它設(shè)備的進(jìn)口端,用來(lái)消弭介質(zhì)中的雜質(zhì),以維護(hù)閥門及設(shè)備的正常運(yùn)用。 絲扣Y形過濾器有時(shí)也叫做·不銹鋼內(nèi)螺紋Y
    的頭像 發(fā)表于 10-24 15:03 ?3737次閱讀

    漢克森過濾器系列介紹

    漢克森過濾器 【1】國(guó)產(chǎn)品牌濾芯均為我司生產(chǎn)的替代原廠品牌濾芯,其過濾濾材采用德國(guó)原裝進(jìn)口HV公司產(chǎn)品,注冊(cè)商標(biāo)為“佳潔”牌。本公司涉及的其它品牌均無(wú)品牌意義,只是作為產(chǎn)品型號(hào)參照和客戶選型對(duì)照
    發(fā)表于 03-01 08:53 ?1057次閱讀
    漢克森<b class='flag-5'>過濾器</b>系列介紹

    過濾器藥液過濾器濾除率測(cè)試儀

    過濾器藥液過濾器濾除率測(cè)試儀
    的頭像 發(fā)表于 03-09 14:53 ?777次閱讀
    <b class='flag-5'>過濾器</b>藥液<b class='flag-5'>過濾器</b>濾除率測(cè)試儀

    過濾器模式是指什么?

    過濾器模式是指通過構(gòu)造一系列不同的標(biāo)準(zhǔn)實(shí)現(xiàn)類,通過這些標(biāo)準(zhǔn)實(shí)現(xiàn)類把目標(biāo)對(duì)象(通常是多個(gè))按照對(duì)應(yīng)的標(biāo)準(zhǔn)進(jìn)行
    的頭像 發(fā)表于 06-01 14:32 ?1343次閱讀
    <b class='flag-5'>過濾器</b>模式是指什么?

    貝騰過濾器濾芯

    貝騰過濾器濾芯
    的頭像 發(fā)表于 04-11 15:09 ?973次閱讀
    貝騰<b class='flag-5'>過濾器</b>濾芯

    殺菌過濾器 滅菌過濾器 除菌過濾器

    殺菌過濾器 滅菌過濾器 除菌過濾器
    的頭像 發(fā)表于 03-03 14:03 ?2395次閱讀
    殺菌<b class='flag-5'>過濾器</b> 滅菌<b class='flag-5'>過濾器</b> 除菌<b class='flag-5'>過濾器</b>

    springboot過濾器和攔截器哪個(gè)先執(zhí)行

    Spring Boot是一個(gè)用于構(gòu)建Java應(yīng)用程序的開發(fā)框架,它提供了許多功能和工具來(lái)簡(jiǎn)化開發(fā)和部署過程。其中兩個(gè)重要的功能是過濾器和攔截器。本文將詳細(xì)介紹Spring Boot過濾器和攔截器
    的頭像 發(fā)表于 12-03 15:00 ?2267次閱讀

    前置過濾器的使用壽命有多長(zhǎng)?

    前置過濾器的使用壽命有多長(zhǎng)? 前置過濾器的使用壽命有多長(zhǎng),這是一個(gè)相對(duì)而言的概念,因?yàn)樗氖褂脡勖Q于多個(gè)因素。下面將詳細(xì)介紹前置過濾器的使用壽命以及影響因素。 一、什么是前置過濾器
    的頭像 發(fā)表于 12-11 11:38 ?1024次閱讀