0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

反爬蟲(chóng)組件kk-anti-reptile的工作流程與使用方法

Android編程精選 ? 來(lái)源:oschina開(kāi)源中國(guó) ? 作者:凱京技術(shù)團(tuán)隊(duì) ? 2022-07-14 11:24 ? 次閱讀

kk-anti-reptile 是適用于基于spring-boot開(kāi)發(fā)的分布式系統(tǒng)的反爬蟲(chóng)組件

系統(tǒng)要求

  • 基于 spring-boot 開(kāi)發(fā) (spring-boot1.x, spring-boot2.x 均可)
  • 需要使用 redis

工作流程

kk-anti-reptile 使用基于 Servlet 規(guī)范的的 Filter 對(duì)請(qǐng)求進(jìn)行過(guò)濾,在其內(nèi)部通過(guò) spring-boot 的擴(kuò)展點(diǎn)機(jī)制,實(shí)例化一個(gè) Filter,并注入到 Spring 容器 FilterRegistrationBean 中,通過(guò) Spring 注入到 Servlet 容器中,從而實(shí)現(xiàn)對(duì)請(qǐng)求的過(guò)濾

kk-anti-reptile 的過(guò)濾 Filter 內(nèi)部,又通過(guò)責(zé)任鏈模式,將各種不同的過(guò)濾規(guī)則織入,并提供抽象接口,可由調(diào)用方進(jìn)行規(guī)則擴(kuò)展

Filter 調(diào)用則鏈進(jìn)行請(qǐng)求過(guò)濾,如過(guò)濾不通過(guò),則攔截請(qǐng)求,返回狀態(tài)碼 509,并輸出驗(yàn)證碼輸入頁(yè)面,輸出驗(yàn)證碼正確后,調(diào)用過(guò)濾規(guī)則鏈對(duì)規(guī)則進(jìn)行重置

目前規(guī)則鏈中有如下兩個(gè)規(guī)則

ip-rule

ip-rule 通過(guò)時(shí)間窗口統(tǒng)計(jì)當(dāng)前時(shí)間窗口內(nèi)請(qǐng)求數(shù),小于規(guī)定的最大請(qǐng)求數(shù)則可通過(guò),否則不通過(guò)。時(shí)間窗口、最大請(qǐng)求數(shù)、ip 白名單等均可配置

ua-rule

ua-rule 通過(guò)判斷請(qǐng)求攜帶的 User-Agent,得到操作系統(tǒng)、設(shè)備信息、瀏覽器信息等,可配置各種維度對(duì)請(qǐng)求進(jìn)行過(guò)濾

命中規(guī)則后

命中爬蟲(chóng)和防盜刷規(guī)則后,會(huì)阻斷請(qǐng)求,并生成接除阻斷的驗(yàn)證碼,驗(yàn)證碼有多種組合方式,如果客戶端可以正確輸入驗(yàn)證碼,則可以繼續(xù)訪問(wèn)

edcad0ee-02a0-11ed-ba43-dac502259ad0.png

驗(yàn)證碼有中文、英文字母 + 數(shù)字、簡(jiǎn)單算術(shù)三種形式,每種形式又有靜態(tài)圖片和 GIF 動(dòng)圖兩種圖片格式,即目前共有如下六種,所有類型的驗(yàn)證碼會(huì)隨機(jī)出現(xiàn),目前技術(shù)手段識(shí)別難度極高,可有效阻止防止爬蟲(chóng)大規(guī)模爬取數(shù)據(jù)

接入使用

后端接入非常簡(jiǎn)單,只需要引用 kk-anti-reptile 的 maven 依賴,并配置啟用 kk-anti-reptile 即可

加入 maven 依賴

<dependency>
<groupId>cn.keking.projectgroupId>
<artifactId>kk-anti-reptileartifactId>
<version>1.0.0-SNAPSHOTversion>
dependency>

配置啟用 kk-anti-reptile

anti.reptile.manager.enabled=true

前端需要在統(tǒng)一發(fā)送請(qǐng)求的 ajax 處加入攔截,攔截到請(qǐng)求返回狀態(tài)碼 509 后彈出一個(gè)新頁(yè)面,并把響應(yīng)內(nèi)容轉(zhuǎn)出到頁(yè)面中,然后向頁(yè)面中傳入后端接口 baseUrl 參數(shù)即可,以使用 axios 請(qǐng)求為例:

importaxiosfrom'axios';
import{baseUrl}from'./config';

axios.interceptors.response.use(
data=>{
returndata;
},
error=>{
if(error.response.status===509){
lethtml=error.response.data;
letverifyWindow=window.open("","_blank","height=400,width=560");
verifyWindow.document.write(html);
verifyWindow.document.getElementById("baseUrl").value=baseUrl;
}
}
);

exportdefaultaxios;

注意

1.apollo-client 需啟用 bootstrap

使用 apollo 配置中心的用戶,由于組件內(nèi)部用到 @ConditionalOnProperty,要在 application.properties/bootstrap.properties 中加入如下樣例配置,(apollo-client 需要 0.10.0 及以上版本)詳見(jiàn) apollo bootstrap 說(shuō)明

https://github.com/apolloconfig/apollo/wiki/

apollo.bootstrap.enabled=true

2.需要有 Redisson 連接

如果項(xiàng)目中有用到 Redisson,kk-anti-reptile 會(huì)自動(dòng)獲取 RedissonClient 實(shí)例對(duì)象;如果沒(méi)用到,需要在配置文件加入如下 Redisson 連接相關(guān)配置

spring.redisson.address=redis://192.168.1.204:6379
spring.redisson.password=xxx

配置一覽表

在 spring-boot 中,所有配置在配置文件都會(huì)有自動(dòng)提示和說(shuō)明,如下圖

ee18666a-02a0-11ed-ba43-dac502259ad0.png

所有配置都以 anti.reptile.manager 為前綴,如下為所有配置項(xiàng)及說(shuō)明

ee362632-02a0-11ed-ba43-dac502259ad0.png

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • spring
    +關(guān)注

    關(guān)注

    0

    文章

    335

    瀏覽量

    14277
  • 分布式系統(tǒng)
    +關(guān)注

    關(guān)注

    0

    文章

    145

    瀏覽量

    19181
  • 爬蟲(chóng)
    +關(guān)注

    關(guān)注

    0

    文章

    82

    瀏覽量

    6801

原文標(biāo)題:一個(gè)依賴搞定 Spring Boot 反爬蟲(chóng),防止接口盜刷!

文章出處:【微信號(hào):AndroidPush,微信公眾號(hào):Android編程精選】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    幫忙分析下這個(gè)設(shè)計(jì)的工作流程

    你好我是單片機(jī)學(xué)習(xí)的菜鳥(niǎo)能不能幫我分析一下一下設(shè)計(jì)的工作流程各個(gè)器件的工作原理
    發(fā)表于 12-07 11:06

    求講解這個(gè)電路具體使用方法步驟和工作流程

    這個(gè)圖特別簡(jiǎn)單,可是我這個(gè)初學(xué)者完全蒙圈了,只知道是4×4矩陣通過(guò)單片機(jī)控制數(shù)字電位器實(shí)現(xiàn)自動(dòng)化功能,4×4矩陣連接的是單片機(jī)1.0–1.7接口,中斷接口int0int1接的是四個(gè)并聯(lián)數(shù)字電位器的inc和u/d口,具體工作流程不明白,求助講解電路的具體使用方法步驟和應(yīng)用軟
    發(fā)表于 04-26 16:01

    AndroidWifi工作流程

    AndroidWifi工作流程
    發(fā)表于 11-02 10:52

    AndroidWifi工作流程

    AndroidWifi工作流程
    發(fā)表于 09-25 11:17

    AndroidWifi工作流程

    AndroidWifi工作流程
    發(fā)表于 11-08 09:07

    Crawler:關(guān)于爬蟲(chóng)的簡(jiǎn)介、安裝、使用方法之詳細(xì)攻略

    Crawler:關(guān)于爬蟲(chóng)的簡(jiǎn)介、安裝、使用方法之詳細(xì)攻略
    發(fā)表于 12-19 16:58

    Simulink是什么?Simulink的工作流程是怎樣進(jìn)行的?

    Simulink是什么?Simulink有哪些功能?如何去使用Simulink?Simulink的工作流程是怎樣進(jìn)行的?
    發(fā)表于 07-09 06:16

    AS068工作流程是怎樣的?

    AS068工作流程是怎樣的?
    發(fā)表于 12-07 08:02

    工作流環(huán)境下組件的開(kāi)發(fā)

    本文基于對(duì)工作流環(huán)境下組件的開(kāi)發(fā)為目的,采用工作流技術(shù)與組件技術(shù)相結(jié)合的方法,討論構(gòu)建工作流
    發(fā)表于 12-17 11:01 ?0次下載
    <b class='flag-5'>工作流</b>環(huán)境下<b class='flag-5'>組件</b>的開(kāi)發(fā)

    測(cè)試工程師工作流程有哪些

    測(cè)試工程師的工作流程,與公司的整體工作流程,項(xiàng)目的測(cè)試要求等因素相關(guān)。本文主要討論測(cè)試工程師的一般工作流程。
    的頭像 發(fā)表于 10-03 16:56 ?7627次閱讀

    雷電的4K工作流程

    在4K的雷電工作流程
    的頭像 發(fā)表于 05-31 11:20 ?2354次閱讀

    網(wǎng)絡(luò)爬蟲(chóng)的基本工作流程

    通用網(wǎng)絡(luò)爬蟲(chóng)根據(jù)預(yù)先設(shè)定的一個(gè)或若干初始種子URL開(kāi)始,以此獲得初始網(wǎng)頁(yè)上的URL列表,在爬行過(guò)程中不斷從URL隊(duì)列中獲一個(gè)的URL,進(jìn)而訪問(wèn)并下載該頁(yè)面。頁(yè)面下載后頁(yè)面解析器去掉頁(yè)面上的HTML
    的頭像 發(fā)表于 03-21 17:05 ?2.8w次閱讀

    工作流程圖怎么用?有哪些繪制工作流程圖的軟件

    工作流程圖是清晰地展示工作中各個(gè)環(huán)節(jié)的流程圖圖示,主要用于工作活動(dòng)和效率的管理。工作流程圖這種圖示方法
    的頭像 發(fā)表于 07-28 14:22 ?3462次閱讀

    機(jī)器視覺(jué)系統(tǒng)的組成及工作流程

    機(jī)器視覺(jué)系統(tǒng)的組成及工作流程介紹。
    發(fā)表于 04-19 15:24 ?16次下載

    提高電氣工作流程效率的方法

    在電氣工作領(lǐng)域,有很多空間可以提高您的工作流程效率。在本文中,我們將了解如何做到這一點(diǎn)。 在電氣工作領(lǐng)域,有無(wú)數(shù)種方法可以提高你的表現(xiàn)。你需要計(jì)劃好你將如何進(jìn)行這項(xiàng)任務(wù)——并考慮到任務(wù)
    的頭像 發(fā)表于 07-27 16:04 ?1945次閱讀