नेटवर्क प्याकेट ब्रोकरमा डाटा मास्किङ टेक्नोलोजी र समाधान के हो?

1. डाटा मास्किङ को अवधारणा

डाटा मास्किङलाई डाटा मास्किङ पनि भनिन्छ। हामीले मास्किङ नियम र नीतिहरू दिएका बेला मोबाइल फोन नम्बर, बैंक कार्ड नम्बर र अन्य जानकारी जस्ता संवेदनशील डेटालाई रूपान्तरण, परिमार्जन वा कभर गर्ने यो प्राविधिक विधि हो। यो प्रविधि मुख्यतया संवेदनशील डेटालाई अविश्वसनीय वातावरणमा प्रयोग हुनबाट रोक्नको लागि प्रयोग गरिन्छ।

डाटा मास्किङ सिद्धान्त: डाटा मास्किङले मूल डाटा विशेषताहरू, व्यापार नियमहरू, र डाटा सान्दर्भिकता कायम राख्नुपर्छ कि पछिको विकास, परीक्षण, र डाटा विश्लेषण मास्किङबाट प्रभावित हुनेछैन। मास्क गर्नु अघि र पछि डाटा स्थिरता र वैधता सुनिश्चित गर्नुहोस्।

2. डाटा मास्किङ वर्गीकरण

डाटा मास्किङलाई स्थिर डाटा मास्किङ (SDM) र डायनामिक डाटा मास्किङ (DDM) मा विभाजन गर्न सकिन्छ।

स्थिर डाटा मास्किङ (SDM): स्थिर डाटा मास्किङलाई उत्पादन वातावरणबाट अलगावको लागि नयाँ गैर-उत्पादन वातावरण डाटाबेसको स्थापना आवश्यक छ। संवेदनशील डाटा उत्पादन डाटाबेसबाट निकालिन्छ र त्यसपछि गैर-उत्पादन डाटाबेसमा भण्डारण गरिन्छ। यसरी, डिसेन्सिटाइज्ड डाटा उत्पादन वातावरणबाट अलग हुन्छ, जसले व्यापार आवश्यकताहरू पूरा गर्दछ र उत्पादन डाटाको सुरक्षा सुनिश्चित गर्दछ।

SDM

डायनामिक डाटा मास्किङ (DDM): यो सामान्यतया उत्पादन वातावरणमा वास्तविक समयमा संवेदनशील डेटा desensitize गर्न प्रयोग गरिन्छ। कहिलेकाहीँ, विभिन्न परिस्थितिहरूमा एउटै संवेदनशील डेटा पढ्नको लागि विभिन्न स्तरको मास्किङ आवश्यक हुन्छ। उदाहरणका लागि, विभिन्न भूमिका र अनुमतिहरूले विभिन्न मास्किङ योजनाहरू लागू गर्न सक्छन्।

DDM

डाटा रिपोर्टिङ र डाटा उत्पादन मास्किङ आवेदन

त्यस्ता परिदृश्यहरूमा मुख्यतया आन्तरिक डेटा निगरानी उत्पादनहरू वा बिलबोर्ड, बाह्य सेवा डेटा उत्पादनहरू, र डेटा विश्लेषणमा आधारित रिपोर्टहरू, जस्तै व्यापार रिपोर्टहरू र परियोजना समीक्षाहरू समावेश हुन्छन्।

डाटा रिपोर्टिङ उत्पादन मास्किङ

3. डाटा मास्किङ समाधान

सामान्य डाटा मास्किङ योजनाहरू समावेश छन्: अमान्यकरण, अनियमित मान, डाटा प्रतिस्थापन, सिमेट्रिक इन्क्रिप्शन, औसत मूल्य, अफसेट र राउन्डिङ, आदि।

अमान्यता: अमान्यकरणले संवेदनशील डेटाको इन्क्रिप्सन, काट्ने वा लुकाउने कार्यलाई जनाउँछ। यो योजनाले सामान्यतया वास्तविक डेटालाई विशेष प्रतीकहरू (जस्तै *) ले बदल्छ। अपरेशन सरल छ, तर प्रयोगकर्ताहरूले मूल डाटाको ढाँचा जान्न सक्दैनन्, जसले पछिल्ला डाटा अनुप्रयोगहरूलाई असर गर्न सक्छ।

अनियमित मूल्य: अनियमित मानले संवेदनशील डेटाको अनियमित प्रतिस्थापनलाई जनाउँछ (संख्याहरूले अंकहरू प्रतिस्थापन गर्दछ, अक्षरहरूले अक्षरहरू प्रतिस्थापन गर्दछ, र वर्णहरूले वर्णहरू प्रतिस्थापन गर्दछ)। यो मास्किङ विधिले केही हदसम्म संवेदनशील डाटाको ढाँचा सुनिश्चित गर्नेछ र त्यसपछिको डाटा अनुप्रयोगलाई सहज बनाउँछ। मानिसहरू र ठाउँहरूको नाम जस्ता अर्थपूर्ण शब्दहरूको लागि मास्किङ शब्दकोशहरू आवश्यक हुन सक्छ।

डाटा प्रतिस्थापन: डाटा प्रतिस्थापन शून्य र अनियमित मानहरूको मास्किङ जस्तै हो, विशेष क्यारेक्टरहरू वा अनियमित मानहरू प्रयोग गर्नुको सट्टा, मास्किङ डेटालाई विशेष मानसँग प्रतिस्थापन गरिन्छ।

सिमेट्रिक एन्क्रिप्शन: सिमेट्रिक इन्क्रिप्सन एक विशेष उल्टाउन मिल्ने मास्किङ विधि हो। यसले एन्क्रिप्शन कुञ्जीहरू र एल्गोरिदमहरू मार्फत संवेदनशील डाटा इन्क्रिप्ट गर्दछ। सिफरटेक्स्ट ढाँचा तार्किक नियमहरूमा मूल डाटासँग मिल्दोजुल्दो छ।

औसत: औसत योजना प्रायः सांख्यिकीय परिदृश्यहरूमा प्रयोग गरिन्छ। संख्यात्मक डेटाको लागि, हामी पहिले तिनीहरूको औसत गणना गर्छौं, र त्यसपछि अनियमित रूपमा औसतको वरिपरि असंवेदनशील मानहरू वितरण गर्छौं, यसरी डेटाको योगलाई स्थिर राख्छौं।

अफसेट र राउन्डिङ: यो विधिले डिजिटल डाटालाई अनियमित शिफ्टद्वारा परिवर्तन गर्छ। अफसेट राउन्डिङले डेटाको सुरक्षा कायम राख्दा दायराको अनुमानित प्रामाणिकता सुनिश्चित गर्दछ, जुन अघिल्लो योजनाहरू भन्दा वास्तविक डेटाको नजिक छ, र ठूलो डेटा विश्लेषणको परिदृश्यमा ठूलो महत्त्व छ।

ML-NPB-5660-数据脱敏

सिफारिश मोडेल "ML-NPB-5660"डेटा मास्किङको लागि

4. सामान्यतया प्रयोग हुने डाटा मास्किङ प्रविधिहरू

(१)। सांख्यिकीय प्रविधिहरू

डाटा नमूना र डाटा एकत्रीकरण

- डेटा नमूना: डेटा सेटको प्रतिनिधि उपसमूह चयन गरेर मूल डेटा सेटको विश्लेषण र मूल्याङ्कन डि-पहिचान प्रविधिहरूको प्रभावकारिता सुधार गर्न महत्त्वपूर्ण विधि हो।

- डाटा एग्रिगेसन: माइक्रोडेटामा विशेषताहरूमा लागू गरिएको तथ्याङ्कीय प्रविधिहरू (जस्तै, गणना, औसत, अधिकतम र न्यूनतम) को सङ्कलनको रूपमा, नतिजा मूल डेटा सेटमा भएका सबै रेकर्डहरूको प्रतिनिधि हो।

(२)। क्रिप्टोग्राफी

क्रिप्टोग्राफी डिसेन्सिटाइजेशनको प्रभावकारिता बढाउन वा बढाउने एक सामान्य विधि हो। विभिन्न प्रकारका ईन्क्रिप्शन एल्गोरिदमहरूले विभिन्न डिसेन्सिटाइजेसन प्रभावहरू प्राप्त गर्न सक्छन्।

- निर्धारक इन्क्रिप्शन: एक गैर-यादृच्छिक सममित इन्क्रिप्शन। यसले सामान्यतया आईडी डेटा प्रशोधन गर्छ र आवश्यक पर्दा सिफरटेक्स्टलाई मूल आईडीमा डिक्रिप्ट र पुनर्स्थापना गर्न सक्छ, तर कुञ्जीलाई राम्ररी सुरक्षित गर्न आवश्यक छ।

- अपरिवर्तनीय एन्क्रिप्शन: ह्यास प्रकार्य डाटा प्रक्रिया गर्न प्रयोग गरिन्छ, जुन सामान्यतया आईडी डाटाको लागि प्रयोग गरिन्छ। यसलाई प्रत्यक्ष रूपमा डिक्रिप्ट गर्न सकिँदैन र म्यापिङ सम्बन्ध बचत हुनुपर्छ। साथै, ह्यास प्रकार्य को विशेषता को कारण, डाटा टक्कर हुन सक्छ।

- होमोमोर्फिक एन्क्रिप्शन: सिफरटेक्स्ट होमोमोर्फिक एल्गोरिथ्म प्रयोग गरिन्छ। यसको विशेषता भनेको सिफरटेक्स्ट अपरेशनको नतिजा डिक्रिप्शन पछि प्लेनटेक्स्ट अपरेशनको जस्तै हो। यसैले, यो सामान्यतया संख्यात्मक क्षेत्रहरू प्रशोधन गर्न प्रयोग गरिन्छ, तर यो व्यापक रूपमा प्रदर्शन कारणहरूको लागि प्रयोग गरिएको छैन।

(३)। प्रणाली प्रविधि

दमन टेक्नोलोजीले गोपनीयता सुरक्षा पूरा नगर्ने डेटा वस्तुहरू मेटाउँछ वा ढाल्छ, तर तिनीहरूलाई प्रकाशित गर्दैन।

- मास्किङ: यसले विशेषता मान मास्क गर्नको लागि सबैभन्दा सामान्य डिसेन्सिटाइजेसन विधिलाई जनाउँछ, जस्तै विपक्षी नम्बर, आईडी कार्डलाई तारा चिन्हले चिन्ह लगाइएको छ, वा ठेगाना काटिएको छ।

- स्थानीय दमन: विशिष्ट विशेषता मानहरू (स्तम्भहरू) मेटाउने प्रक्रियालाई बुझाउँछ, गैर-आवश्यक डेटा क्षेत्रहरू हटाउने;

- रेकर्ड दमन: विशिष्ट रेकर्डहरू (पङ्क्तिहरू) मेटाउने प्रक्रियालाई बुझाउँछ, गैर-आवश्यक डेटा रेकर्डहरू मेटाउने।

(४)। उपनाम टेक्नोलोजी

स्यूडोम्यानिङ एक डि-पहिचान प्रविधि हो जसले प्रत्यक्ष पहिचानकर्ता (वा अन्य संवेदनशील पहिचानकर्ता) लाई प्रतिस्थापन गर्न छद्म नाम प्रयोग गर्दछ। छद्म नाम प्रविधिहरूले प्रत्यक्ष वा संवेदनशील पहिचानकर्ताहरूको सट्टा प्रत्येक व्यक्तिगत जानकारी विषयको लागि अद्वितीय पहिचानकर्ताहरू सिर्जना गर्दछ।

- यसले मूल आईडीसँग मेल खाने, म्यापिङ तालिका बचत गर्न र म्यापिङ तालिकामा पहुँचलाई कडाइका साथ नियन्त्रण गर्न स्वतन्त्र रूपमा अनियमित मानहरू उत्पन्न गर्न सक्छ।

- तपाईंले छद्म नामहरू उत्पादन गर्न इन्क्रिप्शन पनि प्रयोग गर्न सक्नुहुन्छ, तर डिक्रिप्शन कुञ्जी ठीकसँग राख्न आवश्यक छ;

यो प्रविधि धेरै संख्यामा स्वतन्त्र डाटा प्रयोगकर्ताहरूको मामलामा व्यापक रूपमा प्रयोग गरिन्छ, जस्तै खुला प्लेटफर्म परिदृश्यमा OpenID, जहाँ विभिन्न विकासकर्ताहरूले एउटै प्रयोगकर्ताका लागि फरक-फरक Openids प्राप्त गर्छन्।

(५)। सामान्यीकरण प्रविधिहरू

सामान्यीकरण प्रविधिले डे-पहिचान प्रविधिलाई बुझाउँछ जसले डेटा सेटमा चयन गरिएका विशेषताहरूको ग्रेन्युलेरिटी घटाउँछ र डेटाको थप सामान्य र अमूर्त विवरण प्रदान गर्दछ। सामान्यीकरण टेक्नोलोजी कार्यान्वयन गर्न सजिलो छ र रेकर्ड-स्तर डाटाको प्रामाणिकता सुरक्षित गर्न सक्छ। यो सामान्यतया डाटा उत्पादन वा डाटा रिपोर्ट मा प्रयोग गरिन्छ।

- राउन्डिङ: चयन गरिएको विशेषताको लागि राउन्डिङ आधार चयन गर्ने समावेश गर्दछ, जस्तै माथि वा तल फोरेन्सिक, परिणामहरू 100, 500, 1K, र 10K।

- माथि र तल्लो कोडिङ प्रविधिहरू: माथिको (वा तल) थ्रेसहोल्डलाई माथिल्लो (वा तल) स्तर प्रतिनिधित्व गर्ने थ्रेसहोल्डसँग मानहरू बदल्नुहोस्, "माथि X" वा "X तल" को परिणाम दिन्छ।

(६)। अनियमितता प्रविधिहरू

एक प्रकारको डि-पहिचान प्रविधिको रूपमा, अनियमितता प्रविधिले अनियमितता मार्फत विशेषताको मूल्य परिमार्जन गर्नलाई जनाउँछ, ताकि अनियमितता पछिको मूल्य मूल वास्तविक मूल्यभन्दा फरक होस्। यो प्रक्रियाले एउटै डाटा रेकर्डमा अन्य विशेषता मानहरूबाट एट्रिब्युट मान प्राप्त गर्ने आक्रमणकारीको क्षमतालाई घटाउँछ, तर उत्पादन परीक्षण डाटासँग सामान्य हुने परिणाम डेटाको प्रामाणिकतालाई असर गर्छ।


पोस्ट समय: सेप्टेम्बर-27-2022