यह निर्धारित करना कि क्या किसी सूची (सरणी) में पायथन में डुप्लिकेट तत्व हैं

निम्नलिखित में से प्रत्येक मामले के लिए पायथन में एक सूची (सरणी) में डुप्लिकेट तत्व (सभी तत्व अद्वितीय/अद्वितीय हैं) निर्धारित करने के तरीके का विवरण निम्नलिखित है।

उस सूची के लिए जिसमें तत्व में कोई सूची नहीं है
तत्वों की सूची वाली सूचियों के लिए (द्वि-आयामी सरणियाँ, सूचियों की सूचियाँ, आदि)

किसी सूची से डुप्लिकेट तत्वों को निकालने या निकालने के तरीके पर निम्न आलेख देखें।

संबंधित:पायथन में एक सूची (सरणी) से डुप्लिकेट तत्वों को निकालें और निकालें

ध्यान दें कि सूचियां विभिन्न प्रकार के डेटा को स्टोर कर सकती हैं और सरणियों से बिल्कुल अलग हैं। यदि आप उन प्रक्रियाओं में सरणियों को संभालना चाहते हैं जिनके लिए स्मृति आकार और स्मृति पते या बड़े डेटा की संख्यात्मक प्रसंस्करण की आवश्यकता होती है, तो सरणी (मानक पुस्तकालय) या NumPy का उपयोग करें।

Table of Contents

निर्धारित करें कि क्या सूची में डुप्लिकेट तत्व हैं (यदि तत्व की कोई सूची नहीं है)
निर्धारित करें कि क्या सूची में डुप्लिकेट तत्व हैं (यदि तत्व की सूची है)

निर्धारित करें कि क्या सूची में डुप्लिकेट तत्व हैं (यदि तत्व की कोई सूची नहीं है)

यदि तत्व में सूची जैसी अद्यतन योग्य वस्तु नहीं है, तो सेट सेट प्रकार के कंस्ट्रक्टर सेट () का उपयोग करें।

संबंधित:पायथन के सेट प्रकार के साथ संचालन सेट करें (उदाहरण के लिए, यूनियन सेट, उत्पाद सेट और सबसेट निर्धारित करना)

सेट प्रकार एक डेटा प्रकार है जिसमें कोई डुप्लिकेट तत्व नहीं होते हैं। जब एक सूची कंस्ट्रक्टर सेट () को पास की जाती है, तो डुप्लिकेट मानों को अनदेखा कर दिया जाता है और प्रकार की एक वस्तु केवल अद्वितीय मानों के साथ सेट की जाती है क्योंकि तत्व वापस आ जाते हैं।

इस सेट प्रकार ऑब्जेक्ट में तत्वों की संख्या और मूल सूची प्राप्त की जाती है और अंतर्निहित फ़ंक्शन लेन () का उपयोग करके तुलना की जाती है।

यदि तत्वों की संख्या समान है, तो मूल सूची में कोई डुप्लिकेट तत्व नहीं हैं
तत्वों की संख्या भिन्न होने पर डुप्लिकेट तत्वों को मूल सूची में शामिल किया जाता है

यदि कोई डुप्लिकेट तत्व नहीं हैं, तो फ़ंक्शन जो गलत लौटाता है और यदि डुप्लिकेट तत्व हैं, तो सत्य इस प्रकार है

def has_duplicates(seq):
    return len(seq) != len(set(seq))

l = [0, 1, 2]
print(has_duplicates(l))
# False

l = [0, 1, 1, 2]
print(has_duplicates(l))
# True

उदाहरण एक सूची है, लेकिन उसी फ़ंक्शन का उपयोग टुपल्स के साथ किया जा सकता है।

परिवर्तनीय (अद्यतन करने योग्य) वस्तुएं जैसे सूचियां सेट प्रकार के तत्व नहीं हो सकती हैं। इसलिए, तत्वों के रूप में सूचियों वाली सूचियाँ (द्वि-आयामी सरणियाँ, सूचियों की सूचियाँ, आदि) के परिणामस्वरूप एक TypeError होगा। प्रतिवाद नीचे दिखाया गया है।

l_2d = [[0, 1], [1, 1], [0, 1], [1, 0]]
# print(has_duplicates(l_2d))
# TypeError: unhashable type: 'list'

निर्धारित करें कि क्या सूची में डुप्लिकेट तत्व हैं (यदि तत्व की सूची है)

तत्वों की सूची (जैसे सूचियों की सूची) वाली सूची के मामले में, निम्नलिखित कार्यों का उपयोग यह निर्धारित करने के लिए किया जा सकता है कि क्या डुप्लिकेट तत्व हैं।

def has_duplicates2(seq):
    seen = []
    unique_list = [x for x in seq if x not in seen and not seen.append(x)]
    return len(seq) != len(unique_list)

l_2d = [[0, 0], [0, 1], [1, 1], [1, 0]]
print(has_duplicates2(l_2d))
# False

l_2d = [[0, 0], [0, 1], [1, 1], [1, 1]]
print(has_duplicates2(l_2d))
# True

सेट () के बजाय, सूची समझ संकेतन एक सूची उत्पन्न करता है जिसके तत्व केवल अद्वितीय मान होते हैं, और तत्वों की संख्या की तुलना की जाती है। विवरण के लिए निम्न आलेख देखें।

संबंधित:पायथन में एक सूची (सरणी) से डुप्लिकेट तत्वों को निकालें और निकालें

यह फ़ंक्शन उन सूचियों के लिए भी मान्य है जिनमें तत्वों की सूची नहीं है।

l = [0, 1, 2]
print(has_duplicates2(l))
# False

l = [0, 1, 1, 2]
print(has_duplicates2(l))
# True

अब तक का उदाहरण यह निर्धारित करना है कि क्या तत्वों की सूची को डुप्लिकेट किया गया है (इसमें एक ही सूची है)।

मूल सूची को एक आयाम में समतल करने के बाद प्रत्येक सूची ओवरलैप के तत्वों का निर्धारण किया जा सकता है या नहीं।

l_2d = [[0, 1], [2, 3]]
print(sum(l_2d, []))
# [0, 1, 2, 3]

print(has_duplicates(sum(l_2d, [])))
# False

l_2d = [[0, 1], [2, 0]]
print(has_duplicates(sum(l_2d, [])))
# True

यहां, सूची को समतल करने के लिए योग () का उपयोग किया जाता है, लेकिन itertools.chain.from_iterable() का भी उपयोग किया जा सकता है। इसके अलावा, तीन या अधिक आयामों की सूची को समतल करते समय, एक नए फ़ंक्शन को परिभाषित करना आवश्यक है।