البرمجة

البحث عن أسطر متكررة في Python

عندما تتعامل مع ملف نصي يحتوي على مجموعة من الأسطر، قد تحتاج في بعض الأحيان إلى معرفة ما إذا كانت هناك أسطر متكررة في هذا الملف. في لغة البرمجة Python، يمكنك القيام بذلك بسهولة باستخدام هيكل البيانات المناسب والعمليات المناسبة للبحث.

لنفترض أن لديك ملف نصي اسمه “example.txt” يحتوي على مجموعة من الأسطر، وتريد معرفة ما إذا كانت هناك أسطر متكررة في هذا الملف. يمكنك استخدام الشيفرة التالية لتحقيق ذلك:

python
def find_duplicate_lines(file_path): # قائمة لتخزين الأسطر المتكررة duplicate_lines = [] # قائمة لتخزين الأسطر الموجودة في الملف lines = [] # فتح الملف وقراءة الأسطر with open(file_path, 'r') as file: for line in file: # إزالة الأحرف الزائدة مثل المسافات والأشكال البيانية الخاصة بنهاية السطر cleaned_line = line.strip() # إذا كانت هذه السطر موجودة بالفعل في القائمة، فهذا يعني أنها متكررة if cleaned_line in lines: duplicate_lines.append(cleaned_line) else: lines.append(cleaned_line) return duplicate_lines file_path = "example.txt" duplicates = find_duplicate_lines(file_path) if duplicates: print("الأسطر المتكررة في الملف:") for line in duplicates: print(line) else: print("لا توجد أسطر متكررة في الملف.")

تقوم هذه الشيفرة بفتح الملف وقراءة الأسطر وتخزينها في قائمة. ثم، يتم التحقق مما إذا كانت السطر موجودة بالفعل في القائمة. إذا كان السطر موجوداً، فإنه يتم إضافته إلى قائمة الأسطر المتكررة. في النهاية، يتم طباعة الأسطر المتكررة إذا كانت موجودة، وإلا فإنه يتم طباعة رسالة تفيد بعدم وجود أسطر متكررة.

يمكنك استبدال “example.txt” بمسار ملف النص الذي تريد التحقق منه. وهكذا، يمكنك بسهولة العثور على الأسطر المتكررة في ملف نصي ما باستخدام لغة البرمجة Python.

المزيد من المعلومات

بينما تعمل على معالجة الملفات النصية في Python، يمكنك تعديل الشيفرة المذكورة لتناسب احتياجاتك الخاصة. على سبيل المثال، يمكنك إضافة ميزات إضافية مثل العد وعرض عدد الأسطر المتكررة، أو تخزين النتائج في ملف جديد. لتحسين الأداء، يمكن استخدام هيكل البيانات الفريدة مثل مجموعات العناصر (Sets) لتخزين الأسطر، حيث أن عملية البحث في مجموعة يكون لها تعقيد زمني أقل من البحث في قائمة.

علاوة على ذلك، يمكنك تحسين الكفاءة بإجراء تنقية البيانات مسبقاً، عن طريق إزالة الأحرف الزائدة مثل المسافات البيضاء والأشكال البيانية. وبالإضافة إلى ذلك، يمكنك استخدام مكتبات خارجية مثل Pandas للتعامل مع مجموعات البيانات بطريقة أكثر فعالية وتوفيراً للوقت.

عندما يتعلق الأمر بمعالجة الملفات النصية، فإن Python يوفر العديد من الأدوات والمكتبات التي يمكن استخدامها لتبسيط العملية وتحسين الأداء. بالنهاية، يتوقف الأمر على متطلبات المشروع وتفضيلات المطور لتحديد الأدوات والتقنيات المناسبة للمهمة المحددة.

مقالات ذات صلة

زر الذهاب إلى الأعلى
إغلاق

أنت تستخدم إضافة Adblock

يرجى تعطيل مانع الإعلانات حيث أن موقعنا غير مزعج ولا بأس من عرض الأعلانات لك فهي تعتبر كمصدر دخل لنا و دعم مقدم منك لنا لنستمر في تقديم المحتوى المناسب و المفيد لك فلا تبخل بدعمنا عزيزي الزائر