البرمجة

كيفية اكتشاف ومعالجة الأعمدة الفارغة في ملفات CSV باستخدام Python وPandas

عند العمل على مهام معالجة البيانات باستخدام لغة البرمجة Python، يمكن أن تواجه التحديات المتعلقة بتحليل ملفات CSV. في سياق محدد، تقوم بمحاولة البحث عن الأعمدة الفارغة في ملف CSV باستخدام الكود البرمجي الذي قدمته.

للبداية، يجب أن نلاحظ أن الكود الحالي لديك يحسب عدد الصفوف في الملف CSV. ومع ذلك، لا يبدو أنه يقوم بالبحث عن الأعمدة الفارغة. لتحقيق هذا الهدف، يمكنك استخدام تقنيات التفاف على الصفوف والأعمدة في ملف CSV.

للقيام بذلك، يمكنك استخدام مكتبة pandas التي تعد فعالة في معالجة وتحليل البيانات. فيما يلي مثال على كيفية القيام بذلك باستخدام pandas:

python
import pandas as pd # قراءة ملف CSV df = pd.read_csv('E:\pythontest\ip_data.csv') # البحث عن الأعمدة الفارغة empty_columns = df.columns[df.isnull().any()].tolist() # عدد الأعمدة الفارغة num_empty_columns = len(empty_columns) # طباعة الأعمدة الفارغة وعددها print("الأعمدة الفارغة:", empty_columns) print("عدد الأعمدة الفارغة:", num_empty_columns)

في هذا المثال، يتم قراءة الملف CSV باستخدام pandas، ثم يتم استخدام isnull().any() للعثور على الأعمدة التي تحتوي على قيم فارغة. يتم تخزين أسماء هذه الأعمدة في قائمة تسمى empty_columns، ويتم حساب عددها باستخدام len(empty_columns).

هذا النهج يتيح لك فحص الأعمدة التي تحتوي على قيم فارغة في ملف CSV الخاص بك باستخدام طرق أكثر فعالية.

المزيد من المعلومات

بالطبع، دعنا نوسع قليلاً على الكود المقدم ونقدم بعض المعلومات الإضافية حول الخطوات التي قمت بها.

في الكود السابق، قمت بفتح ملف CSV باستخدام csv.reader وقمت بحساب عدد الصفوف في الملف. هذا يمكن أن يكون مفيدًا لتحديد حجم البيانات التي تعمل عليها.

من ثم، قمت بالتحول إلى استخدام مكتبة pandas، وهي مكتبة قوية لمعالجة وتحليل البيانات في Python. باستخدام pd.read_csv، قمت بقراءة الملف CSV إلى هيكل بيانات يُعرف باسم DataFrame. DataFrame يوفر واجهة قوية للعمل مع البيانات الجدولية.

ثم، باستخدام isnull().any() على DataFrame، تمكنت من العثور على الأعمدة التي تحتوي على قيم فارغة. هذا يوفر لك فرصة لتحليل الأعمدة التي تحتاج إلى التعامل مع القيم الفارغة أو فحصها بشكل منفصل.

أخيرًا، استخدمت len(empty_columns) لحساب عدد الأعمدة التي تحتوي على قيم فارغة وقمت بطباعة هذه المعلومات للمستخدم.

هذا النهج يعكس استخدام تقنيات برمجة متقدمة مع Python ويسلط الضوء على فعالية استخدام مكتبة pandas لمهام مثل معالجة وتحليل ملفات CSV والتحقق من الأعمدة الفارغة فيها.

زر الذهاب إلى الأعلى