عند العمل على مهام معالجة البيانات باستخدام لغة البرمجة Python، يمكن أن تواجه التحديات المتعلقة بتحليل ملفات CSV. في سياق محدد، تقوم بمحاولة البحث عن الأعمدة الفارغة في ملف CSV باستخدام الكود البرمجي الذي قدمته.
للبداية، يجب أن نلاحظ أن الكود الحالي لديك يحسب عدد الصفوف في الملف CSV. ومع ذلك، لا يبدو أنه يقوم بالبحث عن الأعمدة الفارغة. لتحقيق هذا الهدف، يمكنك استخدام تقنيات التفاف على الصفوف والأعمدة في ملف CSV.
للقيام بذلك، يمكنك استخدام مكتبة pandas
التي تعد فعالة في معالجة وتحليل البيانات. فيما يلي مثال على كيفية القيام بذلك باستخدام pandas
:
pythonimport pandas as pd
# قراءة ملف CSV
df = pd.read_csv('E:\pythontest\ip_data.csv')
# البحث عن الأعمدة الفارغة
empty_columns = df.columns[df.isnull().any()].tolist()
# عدد الأعمدة الفارغة
num_empty_columns = len(empty_columns)
# طباعة الأعمدة الفارغة وعددها
print("الأعمدة الفارغة:", empty_columns)
print("عدد الأعمدة الفارغة:", num_empty_columns)
في هذا المثال، يتم قراءة الملف CSV باستخدام pandas
، ثم يتم استخدام isnull().any()
للعثور على الأعمدة التي تحتوي على قيم فارغة. يتم تخزين أسماء هذه الأعمدة في قائمة تسمى empty_columns
، ويتم حساب عددها باستخدام len(empty_columns)
.
هذا النهج يتيح لك فحص الأعمدة التي تحتوي على قيم فارغة في ملف CSV الخاص بك باستخدام طرق أكثر فعالية.
المزيد من المعلومات
بالطبع، دعنا نوسع قليلاً على الكود المقدم ونقدم بعض المعلومات الإضافية حول الخطوات التي قمت بها.
في الكود السابق، قمت بفتح ملف CSV باستخدام csv.reader
وقمت بحساب عدد الصفوف في الملف. هذا يمكن أن يكون مفيدًا لتحديد حجم البيانات التي تعمل عليها.
من ثم، قمت بالتحول إلى استخدام مكتبة pandas
، وهي مكتبة قوية لمعالجة وتحليل البيانات في Python. باستخدام pd.read_csv
، قمت بقراءة الملف CSV إلى هيكل بيانات يُعرف باسم DataFrame. DataFrame يوفر واجهة قوية للعمل مع البيانات الجدولية.
ثم، باستخدام isnull().any()
على DataFrame، تمكنت من العثور على الأعمدة التي تحتوي على قيم فارغة. هذا يوفر لك فرصة لتحليل الأعمدة التي تحتاج إلى التعامل مع القيم الفارغة أو فحصها بشكل منفصل.
أخيرًا، استخدمت len(empty_columns)
لحساب عدد الأعمدة التي تحتوي على قيم فارغة وقمت بطباعة هذه المعلومات للمستخدم.
هذا النهج يعكس استخدام تقنيات برمجة متقدمة مع Python ويسلط الضوء على فعالية استخدام مكتبة pandas
لمهام مثل معالجة وتحليل ملفات CSV والتحقق من الأعمدة الفارغة فيها.