البرمجة

رسم هيستوغرام باستخدام Matplotlib و Pandas: دليل شامل

في هذا السياق، سأقدم لك إرشادات شاملة حول كيفية استخدام مكتبة Matplotlib بالاعتماد على مكتبة Pandas لرسم هيستوغرام لملف CSV معقد يحتوي على سمات رقمية ونصية.

أولاً وقبل الشروع في رسم الهيستوغرام، يجب عليك استيراد المكتبات الضرورية وقراءة ملف CSV. يمكنك استخدام Pandas لتحقيق ذلك. إليك مثالً على كيفية القيام بذلك:

python
import pandas as pd import matplotlib.pyplot as plt # قراءة ملف CSV file_path = 'مسار الملف.csv' data = pd.read_csv(file_path) # عرض نموذج من البيانات print(data.head())

بعد قراءة الملف بنجاح، يمكنك البدء في إعداد البيانات لرسم الهيستوغرام. في هذا المثال، سنفترض أن لديك عمودين في البيانات يسمى “processes” و “cpuid” وترغب في رسم هيستوغرام لتوزيع العمليات بناءً على الـ CPU ID.

python
# رسم هيستوغرام plt.figure(figsize=(10, 6)) plt.hist(data['cpuid'], bins=30, color='blue', alpha=0.7, label='عدد العمليات') plt.xlabel('معرف الوحدة المركزية (CPU ID)') plt.ylabel('عدد العمليات') plt.title('هيستوغرام العمليات بناءً على معرف الوحدة المركزية') plt.legend() plt.show()

تأكد من تعديل اسم الملف وأن تكون العمليات مطابقة للأعمدة الموجودة في ملف CSV الخاص بك.

يمكنك أيضًا استكشاف مزيد من الميزات التفصيلية لـ Matplotlib لتخصيص المظهر وتحسين جودة الرسم البياني الخاص بك.

المزيد من المعلومات

بالتأكيد، دعنا نوسع المعلومات حول كيفية استخدام مكتبات Matplotlib و Pandas لرسم هيستوغرام.

عند استخدام مكتبة Pandas لقراءة ملف CSV، يمكنك تحليل البيانات بشكل أفضل وتحضيرها للاستخدام في رسم الهيستوغرام. قد تحتاج أيضاً إلى التعامل مع القيم الناقصة أو تحويل البيانات إذا كانت في تنسيق غير مناسب.

python
# التعامل مع القيم الناقصة إذا كانت موجودة data = data.dropna() # تحويل الأعمدة النصية إلى أعمدة رقمية إذا لزم الأمر # مثال: data['column_name'] = pd.to_numeric(data['column_name'], errors='coerce')

ثم، يمكنك استخدام Matplotlib لرسم الهيستوغرام. إضافةً إلى الشفافية (alpha) وعدد الفاصل الزمني (bins)، يمكنك تخصيص المزيد من الخصائص لتحسين جودة الرسم البياني.

python
plt.figure(figsize=(10, 6)) plt.hist(data['cpuid'], bins=30, color='blue', alpha=0.7, label='عدد العمليات', edgecolor='black', linewidth=1.2) plt.xlabel('معرف الوحدة المركزية (CPU ID)') plt.ylabel('عدد العمليات') plt.title('هيستوغرام العمليات بناءً على معرف الوحدة المركزية') plt.legend() plt.grid(True, linestyle='--', alpha=0.5) plt.savefig('histogram.png') # حفظ الرسم البياني كملف صورة plt.show()

يمكنك أيضاً استكشاف ميزات أخرى مثل تقسيم الهيستوغرام إلى فئات أو تعيين ألوان مخصصة للعمودين. الهدف هو توفير رسم بياني يعكس البيانات بشكل دقيق وجذاب.

زر الذهاب إلى الأعلى