عند التعامل مع إطار بيانات Pandas وتحليل البيانات، قد تواجه تحديات في فهم كيفية حساب الصفوف الفريدة وتجميعها بناءً على القيم في عدة أعمدة. في هذا السياق، يأتي استخدام الدالة groupby
إلى الصورة لتحقيق هذا الهدف.
للقيام بذلك بشكل صحيح والحصول على نتائج مرتبة وسهلة القراءة، يمكنك استخدام دالة groupby
بالتزامن مع دالة count
. ولكن يجب أن تقوم بإعادة تسمية العمود الذي يتم عملية العد عليه باستخدام rename
لتحديد اسم جديد للعمود.
-
كيفية إضافة فضاء أسماء في C#10/03/2024
-
رفع عدة ملفات في Django09/03/2024
-
ضبط جهة Hibernate في Spring Boot11/03/2024
في هذا السياق، يمكنك استخدام الكود التالي:
pythonimport pandas as pd
# البيانات الأصلية
data = {'ColA': [1, 1, 1, 1, 1, 2, 3],
'ColB': [1, 1, 1, 2, 2, 1, 2]}
df = pd.DataFrame(data)
# تجميع الصفوف بناءً على الأعمدة المحددة وحساب عدد الظهور باستخدام count
result = df.groupby(['ColA', 'ColB']).size().reset_index(name='Count')
# طباعة النتيجة
print(result)
هذا الكود ينتج نتيجة تشبه النتيجة المطلوبة، حيث تكون الصفوف مجمعة بناءً على القيم في الأعمدة ‘ColA’ و ‘ColB’، وتظهر عدد الظهور في العمود الجديد المسمى ‘Count’. تأكد من تعديل الأعمدة والبيانات وفقًا لاحتياجاتك الخاصة.
المزيد من المعلومات
عند القيام بتحليل البيانات باستخدام إطار البيانات Pandas في لغة البرمجة بايثون، يظهر أهمية استخدام دوال groupby
و count
لفهم توزيع البيانات وحساب عدد الظهور لكل مجموعة.
في هذا السياق، تعتبر groupby
آلية قوية تسمح بتقسيم البيانات إلى مجموعات استنادًا إلى القيم في أحد الأعمدة، مما يفتح الباب أمام إجراء عمليات مجموعة مثل العد والمتوسط والمزيد. في هذا المثال، استخدمنا groupby
لتجميع الصفوف بناءً على قيم الأعمدة ‘ColA’ و ‘ColB’.
بعد ذلك، تم استخدام دالة size
لحساب عدد الظهور لكل مجموعة، ومن ثم تم استخدام reset_index
لإعادة تعيين الفهرس وإعادة تسمية العمود الناتج إلى ‘Count’ لتحسين قراءة النتيجة.
التعامل مع البيانات بشكل فعال يتطلب فهماً عميقاً لأدوات التحليل المتاحة، ويمكنك دائماً تخصيص الكود وفقًا لاحتياجات مشروعك الخاص. استمر في اكتساب المهارات في استخدام Pandas والتلاعب بالبيانات للحصول على نتائج دقيقة ومفيدة.