البرمجة

تجميع البيانات في بانداز: استخدام groupby وagg

بالتأكيد، يبدو أنك ترغب في تجميع بيانات الإطار البيانات الخاص بك في بانداز دون فقدان العمود الذي تم تجميعه. يمكن تحقيق هذا باستخدام دالة groupby مع دالة التجميع المناسبة.

لتحقيق ذلك، يمكنك استخدام دالة groupby مع تعريف دالة مخصصة للتجميع. هناك عدة طرق للقيام بذلك، واحدة منها هي استخدام دالة groupby مع دالة agg وتمرير قاموسٍ يحدد التجميع المخصص لكل عمود. في حالتك، تريد تجميع الأسماء والمعرّفات الفرعية في مجموعات، وهذا يمكن تنفيذه باستخدام دالة set.

إليك كيف يمكنك القيام بذلك:

python
import pandas as pd # الإطار البيانات الأصلي data = { 'Id': [276956, 276956, 276956, 287266], 'NAME': ['A', 'B', 'C', 'D'], 'SUB_ID': [5933, 5934, 5935, 1589] } df = pd.DataFrame(data) # تجميع البيانات مع الاحتفاظ بالعمود المجمّع grouped = df.groupby('Id').agg({'NAME': set, 'SUB_ID': set}).reset_index() print(grouped)

سينتج هذا الكود إطار بيانات مجمعًا حيث يتم تجميع الأسماء والمعرّفات الفرعية في مجموعات لكل معرّف. وسيتم الاحتفاظ بعمود الهوية كعمود في النتيجة النهائية.

المزيد من المعلومات

بالتأكيد، دعنا نواصل تطوير المقال لإضافة المزيد من التفاصيل والشروحات حول كيفية استخدام دالة groupby و agg في بانداز بطريقة فعالة وفعّالة.

في الكود السابق، قمنا بتجميع البيانات باستخدام دالة groupby للمجال “Id”، ومن ثم استخدمنا دالة agg لتحديد كيفية تجميع الأسماء والمعرّفات الفرعية. باستخدام قاموس في agg، يمكننا تحديد التجميع المخصص لكل عمود.

في مثالنا، استخدمنا دالة set كدالة تجميع لجمع القيم المكررة. هذا يضمن أنه سيتم تجميع الأسماء والمعرّفات الفرعية بشكل فريد لكل معرّف. بعد التجميع، قمنا بإعادة تعيين الفهرس باستخدام reset_index() لضمان أن العمود “Id” يتم الاحتفاظ به كعمود في النتيجة النهائية.

يمكن استخدام هذا النهج للتعامل مع مجموعة متنوعة من العمليات التحليلية في البيانات، مثل الحسابات الإحصائية، أو تطبيق دوال مخصصة على البيانات، أو حتى تجميع البيانات بطرق معقدة.

على سبيل المثال، إذا كنت ترغب في حساب عدد الأسماء والمعرّفات الفرعية لكل معرّف، يمكنك ببساطة استخدام دالة len كدالة تجميع بدلاً من set. وإليك كيف يمكن القيام بذلك:

python
grouped = df.groupby('Id').agg({'NAME': len, 'SUB_ID': len}).reset_index()

هذا سينتج عدد الأسماء والمعرّفات الفرعية لكل معرّف بدلاً من مجموعاتها.

بهذه الطريقة، يمكن لدالة groupby و agg أن تكون أدوات قوية لتحليل وتحويل البيانات في بانداز. باستخدام هذه الأدوات بشكل صحيح، يمكنك القيام بمجموعة متنوعة من المهام التحليلية بسهولة وفعالية دون فقدان المعلومات الهامة.

مقالات ذات صلة

زر الذهاب إلى الأعلى
إغلاق

أنت تستخدم إضافة Adblock

يرجى تعطيل مانع الإعلانات حيث أن موقعنا غير مزعج ولا بأس من عرض الأعلانات لك فهي تعتبر كمصدر دخل لنا و دعم مقدم منك لنا لنستمر في تقديم المحتوى المناسب و المفيد لك فلا تبخل بدعمنا عزيزي الزائر