بالتأكيد، يبدو أنك ترغب في تجميع بيانات الإطار البيانات الخاص بك في بانداز دون فقدان العمود الذي تم تجميعه. يمكن تحقيق هذا باستخدام دالة groupby
مع دالة التجميع المناسبة.
لتحقيق ذلك، يمكنك استخدام دالة groupby
مع تعريف دالة مخصصة للتجميع. هناك عدة طرق للقيام بذلك، واحدة منها هي استخدام دالة groupby
مع دالة agg
وتمرير قاموسٍ يحدد التجميع المخصص لكل عمود. في حالتك، تريد تجميع الأسماء والمعرّفات الفرعية في مجموعات، وهذا يمكن تنفيذه باستخدام دالة set
.
إليك كيف يمكنك القيام بذلك:
pythonimport pandas as pd
# الإطار البيانات الأصلي
data = {
'Id': [276956, 276956, 276956, 287266],
'NAME': ['A', 'B', 'C', 'D'],
'SUB_ID': [5933, 5934, 5935, 1589]
}
df = pd.DataFrame(data)
# تجميع البيانات مع الاحتفاظ بالعمود المجمّع
grouped = df.groupby('Id').agg({'NAME': set, 'SUB_ID': set}).reset_index()
print(grouped)
سينتج هذا الكود إطار بيانات مجمعًا حيث يتم تجميع الأسماء والمعرّفات الفرعية في مجموعات لكل معرّف. وسيتم الاحتفاظ بعمود الهوية كعمود في النتيجة النهائية.
المزيد من المعلومات
بالتأكيد، دعنا نواصل تطوير المقال لإضافة المزيد من التفاصيل والشروحات حول كيفية استخدام دالة groupby
و agg
في بانداز بطريقة فعالة وفعّالة.
في الكود السابق، قمنا بتجميع البيانات باستخدام دالة groupby
للمجال “Id”، ومن ثم استخدمنا دالة agg
لتحديد كيفية تجميع الأسماء والمعرّفات الفرعية. باستخدام قاموس في agg
، يمكننا تحديد التجميع المخصص لكل عمود.
في مثالنا، استخدمنا دالة set
كدالة تجميع لجمع القيم المكررة. هذا يضمن أنه سيتم تجميع الأسماء والمعرّفات الفرعية بشكل فريد لكل معرّف. بعد التجميع، قمنا بإعادة تعيين الفهرس باستخدام reset_index()
لضمان أن العمود “Id” يتم الاحتفاظ به كعمود في النتيجة النهائية.
يمكن استخدام هذا النهج للتعامل مع مجموعة متنوعة من العمليات التحليلية في البيانات، مثل الحسابات الإحصائية، أو تطبيق دوال مخصصة على البيانات، أو حتى تجميع البيانات بطرق معقدة.
على سبيل المثال، إذا كنت ترغب في حساب عدد الأسماء والمعرّفات الفرعية لكل معرّف، يمكنك ببساطة استخدام دالة len
كدالة تجميع بدلاً من set
. وإليك كيف يمكن القيام بذلك:
pythongrouped = df.groupby('Id').agg({'NAME': len, 'SUB_ID': len}).reset_index()
هذا سينتج عدد الأسماء والمعرّفات الفرعية لكل معرّف بدلاً من مجموعاتها.
بهذه الطريقة، يمكن لدالة groupby
و agg
أن تكون أدوات قوية لتحليل وتحويل البيانات في بانداز. باستخدام هذه الأدوات بشكل صحيح، يمكنك القيام بمجموعة متنوعة من المهام التحليلية بسهولة وفعالية دون فقدان المعلومات الهامة.