دمج بيانات إطارات Pandas في Python: إنشاء إطار بيانات جديد بفعالية
للقيام بتحقيق الهدف الذي ورد في استفسارك، يمكن استخدام مكتبة Pandas في لغة البرمجة بايثون. يبدو أنك ترغب في دمج إطاري بيانات df1
و df2
استنادًا إلى الأعمدة المشتركة “Reg” و “Reg1″، ثم إنشاء إطار بيانات جديد newfram
يحتوي على الأعمدة “Reg1″، “Rank1″، “Reg2″، و “Rank2”.
لتحقيق هذا، يمكنك استخدام ميثود merge
في Pandas. فيما يلي سيناريو برمجي يوضح كيف يمكن تحقيق ذلك:
-
طرق التعامل مع قيم NaN في R27/03/2024
-
فهم التعبيرات المنتظمة في Java04/04/2024
pythonimport pandas as pd
# قراءة إطارات البيانات من ملفات CSV
df1 = pd.read_csv('df1.csv')
df2 = pd.read_csv('df2.csv')
# الدمج بين df1 و df2 باستخدام عملية الانضمام
merged_df = pd.merge(df1, df2, left_on='Reg1', right_on='Reg')
# إنشاء إطار البيانات الجديد
newfram = pd.DataFrame({
'Reg1': merged_df['Reg1'],
'Rank1': merged_df['Rank'],
'Reg2': merged_df['Reg2'],
'Rank2': merged_df['Rank']
})
# طباعة الإطار الجديد
print(newfram)
هذا الكود يستخدم مكتبة Pandas لقراءة إطارات البيانات من ملفات CSV، ثم يقوم بعملية الدمج باستخدام العملية merge
باستناد إلى الأعمدة المشتركة. أخيرًا، يتم إنشاء إطار البيانات الجديد newfram
باستخدام البيانات المدموجة.
هذه الطريقة أكثر فاعلية من استخدام البرمجة الأساسية في Python، خاصةً مع البيانات الكبيرة، حيث تقوم Pandas بتنفيذ العمليات بشكل أسرع وبشكل أكثر فعالية.
المزيد من المعلومات
بالطبع، دعنا نضيف المزيد من المعلومات لتوضيح العمليات المستخدمة في الكود ولتعزيز الفهم.
-
قراءة إطارات البيانات من ملفات CSV:
في البداية، يتم استخدامpd.read_csv
لقراءة محتويات ملفات CSV (df1.csv
وdf2.csv
) وتحويلها إلى إطارات بيانات Pandas. يفترض أن تحتوي هذه الملفات على بيانات مثلما ذكرت في الاستفسار.pythondf1 = pd.read_csv('df1.csv') df2 = pd.read_csv('df2.csv')
-
الدمج باستخدام
merge
:
يتم استخدامpd.merge
لدمج إطاري البياناتdf1
وdf2
باستناد إلى الأعمدة المشتركة “Reg1” و “Reg”. يتم تخزين النتائج في إطار بيانات جديد يُسمىmerged_df
.pythonmerged_df = pd.merge(df1, df2, left_on='Reg1', right_on='Reg')
هذا يؤدي إلى دمج البيانات بحيث تظهر الأعمدة المشتركة “Reg1” و “Reg” في النتيجة.
-
إنشاء إطار بيانات جديد:
يتم إنشاء إطار البيانات الجديدnewfram
باستخدام البيانات منmerged_df
. يتم تحديد الأعمدة المراد استخدامها في الإطار الجديد بواسطة الأسماء المحددة.pythonnewfram = pd.DataFrame({ 'Reg1': merged_df['Reg1'], 'Rank1': merged_df['Rank'], 'Reg2': merged_df['Reg2'], 'Rank2': merged_df['Rank'] })
هنا، يتم اختيار الأعمدة “Reg1” و “Reg2” من
merged_df
، وكذلك الأعمدة “Rank” و “Rank2”. يتم استخدام هذه الأعمدة لإنشاء إطار البيانات الجديد. -
طباعة الإطار الجديد:
يتم استخدامprint
لطباعة إطار البيانات الجديدnewfram
إلى الإخراج.pythonprint(newfram)
هذا يعرض النتيجة النهائية للمستخدم، والتي يحتوي على الأعمدة “Reg1″، “Rank1″، “Reg2″، و “Rank2” مع البيانات المندمجة.