دمج بيانات إطارات Pandas في Python: إنشاء إطار بيانات جديد بفعالية

25/02/2024آخر تحديث: 25/02/2024

9 دقيقة واحدة

للقيام بتحقيق الهدف الذي ورد في استفسارك، يمكن استخدام مكتبة Pandas في لغة البرمجة بايثون. يبدو أنك ترغب في دمج إطاري بيانات df1 و df2 استنادًا إلى الأعمدة المشتركة “Reg” و “Reg1″، ثم إنشاء إطار بيانات جديد newfram يحتوي على الأعمدة “Reg1″، “Rank1″، “Reg2″، و “Rank2”.

لتحقيق هذا، يمكنك استخدام ميثود merge في Pandas. فيما يلي سيناريو برمجي يوضح كيف يمكن تحقيق ذلك:

python
import pandas as pd

# قراءة إطارات البيانات من ملفات CSV
df1 = pd.read_csv('df1.csv')
df2 = pd.read_csv('df2.csv')

# الدمج بين df1 و df2 باستخدام عملية الانضمام
merged_df = pd.merge(df1, df2, left_on='Reg1', right_on='Reg')

# إنشاء إطار البيانات الجديد
newfram = pd.DataFrame({
    'Reg1': merged_df['Reg1'],
    'Rank1': merged_df['Rank'],
    'Reg2': merged_df['Reg2'],
    'Rank2': merged_df['Rank']
})

# طباعة الإطار الجديد
print(newfram)

هذا الكود يستخدم مكتبة Pandas لقراءة إطارات البيانات من ملفات CSV، ثم يقوم بعملية الدمج باستخدام العملية merge باستناد إلى الأعمدة المشتركة. أخيرًا، يتم إنشاء إطار البيانات الجديد newfram باستخدام البيانات المدموجة.

هذه الطريقة أكثر فاعلية من استخدام البرمجة الأساسية في Python، خاصةً مع البيانات الكبيرة، حيث تقوم Pandas بتنفيذ العمليات بشكل أسرع وبشكل أكثر فعالية.

المزيد من المعلومات

بالطبع، دعنا نضيف المزيد من المعلومات لتوضيح العمليات المستخدمة في الكود ولتعزيز الفهم.

قراءة إطارات البيانات من ملفات CSV:
في البداية، يتم استخدام pd.read_csv لقراءة محتويات ملفات CSV (df1.csv و df2.csv) وتحويلها إلى إطارات بيانات Pandas. يفترض أن تحتوي هذه الملفات على بيانات مثلما ذكرت في الاستفسار.
```
python
df1 = pd.read_csv('df1.csv')
df2 = pd.read_csv('df2.csv')
```
الدمج باستخدام merge:
يتم استخدام pd.merge لدمج إطاري البيانات df1 و df2 باستناد إلى الأعمدة المشتركة “Reg1” و “Reg”. يتم تخزين النتائج في إطار بيانات جديد يُسمى merged_df.
```
python
merged_df = pd.merge(df1, df2, left_on='Reg1', right_on='Reg')
```
هذا يؤدي إلى دمج البيانات بحيث تظهر الأعمدة المشتركة “Reg1” و “Reg” في النتيجة.
إنشاء إطار بيانات جديد:
يتم إنشاء إطار البيانات الجديد newfram باستخدام البيانات من merged_df. يتم تحديد الأعمدة المراد استخدامها في الإطار الجديد بواسطة الأسماء المحددة.
```
python
newfram = pd.DataFrame({
    'Reg1': merged_df['Reg1'],
    'Rank1': merged_df['Rank'],
    'Reg2': merged_df['Reg2'],
    'Rank2': merged_df['Rank']
})
```
هنا، يتم اختيار الأعمدة “Reg1” و “Reg2” من merged_df، وكذلك الأعمدة “Rank” و “Rank2”. يتم استخدام هذه الأعمدة لإنشاء إطار البيانات الجديد.
طباعة الإطار الجديد:
يتم استخدام print لطباعة إطار البيانات الجديد newfram إلى الإخراج.
```
python
print(newfram)
```
هذا يعرض النتيجة النهائية للمستخدم، والتي يحتوي على الأعمدة “Reg1″، “Rank1″، “Reg2″، و “Rank2” مع البيانات المندمجة.

25/02/2024آخر تحديث: 25/02/2024

9 دقيقة واحدة

المزيد من المعلومات

إنشاء أزرار دائرية بحدود بيضاء في تطبيقات UWP باستخدام C#

حلول لمشكلة تحديث حقل textarea في MySQL باستخدام نوع حقل مناسب

مقالات ذات صلة

كتابة DataFrame إلى ملف نصي باستخدام Spark SQL: دليل شامل

تحسين تجربة البحث في Pip باستخدام خيار البحث بواسطة اسم الحزمة

تطوير ألعاب الويب: JavaScript vs ActionScript

تحويل مؤشرات القائمة في Python