البرمجة

دمج بيانات إطارات Pandas في Python: إنشاء إطار بيانات جديد بفعالية

للقيام بتحقيق الهدف الذي ورد في استفسارك، يمكن استخدام مكتبة Pandas في لغة البرمجة بايثون. يبدو أنك ترغب في دمج إطاري بيانات df1 و df2 استنادًا إلى الأعمدة المشتركة “Reg” و “Reg1″، ثم إنشاء إطار بيانات جديد newfram يحتوي على الأعمدة “Reg1″، “Rank1″، “Reg2″، و “Rank2”.

لتحقيق هذا، يمكنك استخدام ميثود merge في Pandas. فيما يلي سيناريو برمجي يوضح كيف يمكن تحقيق ذلك:

python
import pandas as pd # قراءة إطارات البيانات من ملفات CSV df1 = pd.read_csv('df1.csv') df2 = pd.read_csv('df2.csv') # الدمج بين df1 و df2 باستخدام عملية الانضمام merged_df = pd.merge(df1, df2, left_on='Reg1', right_on='Reg') # إنشاء إطار البيانات الجديد newfram = pd.DataFrame({ 'Reg1': merged_df['Reg1'], 'Rank1': merged_df['Rank'], 'Reg2': merged_df['Reg2'], 'Rank2': merged_df['Rank'] }) # طباعة الإطار الجديد print(newfram)

هذا الكود يستخدم مكتبة Pandas لقراءة إطارات البيانات من ملفات CSV، ثم يقوم بعملية الدمج باستخدام العملية merge باستناد إلى الأعمدة المشتركة. أخيرًا، يتم إنشاء إطار البيانات الجديد newfram باستخدام البيانات المدموجة.

هذه الطريقة أكثر فاعلية من استخدام البرمجة الأساسية في Python، خاصةً مع البيانات الكبيرة، حيث تقوم Pandas بتنفيذ العمليات بشكل أسرع وبشكل أكثر فعالية.

المزيد من المعلومات

بالطبع، دعنا نضيف المزيد من المعلومات لتوضيح العمليات المستخدمة في الكود ولتعزيز الفهم.

  1. قراءة إطارات البيانات من ملفات CSV:
    في البداية، يتم استخدام pd.read_csv لقراءة محتويات ملفات CSV (df1.csv و df2.csv) وتحويلها إلى إطارات بيانات Pandas. يفترض أن تحتوي هذه الملفات على بيانات مثلما ذكرت في الاستفسار.

    python
    df1 = pd.read_csv('df1.csv') df2 = pd.read_csv('df2.csv')
  2. الدمج باستخدام merge:
    يتم استخدام pd.merge لدمج إطاري البيانات df1 و df2 باستناد إلى الأعمدة المشتركة “Reg1” و “Reg”. يتم تخزين النتائج في إطار بيانات جديد يُسمى merged_df.

    python
    merged_df = pd.merge(df1, df2, left_on='Reg1', right_on='Reg')

    هذا يؤدي إلى دمج البيانات بحيث تظهر الأعمدة المشتركة “Reg1” و “Reg” في النتيجة.

  3. إنشاء إطار بيانات جديد:
    يتم إنشاء إطار البيانات الجديد newfram باستخدام البيانات من merged_df. يتم تحديد الأعمدة المراد استخدامها في الإطار الجديد بواسطة الأسماء المحددة.

    python
    newfram = pd.DataFrame({ 'Reg1': merged_df['Reg1'], 'Rank1': merged_df['Rank'], 'Reg2': merged_df['Reg2'], 'Rank2': merged_df['Rank'] })

    هنا، يتم اختيار الأعمدة “Reg1” و “Reg2” من merged_df، وكذلك الأعمدة “Rank” و “Rank2”. يتم استخدام هذه الأعمدة لإنشاء إطار البيانات الجديد.

  4. طباعة الإطار الجديد:
    يتم استخدام print لطباعة إطار البيانات الجديد newfram إلى الإخراج.

    python
    print(newfram)

    هذا يعرض النتيجة النهائية للمستخدم، والتي يحتوي على الأعمدة “Reg1″، “Rank1″، “Reg2″، و “Rank2” مع البيانات المندمجة.

زر الذهاب إلى الأعلى