البرمجة

تحويل واستخراج الأحرف الأولى باستخدام Pandas في Python

في عالم تحليل البيانات باستخدام مكتبة Pandas في Python، يمكن أن يكون التحدي الذي تواجهه تحويل الأرقام إلى سلاسل واستخراج الرقم الأول من كل قيمة في عمود معين، ثم حفظ هذه القيم في عمود جديد في الإطار البيانات. دعونا نلقي نظرة على كيفية تحقيق ذلك باستخدام Pandas.

أولاً وقبل كل شيء، يجب عليك استيراد مكتبة Pandas وإنشاء الإطار البيانات الخاص بك. في الشيفرة التي قدمتها، قمت بإنشاء إطار بيانات df مع عمودين يسمى “First” و”Second”.

python
import pandas as pd a = pd.Series([123, 22, 32, 453, 45, 453, 56]) b = pd.Series([234, 4353, 355, 453, 345, 453, 56]) df = pd.concat([a, b], axis=1) df.columns = ['First', 'Second']

الخطوة الأولى هي تحويل قيم العمود “First” إلى سلاسل. يمكن القيام بذلك باستخدام الدالة astype(str) التي تحول القيم إلى سلاسل.

python
df['First'] = df['First'].astype(str)

ثم، يمكنك استخدام الدالة str[0] لاستخراج الحرف الأول من كل سلسلة في العمود “First”. وأخيرًا، قم بحفظ النتائج في عمود جديد، سنطلق عليه اسم “First_Letter”.

python
df['First_Letter'] = df['First'].str[0]

الشيفرة الكاملة تكون كالتالي:

python
import pandas as pd a = pd.Series([123, 22, 32, 453, 45, 453, 56]) b = pd.Series([234, 4353, 355, 453, 345, 453, 56]) df = pd.concat([a, b], axis=1) df.columns = ['First', 'Second'] df['First'] = df['First'].astype(str) df['First_Letter'] = df['First'].str[0]

الآن يحتوي df على عمود إضافي يسمى “First_Letter” يحتوي على الحرف الأول من قيم العمود “First”. يمكنك استخدام هذا العمود الجديد في تحليل البيانات الخاصة بك.

المزيد من المعلومات

بالطبع، يمكننا توسيع فهمنا للكود وإضافة بعض التفاصيل التي قد تكون مفيدة أثناء التعامل مع بياناتك باستخدام Pandas.

  1. التحويل إلى سلاسل:
    في السطر:

    python
    df['First'] = df['First'].astype(str)

    تقوم بتحويل قيم العمود “First” إلى سلاسل. هذا يفيد فيما بعد عند استخدام الدوال الخاصة بالسلاسل مثل str[0] لاستخراج الحرف الأول.

  2. استخدام دوال السلاسل:
    في السطر:

    python
    df['First_Letter'] = df['First'].str[0]

    تستخدم دالة str[0] لاستخراج الحرف الأول من كل سلسلة في العمود “First”. يمكنك تكرار هذه العملية باستخدام دوال السلاسل الأخرى حسب حاجتك.

  3. تحليل البيانات:
    الآن بعد إضافة العمود “First_Letter”، يمكنك استخدام Pandas لتحليل البيانات بشكل أفضل. على سبيل المثال، يمكنك فرز البيانات حسب الحرف الأول أو حتى حسب القيم الأصلية في العمود “First”.

    python
    # فرز البيانات حسب الحرف الأول df_sorted = df.sort_values(by='First_Letter') # عرض البيانات المرتبة print(df_sorted)
  4. إلقاء نظرة على البيانات:
    لفحص البيانات بشكل أفضل، يمكنك استخدام دالة head() لعرض عدد محدد من الصفوف الأولى في الإطار.

    python
    # عرض أول 5 صفوف من الإطار بعد التعديلات print(df.head())

    هذا يسمح لك بالتحقق من النتائج والتأكد من صحة التحويلات والتحليلات.

  5. حفظ البيانات:
    يمكنك حفظ الإطار بيانات النهائي بعد التحويلات باستخدام دالة to_csv() للتصدير إلى ملف CSV أو أي تنسيق آخر حسب حاجتك.

    python
    # حفظ الإطار بيانات إلى ملف CSV df.to_csv('data_with_first_letter.csv', index=False)

    هذا يمكن أن يكون مفيدًا إذا كنت ترغب في مشاركة أو استخدام البيانات المعدلة لاحقًا.

مقالات ذات صلة

زر الذهاب إلى الأعلى

هذا المحتوى محمي من النسخ لمشاركته يرجى استعمال أزرار المشاركة السريعة أو تسخ الرابط !!