تحويل واستخراج الأحرف الأولى باستخدام Pandas في Python
في عالم تحليل البيانات باستخدام مكتبة Pandas في Python، يمكن أن يكون التحدي الذي تواجهه تحويل الأرقام إلى سلاسل واستخراج الرقم الأول من كل قيمة في عمود معين، ثم حفظ هذه القيم في عمود جديد في الإطار البيانات. دعونا نلقي نظرة على كيفية تحقيق ذلك باستخدام Pandas.
أولاً وقبل كل شيء، يجب عليك استيراد مكتبة Pandas وإنشاء الإطار البيانات الخاص بك. في الشيفرة التي قدمتها، قمت بإنشاء إطار بيانات df مع عمودين يسمى “First” و”Second”.
pythonimport pandas as pd
a = pd.Series([123, 22, 32, 453, 45, 453, 56])
b = pd.Series([234, 4353, 355, 453, 345, 453, 56])
df = pd.concat([a, b], axis=1)
df.columns = ['First', 'Second']
الخطوة الأولى هي تحويل قيم العمود “First” إلى سلاسل. يمكن القيام بذلك باستخدام الدالة astype(str)
التي تحول القيم إلى سلاسل.
pythondf['First'] = df['First'].astype(str)
ثم، يمكنك استخدام الدالة str[0]
لاستخراج الحرف الأول من كل سلسلة في العمود “First”. وأخيرًا، قم بحفظ النتائج في عمود جديد، سنطلق عليه اسم “First_Letter”.
pythondf['First_Letter'] = df['First'].str[0]
الشيفرة الكاملة تكون كالتالي:
pythonimport pandas as pd
a = pd.Series([123, 22, 32, 453, 45, 453, 56])
b = pd.Series([234, 4353, 355, 453, 345, 453, 56])
df = pd.concat([a, b], axis=1)
df.columns = ['First', 'Second']
df['First'] = df['First'].astype(str)
df['First_Letter'] = df['First'].str[0]
الآن يحتوي df على عمود إضافي يسمى “First_Letter” يحتوي على الحرف الأول من قيم العمود “First”. يمكنك استخدام هذا العمود الجديد في تحليل البيانات الخاصة بك.
المزيد من المعلومات
بالطبع، يمكننا توسيع فهمنا للكود وإضافة بعض التفاصيل التي قد تكون مفيدة أثناء التعامل مع بياناتك باستخدام Pandas.
-
التحويل إلى سلاسل:
في السطر:pythondf['First'] = df['First'].astype(str)
تقوم بتحويل قيم العمود “First” إلى سلاسل. هذا يفيد فيما بعد عند استخدام الدوال الخاصة بالسلاسل مثل
str[0]
لاستخراج الحرف الأول. -
استخدام دوال السلاسل:
في السطر:pythondf['First_Letter'] = df['First'].str[0]
تستخدم دالة
str[0]
لاستخراج الحرف الأول من كل سلسلة في العمود “First”. يمكنك تكرار هذه العملية باستخدام دوال السلاسل الأخرى حسب حاجتك. -
تحليل البيانات:
الآن بعد إضافة العمود “First_Letter”، يمكنك استخدام Pandas لتحليل البيانات بشكل أفضل. على سبيل المثال، يمكنك فرز البيانات حسب الحرف الأول أو حتى حسب القيم الأصلية في العمود “First”.python# فرز البيانات حسب الحرف الأول df_sorted = df.sort_values(by='First_Letter') # عرض البيانات المرتبة print(df_sorted)
-
إلقاء نظرة على البيانات:
لفحص البيانات بشكل أفضل، يمكنك استخدام دالةhead()
لعرض عدد محدد من الصفوف الأولى في الإطار.python# عرض أول 5 صفوف من الإطار بعد التعديلات print(df.head())
هذا يسمح لك بالتحقق من النتائج والتأكد من صحة التحويلات والتحليلات.
-
حفظ البيانات:
يمكنك حفظ الإطار بيانات النهائي بعد التحويلات باستخدام دالةto_csv()
للتصدير إلى ملف CSV أو أي تنسيق آخر حسب حاجتك.python# حفظ الإطار بيانات إلى ملف CSV df.to_csv('data_with_first_letter.csv', index=False)
هذا يمكن أن يكون مفيدًا إذا كنت ترغب في مشاركة أو استخدام البيانات المعدلة لاحقًا.