تحويل البيانات باستخدام Pandas.factorize

25/03/2024آخر تحديث: 25/03/2024

4 2 دقائق

عند التعامل مع البيانات في بيئة Python واستخدام مكتبة Pandas، يمكن أن يكون من المهم تحويل القيم النصية في العديد من الأعمدة إلى قيم رقمية والعكس بطريقة سهلة وفعالة. في هذا السياق، تأتي وظيفة pandas.factorize إلى الصورة. هذه الوظيفة تقوم بترميز القيم المدخلة كنوع معدود أو متغير تصنيفي.

لكن السؤال الذي يطرح نفسه هو: كيف يمكنني تحويل العديد من الأعمدة في إطار بيانات (DataFrame) والقيام بخطوة التعيين العكسي بسهولة؟

فيما يلي خطوات بسيطة لتحقيق ذلك باستخدام مكتبة Pandas:

تطبيق pandas.factorize على الأعمدة المطلوبة: يمكنك استخدام وظيفة applymap لتطبيق pandas.factorize على كل عنصر في الإطار البيانات.
خطوة التعيين العكسي: لتنفيذ الخطوة العكسية وترجمة القيم الرقمية إلى قيم نصية، يمكنك استخدام الدالة numpy.take مع القيم المدخلة والمعيار الذي تم إنشاؤه من خلال pandas.factorize.

دعنا نبدأ بتطبيق هذه الخطوات على البيانات المعطاة في الصورة المقترحة:

python
import pandas as pd
import numpy as np

# البيانات المعطاة
data = {
    'Type 1': ['Water', 'Fire', 'Grass', 'Electric', 'Rock', 'Water'],
    'Type 2': ['Ice', 'Ground', 'Poison', 'Flying', 'Psychic', 'Fairy']
}

# إنشاء إطار البيانات
df = pd.DataFrame(data)

# تطبيق pandas.factorize على كل الأعمدة
factorized = df.applymap(lambda x: pd.factorize(df[x])[0])

# طباعة القيم المشفرة
print("البيانات المشفرة:")
print(factorized)

# خطوة التعيين العكسي
reverse_mapping = {col: {k: v for v, k in enumerate(df[col].unique())} for col in df.columns}
reverse_factorized = factorized.replace(reverse_mapping)

# طباعة القيم المعاد ترجمتها
print("\nالبيانات المعاد ترجمتها:")
print(reverse_factorized)

هذا المقطع من الكود يقوم بتحويل القيم النصية في البيانات إلى قيم رقمية باستخدام pandas.factorize، ثم ينفذ خطوة التعيين العكسي باستخدام القاموس المعكوس لترجمة القيم الرقمية إلى القيم النصية الأصلية.

بهذه الطريقة، يمكنك بسهولة تحويل العديد من الأعمدة في إطار البيانات الخاص بك والقيام بعملية الترجمة العكسية فيما بعد.

المزيد من المعلومات

تصدير بيانات DataTable إلى Excel باستخدام C#

إنشاء وإدارة كوكيز ASP.NET MVC

مقالات ذات صلة

دليل شامل على التوجيهات في AngularJS: تحسين تجربة تطوير تطبيقات الويب

تحليل وحل مشكلة قراءة البيانات من ملف النص في لغة البرمجة C++

فحص النسخ الاحتياطي لـ MySQL باستخدام سكريبت شل

تطوير تطبيق حاسبة بلغة C# و.NET: حلول لرسالة الخطأ ‘الاسم غير موجود في السياق الحالي’