تحويل البيانات باستخدام Pandas.factorize

عند التعامل مع البيانات في بيئة Python واستخدام مكتبة Pandas، يمكن أن يكون من المهم تحويل القيم النصية في العديد من الأعمدة إلى قيم رقمية والعكس بطريقة سهلة وفعالة. في هذا السياق، تأتي وظيفة pandas.factorize إلى الصورة. هذه الوظيفة تقوم بترميز القيم المدخلة كنوع معدود أو متغير تصنيفي.

لكن السؤال الذي يطرح نفسه هو: كيف يمكنني تحويل العديد من الأعمدة في إطار بيانات (DataFrame) والقيام بخطوة التعيين العكسي بسهولة؟

فيما يلي خطوات بسيطة لتحقيق ذلك باستخدام مكتبة Pandas:

تطبيق pandas.factorize على الأعمدة المطلوبة: يمكنك استخدام وظيفة applymap لتطبيق pandas.factorize على كل عنصر في الإطار البيانات.
خطوة التعيين العكسي: لتنفيذ الخطوة العكسية وترجمة القيم الرقمية إلى قيم نصية، يمكنك استخدام الدالة numpy.take مع القيم المدخلة والمعيار الذي تم إنشاؤه من خلال pandas.factorize.

دعنا نبدأ بتطبيق هذه الخطوات على البيانات المعطاة في الصورة المقترحة:

python
import pandas as pd
import numpy as np

# البيانات المعطاة
data = {
    'Type 1': ['Water', 'Fire', 'Grass', 'Electric', 'Rock', 'Water'],
    'Type 2': ['Ice', 'Ground', 'Poison', 'Flying', 'Psychic', 'Fairy']
}

# إنشاء إطار البيانات
df = pd.DataFrame(data)

# تطبيق pandas.factorize على كل الأعمدة
factorized = df.applymap(lambda x: pd.factorize(df[x])[0])

# طباعة القيم المشفرة
print("البيانات المشفرة:")
print(factorized)

# خطوة التعيين العكسي
reverse_mapping = {col: {k: v for v, k in enumerate(df[col].unique())} for col in df.columns}
reverse_factorized = factorized.replace(reverse_mapping)

# طباعة القيم المعاد ترجمتها
print("\nالبيانات المعاد ترجمتها:")
print(reverse_factorized)

هذا المقطع من الكود يقوم بتحويل القيم النصية في البيانات إلى قيم رقمية باستخدام pandas.factorize، ثم ينفذ خطوة التعيين العكسي باستخدام القاموس المعكوس لترجمة القيم الرقمية إلى القيم النصية الأصلية.

بهذه الطريقة، يمكنك بسهولة تحويل العديد من الأعمدة في إطار البيانات الخاص بك والقيام بعملية الترجمة العكسية فيما بعد.

المزيد من المعلومات

تصدير بيانات DataTable إلى Excel باستخدام C#

إنشاء وإدارة كوكيز ASP.NET MVC

مقالات ذات صلة

فوائد استخدام العناصر الدلالية في HTML5

تحليل أقصى إنتاجية النظام: استراتيجيات لتحسين الأداء

تقسيم النصوص في لغة C

مشكلة تشغيل Docker Desktop على Windows

أنت تستخدم إضافة Adblock