البرمجة

تحليل البيانات باستخدام Pandas: أساسيات التشكيل والتحليل

في بيئة البرمجة باستخدام لغة مثل Python، يمكنك تحقيق هدفك بشكل فعال باستخدام مكتبة pandas. هذه المكتبة توفر وسائل قوية لتحليل وتنسيق البيانات، ويمكنك استخدامها لإعادة تشكيل الأعمدة في إطار البيانات الخاص بك.

في البداية، يجب أن تتأكد من استيراد مكتبة pandas في بيئتك. يمكنك القيام بذلك باستخدام الأمر التالي:

python
import pandas as pd

ثم، إذا كانت إطار البيانات الخاص بك يسمى df، يمكنك استخدام الأمر التالي لإعادة تشكيل الأعمدة:

python
df = pd.DataFrame({ 'name': ['stoc_from_csv', 'stock up to date'], 'stock1': ['Google', 'Opel'], 'stock2': ['Yahoo', 'Tayoota'], 'value1': [50, 42], 'value2': [21, 44] }) # إعادة تشكيل الأعمدة df = df[['name', 'stock1', 'value1', 'stock2', 'value2']]

باستخدام الكود أعلاه، ستحصل على إطار بيانات يتم تشكيل فيه الأعمدة كما تريد. يتم تحديد ترتيب الأعمدة الجديدة في القائمة التي تمررها إلى df[[‘name’, ‘stock1’, ‘value1’, ‘stock2’, ‘value2’]].

يمكنك ضبط هذا الكود حسب احتياجاتك، ويمكنك أيضًا استخدام الكثير من الوظائف الإضافية المتوفرة في pandas لتحسين تحليل البيانات الخاصة بك.

المزيد من المعلومات

في تحليل البيانات باستخدام مكتبة pandas في لغة Python، هناك العديد من الوظائف والتقنيات التي يمكنك استخدامها لتحسين أداء ومرونة عمليات التحليل. سأقدم لك بعض المعلومات الإضافية لزيادة قيمة الحل:

1. قراءة البيانات من مصدر خارجي:

يمكنك استخدام pandas لقراءة البيانات من مصادر متنوعة مثل ملفات CSV، Excel، قواعد بيانات SQL، وحتى الوصول إلى بيانات عبر الإنترنت. على سبيل المثال:

python
# قراءة بيانات من ملف CSV df = pd.read_csv('اسم_الملف.csv') # قراءة بيانات من Excel df = pd.read_excel('اسم_الملف.xlsx') # الاتصال بقاعدة بيانات SQL import sqlite3 conn = sqlite3.connect('قاعدة_البيانات.db') df = pd.read_sql_query('SELECT * FROM اسم_الجدول', conn)

2. التحقق من البيانات:

قبل القيام بأي تحولات، يمكنك استخدام وظائف pandas لفحص البيانات والتحقق من وجود أية قيم مفقودة أو تكرارات. على سبيل المثال:

python
# التحقق من وجود قيم مفقودة missing_values = df.isnull().sum() # التحقق من التكرارات duplicates = df.duplicated()

3. التحويلات والتحليل الإحصائي:

يمكنك استخدام pandas لإجراء تحليل إحصائي على البيانات الخاصة بك، مثل حساب المتوسط والانحراف المعياري. على سبيل المثال:

python
# حساب المتوسط average_value1 = df['value1'].mean() # حساب الانحراف المعياري std_dev_value2 = df['value2'].std()

4. التصفية والفرز:

يمكنك استخدام وظائف pandas لتصفية البيانات بناءً على شروط محددة أو لفرزها وفقًا لقيم معينة. على سبيل المثال:

python
# تصفية البيانات حسب قيمة معينة في عمود معين filtered_data = df[df['value1'] > 40] # فرز البيانات بناءً على قيمة معينة sorted_data = df.sort_values(by='value1', ascending=False)

5. الإنضمام والتحقق:

يمكنك دمج إطاري بيانات مختلفين باستخدام وظيفة الإنضمام (merge)، ويمكنك أيضًا التحقق من العلاقات بين الأعمدة. على سبيل المثال:

python
# الإنضمام بين إطاري بيانات على أساس عمود مشترك merged_data = pd.merge(df1, df2, on='common_column') # التحقق من العلاقة بين الأعمدة correlation = df['value1'].corr(df['value2'])

هذه بعض الجوانب الإضافية التي يمكنك استكشافها واستخدامها لتحسين تحليل البيانات الخاصة بك باستخدام pandas. يمكنك استكشاف مستندات pandas للحصول على مزيد من التفاصيل والوظائف المتاحة: مستندات pandas.

مقالات ذات صلة

زر الذهاب إلى الأعلى
إغلاق

أنت تستخدم إضافة Adblock

يرجى تعطيل مانع الإعلانات حيث أن موقعنا غير مزعج ولا بأس من عرض الأعلانات لك فهي تعتبر كمصدر دخل لنا و دعم مقدم منك لنا لنستمر في تقديم المحتوى المناسب و المفيد لك فلا تبخل بدعمنا عزيزي الزائر