في البداية، عند العمل مع SFrame، يمكنك استخدام دالة الجمع +
لدمج الأعمدة معًا بدلاً من استخدام دالة append
، مما يقلل من الحاجة إلى إنشاء هيكل بيانات مؤقت كبير. على سبيل المثال:
cssunique_values = (sf['x'] + sf['y']).unique()
هذا سيقوم بدمج أعمدة “x” و “y” مباشرة، ومن ثم العثور على القيم الفريدة بسرعة.
بالنسبة لـ pandas، يمكنك استخدام الطريقة نفسها باستخدام دالة unique
مباشرة على الجمع المباشر لأعمدة البيانات. على سبيل المثال:
pythonimport pandas as pd
df = pd.DataFrame({'x': [1, 1, 2, 5, 7], 'y': [2, 4, 6, 8, 2], 'z': [2, 5, 8, 6, 2]})
unique_values = (df['x'] + df['y']).unique()
هذا يقوم بنفس العملية التي تمت في SFrame، حيث يتم دمج أعمدة “x” و “y” مباشرة ثم البحث عن القيم الفريدة بفضل استخدام دالة unique
. هذا الأسلوب يكون فعالًا من حيث الأداء ويقلل من استخدام الذاكرة.
المزيد من المعلومات
بالطبع، هناك مزيد من المعلومات التي يمكن تقديمها بشأن الطرق الفعالة للحصول على القيم الفريدة من عدة أعمدة في DataFrame و SFrame.
عند استخدام الجمع المباشر للأعمدة في pandas و SFrame، يتم دمج القيم من الأعمدة بشكل فعال بدون الحاجة إلى إنشاء هيكل بيانات مؤقت. هذا يوفر أداءً أفضل خصوصاً عندما تكون البيانات كبيرة.
ومن الجدير بالذكر أنه في pandas، يمكن استخدام الجمع المباشر للأعمدة بدون الحاجة إلى استيراد إضافي، بينما في SFrame يتطلب الأمر استيراد SFrame وإنشاء كائن SFrame.
علاوة على ذلك، يمكن استخدام هذه الطريقة للعمل مع أي عدد من الأعمدة. فإذا كان لديك أكثر من عمودين تريد الجمع بينهما للعثور على القيم الفريدة، يمكنك ببساطة تضمينهما في العملية بنفس الطريقة.
وفي النهاية، يعتبر استخدام الجمع المباشر للأعمدة واحدة من الطرق الفعالة والبسيطة للحصول على القيم الفريدة من مجموعة من الأعمدة في DataFrame و SFrame، ويوفر أداءً ممتازًا وتحسينًا في استخدام الذاكرة مقارنة بطرق أخرى مثل استخدام دالة append
.