البرمجة

استخدام دالة %in% في R لاستخراج المراقبات المشتركة بين مجموعتي بيانات

في لغة البرمجة R، يمكنك استخدام الدالة %in% للحصول على جميع المراقبات من مجموعة بيانات واحدة تتواجد في مجموعة بيانات أخرى باستخدام معرف ربط. في هذه الحالة، يمكننا استخدام الدالة %in% للتحقق مما إذا كانت قيم العمود “id” في البيانات d1 تتواجد أيضًا في البيانات d2.

لنقم بذلك بشكل فعال، يمكننا استخدام السطور التالية:

R
# تحديد مجموعة بيانات d1 d1 <- data.frame(id = seq(1:10), x1 = rnorm(10)) # تحديد مجموعة بيانات d2 d2 <- data.frame(id = seq(3:7), x2 = rnorm(5)) # إنشاء مجموعة بيانات d3 باستخدام الدالة %in% d3 <- d1[d1$id %in% d2$id, ] # طباعة محتوى مجموعة البيانات d3 print(d3)

باستخدام هذه السطور، ستحصل على مجموعة بيانات جديدة d3 تحتوي على الصفوف التي تحتوي قيم “id” المتواجدة في كل من d1 و d2. الدالة %in% تعيد قيم صحيحة للصفوف التي تحتوي على قيم متطابقة، وباستخدامها كفلتر لـ d1، نحصل على مجموعة بيانات d3 المطلوبة.

المزيد من المعلومات

في الشيفرة البرمجية التي قدمتها، قمت بتحديد مجموعتي بيانات d1 و d2، حيث d1 تحتوي على عمود “id” وعمود “x1″، وd2 تحتوي على عمود “id” وعمود “x2”. ثم استخدمت الدالة %in% لإنشاء مجموعة بيانات جديدة d3.

لتوضيح أكثر، دعونا نلقي نظرة أعمق على الشيفرة:

R
# تحديد مجموعة بيانات d1 d1 <- data.frame(id = seq(1:10), x1 = rnorm(10)) # تحديد مجموعة بيانات d2 d2 <- data.frame(id = seq(3:7), x2 = rnorm(5)) # إنشاء مجموعة بيانات d3 باستخدام الدالة %in% d3 <- d1[d1$id %in% d2$id, ] # طباعة محتوى مجموعة البيانات d3 print(d3)
  1. في المجموعة الأولى (d1):

    • تم تحديد “id” كعمود للمجموعة بيانات باستخدام data.frame(id = seq(1:10), x1 = rnorm(10)).
    • تم توليد قيم عشوائية للعمود “x1” باستخدام rnorm(10).
  2. في المجموعة الثانية (d2):

    • تم تحديد “id” كعمود للمجموعة بيانات باستخدام data.frame(id = seq(3:7), x2 = rnorm(5)).
    • تم توليد قيم عشوائية للعمود “x2” باستخدام rnorm(5).
  3. الخطوة الرئيسية:

    • استخدمنا %in% لإنشاء مجموعة بيانات جديدة d3 بناءً على شرط أن قيم “id” في d1 تكون متواجدة أيضًا في d2. يتم ذلك باستخدام d1$id %in% d2$id.
    • النتيجة هي مجموعة بيانات d3 التي تحتوي فقط على الصفوف التي تلبي هذا الشرط.
  4. أخيرًا، طبعت محتوى مجموعة البيانات d3 باستخدام print(d3).

باختصار، الشيفرة تقوم بإنشاء مجموعة بيانات جديدة (d3) تحتوي على الصفوف التي تحقق شرط وجود القيم في العمود “id” من d1 أيضًا في d2.

مقالات ذات صلة

زر الذهاب إلى الأعلى
إغلاق

أنت تستخدم إضافة Adblock

يرجى تعطيل مانع الإعلانات حيث أن موقعنا غير مزعج ولا بأس من عرض الأعلانات لك فهي تعتبر كمصدر دخل لنا و دعم مقدم منك لنا لنستمر في تقديم المحتوى المناسب و المفيد لك فلا تبخل بدعمنا عزيزي الزائر