تحسين كفاءة تغذية بيانات TensorFlow

21/03/2024آخر تحديث: 21/03/2024

3 2 دقائق

عندما يتعلق الأمر بتدريب النماذج باستخدام TensorFlow وتقييمها بشكل دوري باستخدام مجموعة بيانات تقييم منفصلة، يمكن أن يواجه المرء تحديًا في تنظيم تغذية البيانات بشكل فعال للنموذج. في مشكلتك، قمت بتجميع بيانات التدريب والتقييم في نفس الرسم البياني واستخدمت tf.cond لتبديل بينهما باستخدام مؤشر is_training. ومع ذلك، لاحظت أنه في حالة الخلط، يبدو أن كلتا الإدخالين يتم قراءتهما / تحليلهما، حتى إذا كان فقط أحدهما مستخدمًا. هذا يشير إلى حدوث حسابات غير ضرورية.

لتجنب هذه الحسابات غير الضرورية، يمكنك استخدام آلية أخرى لتبديل بين بيانات التدريب والتقييم دون الحاجة إلى قراءة كلتا البيانات في كل مرة. يمكن تحقيق ذلك باستخدام آلية التغيير بين الجلسات (Session Run Hooks) في TensorFlow. باستخدام هذه الآلية، يمكنك إعداد جلسة TensorFlow لتبديل بين بيانات التدريب والتقييم بشكل ديناميكي دون الحاجة إلى إعادة تعريف الرسم البياني في كل مرة.

الآلية تتمثل في إنشاء متغير (variable) يشير إلى ما إذا كانت الجلسة الحالية تعمل في وضعية تدريب أم لا. وبناءً على قيمة هذا المتغير، يتم تغيير تدفق البيانات دون الحاجة إلى قراءة كلتا المجموعتين في كل مرة. هذا يقلل من التكلفة الحسابية ويجعل العملية أكثر كفاءة.

لذا، يمكن تعديل الشيفرة لتضمن هذا النوع من التبديل بين بيانات التدريب والتقييم باستخدام آلية التغيير بين الجلسات كما يلي:

python
import tensorflow as tf
from tensorflow.models.image.cifar10 import cifar10
from time import time

def time_inputs(inputs_fn, n_runs=10):
    graph = tf.Graph()
    with graph.as_default():
        is_training = tf.placeholder(dtype=tf.bool, shape=(), name='is_training')
        images, labels = inputs_fn(is_training)

        # Variable to indicate the mode: training or evaluation
        is_training_var = tf.Variable(True, trainable=False, dtype=tf.bool)
        switch_mode_op = tf.assign(is_training_var, is_training)

    with tf.Session(graph=graph) as sess:
        coordinator = tf.train.Coordinator()
        threads = tf.train.start_queue_runners(sess=sess, coord=coordinator)

        # Initialize variables
        sess.run(tf.global_variables_initializer())

        t = time()
        for i in range(n_runs):
            # Switch mode (training/evaluation)
            sess.run(switch_mode_op, feed_dict={is_training: True})

            # Fetch images and labels based on the current mode
            im, l = sess.run([images, labels])

        dt = time() - t
        coordinator.request_stop()
        coordinator.join(threads)

    return dt / n_runs

print('Train inputs: %.3f' % time_inputs(get_train_inputs))
print('Eval inputs: %.3f' % time_inputs(get_eval_inputs))
print('Mixed inputs: %.3f' % time_inputs(get_mixed_inputs))

هكذا، يمكنك الآن تبديل بين بيانات التدريب والتقييم بشكل فعال ودون حسابات غير ضرورية، مما يجعل تدريب النموذج أكثر كفاءة.

تحسين كفاءة تغذية بيانات TensorFlow

المزيد من المعلومات

أقرأ التالي

فهم التشابهات والفروق: التكوين والصفوف الداخلية

كيفية ضبط الكوكيز والوصول لبيانات المواقع باستخدام PHP

استكشاف البديل لـ FindAsync في LINQ: الحلول باستخدام SingleOrDefaultAsync

تحسين أداء التطبيقات على iOS

فهم التشابهات والفروق: التكوين والصفوف الداخلية

كيفية ضبط الكوكيز والوصول لبيانات المواقع باستخدام PHP

استكشاف البديل لـ FindAsync في LINQ: الحلول باستخدام SingleOrDefaultAsync

تحسين أداء التطبيقات على iOS

المزيد من المعلومات

أقرأ التالي

فهم التشابهات والفروق: التكوين والصفوف الداخلية

كيفية ضبط الكوكيز والوصول لبيانات المواقع باستخدام PHP

استكشاف البديل لـ FindAsync في LINQ: الحلول باستخدام SingleOrDefaultAsync

تحسين أداء التطبيقات على iOS

حل مشكلة TypeScript: خطأ TS2339 في React

قراءة السلاسل في C: مشكلة تجاوز الحدود

مقالات ذات صلة