البرمجة

كيفية تحليل الجمل المحتوية على كلمات معينة في R

لتحليل الجمل المحتوية على كلمات معينة في R، يمكنك استخدام مكتبة stringr لتقسيم النص إلى جمل باستخدام الفاصل النهائي. ثم يمكنك استخدام وظيفة grepl للبحث عن الكلمات المحددة في كل جملة واستخدام ذلك لاستخراج الجمل المطابقة.

هناك العديد من الطرق للقيام بذلك، ولكن هذا مثال بسيط:

R
library(stringr) # البيانات النصية texts <- c("هذه جملة تحتوي على كلمة محددة.", "هذه جملة أخرى ليست بها الكلمة.", "هذه جملة ثالثة تحتوي على الكلمة.") # كلمات محددة تريد البحث عنها specific_words <- c("محددة", "الكلمة") # تحليل النص للعثور على الجمل التي تحتوي على الكلمات المحددة matched_sentences <- str_extract_all(texts, paste(specific_words, collapse = "|")) # عرض الجمل المطابقة print(matched_sentences)

بالنسبة لإنشاء مجموعة ثانية من الجمل المستقلة عن المجموعة الأصلية، يمكنك ببساطة نسخ الجمل التي تريدها إلى مصفوفة جديدة والعمل عليها بشكل مستقل عن البيانات الأصلية.

R
# نسخ الجمل المطابقة إلى مصفوفة جديدة second_set <- matched_sentences[[1]] # عرض الجمل المستقلة print(second_set)

يرجى تغيير المتغيرات texts و specific_words لتناسب بياناتك الفعلية وكلماتك المحددة.

المزيد من المعلومات

بالطبع! يمكنك تحسين العملية عن طريق إجراء التحليل على البيانات المستقلة بدلاً من نسخها إلى مصفوفة جديدة. يمكنك استخدام الجمل المطابقة كمؤشر لتحديد الصفوف المناسبة من البيانات الأصلية. على سبيل المثال:

R
library(stringr) # البيانات النصية texts <- c("هذه جملة تحتوي على كلمة محددة.", "هذه جملة أخرى ليست بها الكلمة.", "هذه جملة ثالثة تحتوي على الكلمة.") # كلمات محددة تريد البحث عنها specific_words <- c("محددة", "الكلمة") # تحليل النص للعثور على الجمل التي تحتوي على الكلمات المحددة matched_sentences <- str_extract_all(texts, paste(specific_words, collapse = "|")) # استخدام الجمل المطابقة كمؤشر لتحديد الصفوف المناسبة من البيانات الأصلية selected_rows <- unlist(lapply(matched_sentences, function(x) which(texts %in% x))) # البيانات المستقلة independent_set <- texts[selected_rows] # عرض الجمل المستقلة print(independent_set)

هذا التحسين يمكن أن يكون مفيدًا إذا كانت لديك بيانات أكبر وتريد تجنب استنساخ البيانات. يرجى ملاحظة أنه يجب ضبط المتغيرات texts و specific_words وفقًا لبياناتك الفعلية.

زر الذهاب إلى الأعلى