البرمجة

Regex للبحث عن الحروف الصينية في Python 3

لتحديث الكود ليعمل بشكل صحيح في Python 3، يجب تعديل الاستدعاءات لموافقة التغييرات في النسخة. هنا الكود الذي يعمل في Python 3:

python
import re sample = 'I am from 美国。We should be friends. 朋友。' for n in re.findall(r'[\u4e00-\u9fff]+',sample): print(n)

تمت إزالة الحرف “u” من السلسلة لأنها لم تعد مطلوبة في Python 3. تم أيضًا إصلاح البايت “ur” ليصبح “r” فقط، لأن البادئة “r” تستخدم لتحديد السلاسل النصية الخام (raw strings) التي تمت معالجتها بواسطة Regex بشكل صحيح.

المزيد من المعلومات

بالطبع! في الكود الذي قدمته، يتم استخدام وحدة re للتعبيرات العادية للبحث عن نص بناء على نمط محدد. تمثل التعبيرات العادية (Regex) مجموعة من القواعد التي تسمح بتحديد نمط معين في سلسلة نصوص. في هذا السياق، يتم استخدام الرموز “\u4e00-\u9fff” للبحث عن النصوص التي تحتوي على حروف صينية، حيث تتراوح قيم يونيكود لهذه الحروف بين \u4e00 و \u9fff.

عند تشغيل الكود، سيتم طباعة أي نص صيني يتم العثور عليه في السلسلة sample.

زر الذهاب إلى الأعلى