تحليل ملفات XML باستخدام Python

تبدو المشكلة في الطريقة التي تقوم بها بتحديد مسار الملفات. عند استخدام os.listdir(path)، فإن الأسماء التي يرجعها هذا الدالة هي أسماء الملفات فقط داخل المجلد، وليس المسارات الكاملة إليها. لذا، عندما تحاول استخدام ET.parse(filename)، فإنه يحاول البحث عن الملفات باسمها فقط، وليس بالمسار الكامل.

لحل هذه المشكلة، يمكنك استخدام os.path.join() لدمج مسار المجلد مع اسم الملف أثناء التحليل. يمكنك تحديث الكود كما يلي:

python
import os
import xml.etree.ElementTree as ET
import pandas as pd

path='C:\\Users\\manusharma\\Training'
df = pd.DataFrame(columns=['text', 'type'])

for filename in os.listdir(path):
    full_path = os.path.join(path, filename)
    tree = ET.parse(full_path)
    a = ET.tostring(tree.getroot(), encoding='utf-8', method='text')
    c = a.replace('\n', '')
    df = df.append({'text': c, 'type': 'abc'}, ignore_index=True)

print(df.head())

هذا التعديل يجمع بين المسار الكامل للمجلد مع اسم الملف الذي تم العثور عليه، وبالتالي يمكن لـ ET.parse() إيجاد الملفات بنجاح وإجراء التحليل بشكل صحيح.

المزيد من المعلومات

كيفية بدء النشاط الثاني في التطبيق الأندرويد

كيفية إنشاء تطبيق مشاركة الشاشة في C#

مقالات ذات صلة

تجاوز حدود النتائج في Apache Zeppelin: استرجاع أكثر من 100 صف في استعلام SQL

اختبار الوحدات في Visual Studio C++: Managed vs. Native

استيراد React في مكونات Reactية

تحديث Spark 2.0: استراتيجيات تجاوز بطء الكتابة إلى S3

أنت تستخدم إضافة Adblock