XML هو لغة وسم تستخدم في تنظيم وتخزين البيانات بشكل هرمي. وتعتبر أساسيات نظام العلامة الموحدة (XML) في تنقيب البيانات هي:
1- العناصر: هي القيم الأساسية التي يتم تخزينها في XML وتحتوي على بيانات معينة.
2- الصفات: تساعد في وصف العناصر بشكل أفضل وتوفر معلومات إضافية حول البيانات الموجودة في العنصر.
3- العناوين: تستخدم لتحديد موقع العنصر داخل XML ومن الممكن استخدامها في تعريف العلاقات بين العناصر.
4- الفهرس: يساعد في تحديد ترتيب العناصر والفصل بينها.
5- النمط: يستخدم لتحديد التنسيق والتصميم الخاص بالبيانات الموجودة في XML.