المدونة
جاهزية البيانات قبل الذكاء الاصطناعي: خريطة طريق عملية للمؤسسات في الرياض
كثير من المؤسسات تبدأ الذكاء الاصطناعي من “النموذج”، ثم تكتشف أن المشكلة لم تكن في النموذج أصلًا… بل في البيانات: بيانات ناقصة، متكررة، غير موحّدة، أو بلا صلاحيات واضحة.
القاعدة العملية: قبل أن تفكر في الذكاء الاصناعي، نظّف مسار البيانات. هذا ما يصنع الفرق بين مشروع تجريبي جميل وبين حل يعمل ويُقاس أثره.
1) كيف تعرف أن بياناتك غير جاهزة؟
إذا ظهر عندك واحد أو أكثر من التالي، فأنت بحاجة إلى “حوكمة بيانات” قبل الذكاء الاصطناعي:
• أكثر من ملف “عميل” في أكثر من مكان وكل واحد يعطي رقمًا مختلفًا
• تقارير تُعد يدويًا لأن المصدر غير موثوق
• نفس الحقل يُكتب بعدة صيغ (الهاتف/العنوان/الهوية)
• لا توجد صلاحيات واضحة: من يطّلع؟ من يعدّل؟ ومن يوافق؟
2) نموذج حوكمة بيانات مبسط (بدون تعقيد)
حوكمة البيانات ليست بيروقراطية. هي 4 قرارات إدارية واضحة:
1. تعريف البيانات الحرجة: ما البيانات التي تؤثر على القرار؟ (عملاء/طلبات/مالية/موارد بشرية)
2. تعيين “مالك بيانات”: شخص/إدارة مسؤولة عن صحة هذا النوع من البيانات
3. قواعد الجودة: ما الحد الأدنى المقبول؟ (اكتمل؟ دقة؟ تكرار؟)
4. الصلاحيات والتتبع: من يرى/يعدل/يوافق + سجل تغييرات
3) الخصوصية ليست خيارًا (خصوصًا داخل السعودية)
إذا كانت البيانات تخص أفرادًا، فأنت تتعامل مع التزامات حقيقية ضمن نظام حماية البيانات الشخصية (PDPL). اجعل ضمن الحوكمة: الغرض من الجمع، الحد الأدنى من البيانات، سياسات الاحتفاظ، وإجراءات الحماية.
مرجع رسمي (PDF):
4) الأمن السيبراني كحد أدنى لتشغيل حلول البيانات
5) خطة 30 يومًا لرفع الجاهزية (مختصرة وقابلة للتنفيذ)
• الأسبوع 1: تحديد بيانات حرجة + مصدر الحقيقة + قائمة حقول موحّدة
• الأسبوع 2: تنظيف التكرار + قواعد إدخال موحدة + توثيق تعريفات الحقول
• الأسبوع 3: صلاحيات وصول + سجل تغييرات + سياسة احتفاظ
• الأسبوع 4: لوحة جودة بيانات (نسبة اكتمال/تكرار/أخطاء) + اختيار Use Case واحد للذكاء الاصطناعي