تعرفنا في الجزء السابق على مزيد من التفاصيل عن البيانات العملاقة (Big data)، وعن أهميتها التي تكمن في الفوائد المرجوُّة من تحليلها، ودورها في تمكين الهيئات والأفراد من معرفة المزيد عن المشكلات المراد حلها والتنبؤ بها قبل أن تحدث، وكذلك تمكينهم من تحسين أداء العمل وتطوير التكنولوجيا والانتقال بها إلى آفاق أبعد بكثير مما هي عليه الآن. وتناولنا أيضًا بعضًا من الانتقادات التي وُجِّهت لها من قبل العامة والعلماء. في هذا الجزء سنتناول تفاصيل عن تحليل تلك البيانات والبرامج المستخدمة لذلك، وتوقعات حول دقة نتائج التحليلات وعواقب ذلك على الحياة المهنية للبشر.
الواقع يقول إنَّ الشركات التي ستتمكن من تحويل تلك البيانات إلى توقعات ذات قيمة هي التي سوف تبقى بل وستتقدم الصفوف، بينما تلك التي تتعامل معها بسطحية فستتأخر إلى الوراء. أما التي تتجاهلها تمامًا فسوف تتلاشى عما قريب. والحق أنه لا عذر للشركات ألا تستخدم تلك الخدمة المتاحة، فالأمر لا يستلزم تكلفة كبيرة بشكل عام (إلا في حالة تحليل بيانات مخصوصة)، وعليه فإن أصغر الشركات يمكنها ذلك بالفعل عن طريق استئجار خدمة تحليل بيانات (Software as a service-SAAS) بتكلفة زهيدة بدلًا من شراء رخصة برمجيات باهظة الثمن، مما يوفر لها فرصًا مكافئة.
ما البيانات التي يتم تحليلها؟
هناك فكرة مغلوطة ربما تخطر للشركات، وهي أنَّه لمجرد وجود البيانات فإن ذلك يتيح لهم ببساطة الحصول على نتائج مثمرة. في الواقع، لا يكمن السر في تجميع البيانات، فإن ذلك يغرق مُتخذي القرار بمزيد من البيانات، ولكن السر يكمن في «البيانات ذات الصلة» (Relevant data)، هذا يعني أن الشركة لا بد وأن تقرر أولًا نوعية البيانات التي تريد أن تجمعها بما يتوافق مع أهدافها الاستراتيجية والأسئلة التي تبحث عن إجابة لها؛ حتى يكون تحليل البيانات ذا إجابات دالة على مؤشرات نجاح التجارة. وهو الأمر نفسه الذي يجري تقليديًا في الواقع مع البيانات الصغيرة ويطلق عليه «مؤشرات الأداء الرئيسية» (Key Performance Indicators-KPI).
فإذا تم أخذ ذلك في الاعتبار وتم اختيار المؤشرات المناسبة، ستحقق الشركة القيمة القصوى من استغلال البيانات، ففي النهاية تلك المؤشرات تشمل هامش الربح ورضا العميل ونصيب السوق ونمو العائد وأداء الموظفين، وهي كلها المكونات الحيوية لأي عمل. وعليه يجب التوقف عن جمع أية بيانات والتركيز فقط على البيانات التي تؤدي للتوقعات الصحيحة.
ما مراحل التحليل؟
في البداية تحصل الشركة على بيانات من مختلف الأنواع كتسجيلات للمبيعات، وقواعد بيانات العملاء، وردود أو تعليقات من قنوات التواصل الاجتماعي أو البريد الإلكتروني، وأية بيانات يتم رصدها عن العمل الداخلي للشركة. وفي البداية يجب تحديد ما تحتاجه فقط منها وليس تحليلها كلها كما شرحنا.
ولأن حجم البيانات أضخم من أن تستوعبه وتتعامل معه حاسبات أي شركة، فإن تلك البيانات تتم استضافتها على نظم تخزين ملفات موزعة (Distributed File System) في خوادم (Servers) الإنترنت أو كما يطلقون عليها الآن السحابة (Cloud)، مما يضمن تخزينها بتكلفة زهيدة والوصول إليها ومعالجتها بسرعة أكبر بكثير من تخزينها في وحدة واحدة. من أشهر نظم التخزين المتوفرة حاليًا:Apache Hadoop, Distributed file system, Google File System. وإما أن يكون التخزين فيها على شكل الجدولة التقليدية مثل Hadoop أو الخروج عن تلك القاعدة والتخزين بطريقة تناسب البيانات وهو ما يطلق عليه NoSQL architecture المستخدَم مع Amazon’s DynamoDB (التي تستخدم نظام جوجل) وMongoDB، وCassandra (التي يستخدمها فيسبوك) ولكل منها قواعد خصوصية وحماية مختلفة.
ثم تأتي مرحلة التحليل Analytics وتختلف عن عملية التحليل Analysis، لأن الأولى هي تحليل «في السياق» أي يعطي تنبؤات أو توصيات؛ ويركز على المنهجية الكاملة وليس التحليل الرياضي فحسب. وهذا التحليل التنبؤي يشمل العديد من أساليب الإحصاء من النمذجة modeling وتعليم الآلة Machine learning والتنقيب عن البيانات Data mining وأدوات للتعرف على الأنماط أوتوماتيكيًا automated pattern recognition tools لتحديد التوجهات ورسم الاستنتاجات. والمثير أن أدوات التحليل الحديثة أصبحت غير مقتصرة على المحترفين نظرًا لصدور إصدارات أقل تعقيدًا تستخدم رسومًا وأرقامًا توضيحية للنواتج المحتملة. تلك الأدوات متوفر منها ما هو مجانًا ومفتوح المصدر مثل R وGNU Octave وApache Mahout: الذي صدر عنه Hadoop. ومنها ما هو تجاري مثل MATLAB وMathematica وFICO وغيرها. يمكنك التعرف على المزيد من خلال هذا الرابط: http://en.wikipedia.org/wiki/Predictive_analytics
المرحلة الأخيرة هي ترجمة التوقعات إلى لغة صناع القرار باستخدام رسوم توضيحية وتقارير توضح نوع التوصيات المقترحة ومدى التحسن المترتب عليها بالنسبة لبعض أو كل مؤشرات قياس الأداء. بذلك تكون الشركة فعلًا دخلت عالم البيانات العملاقة ويمكنها أن تحصد المنافع.
عواقب مُتوقعة
تكثر التساؤلات حول دقة نتائج التحليلات وعواقب ذلك على الحياة المهنية للبشر.
حسنًا، لا بد أن نعترف أن تحليل البيانات له فوائد رائعة. فالتزايد المستمر للبيانات يتيح فرصًا لم تكن موجودة من قبل للعلم والتجارة وللمجتمع ككل كما أوضحنا بكثير من الأمثلة، لأنها تساعد على رؤية الصورة الكبيرة والفهم العميق وتحسين آليات اتخاذ القرارات وتقليل المخاطر وتفادي الجرائم، والتواصل بكفاءة مع الموظفين والمستهلكين على حد سواء، وغير ذلك.
ولكن من ناحية أخرى فإن تحسن القدرة على جمع وتحليل البيانات بهذا الشكل سيؤدي إلى ميكنة أغلب الوظائف، وهذا لا يشمل الأعمال اليدوية أو غير الحرفية فقط، بل سيمتد للمحترفين أيضًا من الأطباء والصحفيين والمدربين الرياضيين وغيرهم، والأمثلة على ذلك موجودة بالفعل:
- سائقو سيارات الأجرة: سيارة جوجل ذاتية القيادة تستطيع من خلال المستشعرات وتحليل البيانات التي تلتقطها أن تبقى آمنة على الطريق لأميال.
- موظفو المطارات: فجواز سفرك يتم مسحه ضوئيًا والتأكد من كل بياناته ومطابقة صورته مع وجهك وفتح البوابات ذاتيًا دون أدنى تدخل بشري.
- الطيارون: فالطيار الآلي ليس ابتكارًا جديدًا، لكن الطائرات العسكرية بدون طيار ستجعل من الطائرات المقاتلة آثارًا قديمة عما قريب.
- الأطباء: صورة عالية الدقة ثلاثية الأبعاد للمريض وتدريب للروبوتات على عملية جراحية سيجعل تلك الجراحة ممكنة دون تدخل بشري وبلا أخطاء. وحاسبات فائقة السرعة الآن قادرة على عمل تشخيص دقيق للأمراض اعتمادًا على معرفة طبية سابقة.
- التمريض: الآن يمكن شراء حفاضات ذكية تقوم بإرسال رسالة على الهاتف الذكي عند الاحتياج لتغييرها بل وتحليل محتواها وإرسال تحذيرات في حالة اكتشاف عدوى أو مشكلة صحية.
- خدمة العملاء: فالحاسوب واتسون الذي طورته شركة IBM والذي استطاع الفوز على البشر في ألعاب المسابقات يمكنه ترجمة وفهم الأسئلة بلغة البشر الطبيعية والإجابة عليها بتحليل البيانات الهائلة في ذاكرته.
- المدربون الرياضيون: كما أعطينا أمثلة في المقال السابق عن الكرات ذات المستشعرات والدراجات والساعات الذكية وغيرها من الأشياء التي أصبحت تقيس الأداء وتعطي استنتاجات عن كيفية تحسينه.
- الصحفيون: قامت شركة باسم Narrative Science بإطلاق برمجية قادرة على كتابة مقالات صحفية رياضية مباشرة من إحصائيات المباريات، ونفس البرمجية يمكن استخدامها لكتابة رؤية عن أداء شركة ما من خلال معلوماتها المنتشرة على الإنترنت!
آفاق جديدة
لكن، هل يعني ذلك أن البيانات العملاقة تحمل أزمة اقتصادية بدلًا من الرخاء والتطور؟
بالطبع لا. هناك دائما فرص جديدة. فكما شرحنا سابقًا أن هناك فجوة بين التطور المطرد للتكنولوجيا، وفهمنا واستخدامنا لها، مما يشكل فرصة للبشر لتضييق تلك الفجوة، والمؤشرات تتوقع تعيين 4.4 مليون شخص حول العالم بوظائف ذات علاقة مباشرة بتحليل البيانات العملاقة.
بناء على ذلك فهناك الكثير من المهن التي سيسطع نجمها مع انتشار البيانات العملاقة، ومنها:
عالِم بيانات (Data Scientist):
وهي قدرتك على التنبؤ بتوقعات فريدة من خلال تحليل البيانات العملاقة، وهي قدرة تأتي من خلفية أكاديمية ويطلب لتلك الوظيفة الحاصلين على درجة الدكتوراة، ولأنه أصبح مجالًا مهمًا يتقاضى العاملون به مرتبات كبيرة في ظل ندرة الخبرة المطلوبة فقد بدأت الجامعات في تقديم دورات مؤهلة بمقابل مادي كما في جامعتي ستانفورد وجون هوبكنز ومجانًا كما هو على موقع Coursera.
المهندس التقني (Technical Architect):
وهو الشخص المسئول عن إدارة البيانات العملاقة من برمجة واختبار وإعداد النظم وضبط الأداء. وذلك يستدعي معرفة بدقائق تقنية خاصة بنظم تخزين الملفات الموزعة ومهارات التحليل ونمذجة البيانات.
خبير تعليم الآلة (Machine Learning Expert):
وهي المقدرة على تعليم الآلة على مختلف الوظائف كالتجميع والتنقيب عن البيانات وترجمتها. وتحتاج مهارات البرمجة والتحليل.
مهندس هادوب (Hadoop Engineer):
المقدرة على التعامل مع برنامج Hadoop الذي هو العمود الفقري للتعامل مع البيانات العملاقة لأنه برنامج مفتوح المصدر تقوم كل شركة بعمل بعض التعديلات التي تناسبها وإطلاق إصدار جديد وتلك هي مهمة المهندس الذي يتميز بخبرة أكثر تعقيدًا من أقرانه في مجال تكنولوجيا المعلومات، ومعرفة أساسية بتكنولوجيات Hadoop وتكوينها الداخلي.
مسوّق تنفيذي للبيانات (Data Marketing Executive):
وهي مسئولية التواصل مع المستهلكين عبر مواقع التواصل الاجتماعي وحصد الآراء والتوقعات من خلال المحادثات وذلك يتطلب مهارات إدارة مشاريع قوية ومهارات عرض بشكل أساسي إلى جانب مهارات التواصل وتبسيط المعلومات والنظريات التقنية.
وحتى لا نحصر الأمر في وظائف بعينها، فالأمر ببساطة أن هناك فرصًا متاحة أمام كل الوظائف المتعلقة بتلك المهارات:
- مهارات التحليل: ربط البيانات ذات الصلة بالسؤال المطلوب.
- مهارات الرياضيات والإحصاء: التعامل مع الأرقام حتى مع البيانات غير المهيكلة unstructured كالرسائل والصور.
- مهارات علوم الحاسب: البرمجة بمختلف المستويات واللغات.
- المهارات التجارية: فهم أهداف الشركة.
- قدرات التواصل: مهارات العرض وكتابة التقارير ضمن الفريق ومع صناع القرار.
- القدرات الإبداعية: انتهاج طرق جديدة لتطبيق تحليل البيانات.
إن كنت قد أثارك الفضول وقررت العمل على البيانات العملاقة، فهناك مصادر مجانية تستطيع الحصول منها على تلك البيانات لتبدأ، تجدها هنا.
أما عن التكنولوجيات (الأجسام الذكية) المسئولة عن جمع تلك البيانات والتي تحدثنا عنها سابقًا (Internet of Things) وعن الخصوصية والحماية للبيانات، فتلك التفاصيل سوف نتناولها في المقالات القادمة.